[GramOOo] tests de règles grammaticales et construction des règles


Fri 22 April 2005 By nuxeo

Je suis en train de tester quelques règles grammaticales sur les deux
moteurs, Gramadoir et Languagetool, pour voir celui qui serait le mieux
adaptable au français.



Nous l'avons dit, nous aurons besoin de travailler sur deux niveaux, que
nous avons appelés "intrachunk" et "interchunk". Le premier concerne les
règles qui définissent des erreurs au sein d'un chunk, à savoir des accords
de type nom-adjectifs. Le deuxième niveau va permettre de corriger des
fautes d'accords sujet-verbes par exemple.



Nous commencerons par les règles intrachunks.

Un exemple avec Gramadoir:

<D f s>ANYTHING</D> <J f p>ANYTHING</J> <N f
s>ANYTHING</N>:ERREURACCORD




Un déterminant fémin singulier, suivit d'un adjectif féminin pluriel,
suivit d'un nom féminin singulier est une faute, car il n'y a pas
unification du trait nombre.



<D m s>ANYTHING</D> <J f p>ANYTHING</J> <N f
s>ANYTHING</N>:ERREURACCORD

<D f s>ANYTHING</D> <J f s>ANYTHING</J>
<N m s>ANYTHING</N>:ERREURACCORD

<D f p>ANYTHING</D> <J f p>ANYTHING</J>
<N f s>ANYTHING</N>:ERREURACCORD




Notre lexique comporte 6 types de déterminants, 9 d'adjectifs et 9 de noms,
plus de nombreux verbes. Je vous laisse calculer le nombre de combinaisons
possibles pour décrire les erreurs... En effet, les systèmes décrivent des
règles d'erreurs et supposent donc de prévoir toutes les erreurs possibles
(ou du moins le plus possibles).



C'est pour cela que nous avons décidé de générer automatiquement les
règles. Nous commençons par générer toutes les combinaisons possibles et
nous supprimons celles qui sont correctes.



Pour l'instant nous n'avons généré que les cas suivants:

<D ...> <N ...>

<D ...> <J ...> <N ...>

<
D ...> <J ...> <J ...> <N
...>


Nous obtenons alors 4244 règles d'erreurs.



Reste à savoir si les systèmes ne seront pas "perturbés" par de si
nombreuses règles...

(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)


Category: Product & Development