[GramOOo] [tagging] difficulté de désambiguïser ce qui n'est pas parfait


Tue 22 March 2005 By nuxeo

Nous devons garder à l'esprit que les règles vont servir à désambiguïser non
seulement des phrases correctes, mais aussi et surtout des phrases
fausses.

Comme la désambiguïsation se fait sur le contexte droit ou gauche, il faut
tenir compte du fait qu'il puisse contenir des erreurs.

Imaginons que l'utilisateur écrive:

    Des chats noir



Et que l'on ait la règle suivante:



<N m s>ANYTHING</N>
<B><Z>ANYJMS</Z>ANYTHING</B>:<J m s>




Cette règle ne va désambiguïser seulement les adjectifs maculins singuliers
qui sont précédés de noms masculins singuliers. Elle ne désambiguïse que ce
qui est correct grammaticalement et ne désambiguisera donc pas l'exemple
ci-dessus car chats est pluriel et noir singulier. Par
conséquent, on ne pourra pas corriger cette faute.

Ici la solution est de généraliser le nom qui précède:



<N>ANYTHING</N>
<B><Z>ANYJMS</Z>ANYTHING</B>:<J m s>


(un adjectif masculin singulier ambigu précédé de n'importe quel nom est un
adjectif masculin singulier).



Un autre exemple et celui de ne ... pas.

J'ai créé une règle qui dit que si le mot pas est précédé de
ne, alors il n'est pas un nom mais un adverbe:



[Nn]e ANYTHING <B>pas</B>:<A>



Or, il nous arrive souvent d'oublier le ne pour la négation. Dans ce
cas, ma règle ne pourra pas désambiguïser pas, et on ne pourra donc
pas  corriger cette faute.



Les règles de désambiguïsation (qu'elles soient manuelles ou basées sur une
méthode statistique) sont des règles contextuelles (se basent sur le
contexte) et présupposent donc une cohérence morphosyntaxique. Or, le but
d'un correcteur grammatical est justement de repérer des fautes de cohérence
morphosyntaxique.

Il faut donc tenir compte de cela lors de la création des règles de
desambiguïsation.


(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)


Category: Product & Development