[gramOOo] [tagging] premières règles


Wed 16 March 2005 By nuxeo

Les choses avancent!

Voici un exemple de sortie avant qu'aucune règle de désambiguïsation ne
soit appliquée.



<B><Z><D m s/><N m s/><R pers obj 3 m
s/></Z>le</B> <B><Z><A/><J m s/><N
m s/></Z>petit</B> <N m s>test</N>




Les tags <B> et <Z> servent à marquer les mots ambigus.

"Le" était donc étiqueté comme un déterminant, un nom et un pronom
personnel objet .

"petit" était un adverbe (erreur dans le lexique probablement), un adjectif
et un nom.



J'ai appliqué trois premières règles très simples selon la structure de
Gramadoir:



<B>[Pp]etit</B> <N>ANYTHING</N>:<J m
s>

<B>[Ll]e</B> <N>ANYTHING</N>:<D m s>

<B>[Ll]e</B> <J>ANYTHING</J>:<D m s>



La première signifie que si le mot ambigu "petit" (avec ou sans majuscule)
est suivit par n'importe quel mot qui est un nom, alors il est un adjectif
masculin singulier.

La deuxième et la troisième signifient : si le mot ambigu "le" est suivit
par un nom ou un adjectif alors il est un déterminant masculin
singulier.



Après application de ces règles la sortie est donc:



<D m s>le</D> <J m s>petit</J> <N m
s>test</N>




Ces pemières règles appliquées, nous pourrons maintenant en construire de
plus générales grâce à des expressions régulières.

(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)


Category: Product & Development