Nous avons maintenant une liste de tags et lexique taggé, les ressources
pour démarrer le travail de tagging.

Nous les avons soumises à Kevin
P. Scannell
qui a adapté son programme pour le gaélique (qui contenait
moins de 255 tags alors que nous en avons plus) pour que nous puissions
faire une version française.

J'en profite pour remercier Kevin qui est très présent et nous aide
beaucoup.

Il a donc vu que son programme pouvait prendre en compte le français et a
sorti un premier résultat:



<line> <N f
s>Une</N> <N f s>première</N> <N f
s>version</N> <V ind pres 3 s>fonctionne</V>
<A>parfaitement</A>. </line>




Nous voyons déjà dans cet exemple, qu'il y a deux mots ambigus qui ont
plusieurs étiquettes dans le lexique:

Une a trois tags,  première en a deux :

une    <J f s>

une    <D f s>

une    <N f s>

première <N f s>

première <J f s>

Le tag D correspond à un déterminant, J à un adjectif et N à un nom.

Une autre version du tagging est donc par exemple:



<line> <D f
s>Une</D> <J f s>première</J> <N f
s>version</N> <V ind pres 3 s>fonctionne</V>
<A>parfaitement</A>. </line>




Le programme de Gramadoir pose les tags sur les noms à l'aide du lexique.
Notre travail va maintenant être de créer des règles françaises afin de
désambiguïser pour arriver à la suite correcte par exemple ici :
<D>+<J>+<N>. Les attributs "f" et "s" serviront entre
autres pour les accords lors de l'étape de construction des règles
grammaticales.


(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)