Nous avons sorti quelques chiffres afin de mesurer l'avancement de notre
tagger.

Sans qu'aucune règle ne soit appliquée (ni aucune fréquence car elles
n'entreront en jeu que s'il y a échec des règles), Gramadoir donne 60% de
mots non ambigus, soit 6 mots sur 10.

Avec des règles désambiguïsant uniquement les detérminants "le" et "la", on
gagne 2%. On passe à 65% de non ambigüs avec quelques règles sur les
déterminants, les noms et les adjectifs.

Notons que ces dernières ne sont pas encore optimales et vont être
améliorées. Le gain qu'elles apportent devrait être bien plus conséquent. En
effet, les SN (= syntagmes nominaux, c'est-à-dire notament déterminant, nom,
adjectif) sont nombreux dans la langue et les noms sont très souvent
ambigüs.



Nous allons également utiliser les taux de précision et de décision définis
par la campagne d'évaluation de GRACE (http://www.up.univ-mrs.fr/veronis/Atala/TALN/pdf/A76.pdf)
et qui servent à évaluer des taggers et différents outils linguistiques. La
précision mesure la capacité à donner un tag, la décision, la capacité à
donner le bon.

Grâce à ces taux nous pourrons voir l'avancement de notre travail de
manière précise.


(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)