[GramOOo] Choix pour l'étape de tagging


Tue 08 March 2005 By nuxeo

Nous avons maintenant pris une décision en ce qui concerne le
choix d'un modèle pour l'étape du tagging (étiquetage). Le
tagging et les règles grammaticales qui détectent les fautes
sont deux étapes différentes et qui peuvent être
indépendantes. Nous avons donc établi deux étapes à notre
projet.

En effet, un tagger peut être une base pour un autre outil,
et pas seulement la détection de fautes (par exemple le résumé
automatique ou la création d'exercices pédagogiques). C'est le
traitement lingiustique qui est la base à toute analyse de
texte.

Il est important de s'attarder sur cette phase de tagging car
si elle contient trop d'erreurs, elle ne permettra pas de
détecter les fautes grammaticales. A titre d'illustration, 10%
de tagging, sur une moyenne de 10 mots par phrase représentent
une erreur par phrase et donc réduirait considérablement la
détection de fautes.



Donc la phase de conception d'un correcteur grammatical passe
inévitablement par la conception d'un taggeur, et à l'heure
actuelle, nous avons décidé d'uliliser le modèle de Gramadoir de Kevin
P. Scannell. C'est un modèle à base d'un lexique et de règles
de désambiguïsation.

Nous avons choisi Gramadoir plutôt qu'un modèle statistique
car ce dernier nécessite un corpus taggé, que nous n'avons pas
à disposition car il n'en existe pas en libres droits. De
plus, comme le tagging statistique effectue un apprentissage
sur corpus, l'étiquetage est dépendant de ce corpus, et donc
s'il y a des erreurs, il n'y a aucun recours, tandis qu'avec
des règles, on peut retrouver d'où vient l'erreur
d'étiquetage.

Voilà les raisons qui nous ont conduis à choisir Gramadoir
pour le tagging.

(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)


Category: Product & Development