[GramOOo] Eléments linguistiques nécessaires


Tue 08 March 2005 By nuxeo

Nous n'avons pas encore décidé quel correcteur sera le mieux
adaptable au français, mais une certitude selon moi est que
pour faire un bon outil, il nous faut une analyse syntaxique
complète : découpage en formes, tagging (c'est-à-dire
étiquetage morphosyntaxique), chunking (découpage en syntagmes
verbaux, nominaux etc.).
Des outils de tagging existent. Certains sont probalilistes,
d'autres basés sur des règles (par exemple WinBrill) et
d'autres, comme celui de languagetool combinent règles et
probabilités.

Winbrill, créé par Eric
Brill est un bon étiquetteur dont on pourra
s'insirer.
Nous aurons également besoin d'un corpus étiqueté du français
pour la phase d'apprentissage du tagger. De la finesse des
tags dépendra la qualité du traitement et donc du
correcteur.

(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)


Category: Product & Development