Résumé du travail de Myriam Lechelt


Thu 12 April 2007 By nuxeo

Je vais ici faire un résumé rapide de l'important travail effectué par Myriam
Lechelt sur le projet de correcteur grammatical dont je prends la
suite.

Dans le cadre de son mémoire de DEA, Myriam a
donc initié un travail dont l'objectif est, à terme, de créer un outil de
correction grammaticale libre pouvant être intégré à OpenOffice.org. Plutôt
que de chercher à réaliser entièrement un nouvel outil, elle a réalisé une
analyse de plusieurs correcteurs grammaticaux libres déjà existants, afin de
déterminer lequel serait le plus adaptable au français.

Parmi les correcteurs analysés (GRAC , LanguageTool et An Gramadoir), c'est Gramadoir
qui a été retenu pour être adapté au français. Son adaptation s'est traduite
par la définition d'un jeu d'étiquettes pour l'étiquetage morpho-syntaxique
des mots (
tagging), par l'écriture de règles de désambiguïsation pour la phase du
tagging, puis par la création de quelques règles pour la détection des
fautes.

L'adaptation de Gramadoir au français n'a pas été achevée, et malgré des
résultats plutôt satisfaisants lors des premiers tests, l'outil a montré des
limites pour le traitement du français.

Une approche alternative a finalement été proposée, dans l'éventualité de
la conception d'un nouveau correcteur. Elle consiste à introduire un niveau
intermédiaire entre le mot et la phrase, le chunk (ou syntagme), lors de la
segmentation des phrases et à utiliser le principe de l'unification de
structures de traits au niveau de la vérification grammaticale. Nous
reviendrons ultérieurement sur les notions de chunk et d'unification.



Les travaux de Myriam
ayant montré que le traitement du français par Gramadoir restera limité,
nous n'allons pas continuer à exploiter ce système. Nous avons décidé par
ailleurs de ne pas non plus concevoir un correcteur entièrement nouveau.
Nous allons plutôt réaliser une adaptation de la dernière version de
LanguageTool. En effet, il y a eu beaucoup d'évolutions entre l'ancienne
version rejetée à l'époque, et la nouvelle, qui semble mieux adaptable au
français. Nous allons la compléter en suivant les pistes données par Myriam pour
la conception d'un nouveau correcteur.

(Post originally written by Agnes Souque on the old Nuxeo blogs.)


Category: Product & Development