Maxime Biais dévelloppe actuellement Grac, un correcteur grammatical
indépendant d'une langue particulière et programmé en Python.


Grac nécessite une phase d'apprentissage,
afin de créer une base de connaissances probabiliste et une base de règles
de grammaire. Il faut donc un corpus étiqueté et un corpus ne contenant
aucune erreur grammaticale.


On découpe le texte en phrases et en mots. On
traite le texte avec un tagger afin d'étiqueter les mots non ambigus. Puis
on utilise un système de probabilités basé sur des enchaînements de trois
tags possibles pour étiqueter les mots ambigus. Les enchaînements possibles
sont contenus dans une base.


Ensuite, on passe par deux phases de
détection d'erreurs grammaticales (GDE). La première est la phase
d'apprentissage qui se base sur un corpus étiqueté, sans erreur de grammaire
pour créér des règles qui sont une liste de TAG probables. La deuxième phase
se base sur ces règles pour déterminer les erreurs. Quand on applique ces
règles au texte à traiter, si aucune ne correspond, c'est qu'il y a une
faute.


Grac ne possède pas encore de documentation
très détaillée car il est encore en cours de dévelloppement.

Les parties GED ne sont à l'heure actuelle
pas encore développées.


(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)