Gramadóir ( http://borel.slu.edu/gramadoir/
) est un correcteur grammatical développé pour le gaélique, en Perl par Kevin P. Scannell. D'autres
versions sont disponibles ou en cours d'élaboration pour d'autres langues
"minoritaires" telles que le wallon, le gallois, le breton,  le
norvégien, le tagalog, etc.

L'entrée de Gramadóir est une liste de mots étiquetés, avec une ligne par
forme, même pour les mots ambigüs. Par exemple:

couvent: N masc sing

couvent: V 3ème pers plur ind présent


A partir de cette liste, après avoir découpé
le texte à traiter en phrases et en mots, il tagge les mots. Puis il les
désambiguïse à l'aide de règles. Puis, grâce à des règles grammaticales
construites à partir de tags et d'expressions régulières, il détecte les
erreurs grammaticales. Il retourne la phrase à l'utilisateur, avec la
séquence fausse en rouge en suggérant par exemple:

forme non conforme, utilisez plutôt /scata/.


Le programme principal est gram-xx.pl (xx
étant le code ISO 639-1 pour le pays).


Les trois fichiers de bases de règles
sont:




  • Comhshuite-xx.in : Chunking




  • Aonchiall-xx.in : Désambiguïsation des POS
    tags à partir de règles.




  • Rialacha-xx.in : Règles d'erreurs de
    grammaire, et exceptions.




Toutes les fonctions Perl utilisées sont
décrites dans le programme Gramadoir.pm.




(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)