Quelques mots sur les principaux fichiers de Gramadoir.

  • lexicon-fr.txt : contient toutes les formes fléchies du lexique avec le
    nombre qui correspond à leur tag.
  • pos-fr.txt : liste tous les tags et le nombre qui leur correspond
  • aonchiall-fr.in : répertorie les règles de désambiguïsation du
    tagging
  • macra-fr.meta.pl : macro qui permet de définir des mots qui globalisent
    certains mots pour les règles, à l'aide d'expressions régulières (ex si l'on
    veut dire "n'importe quoi" ou "tous les adjectifs").
  • unigram-fr-txt : liste les tags par fréquences.

Pour plus de détails : http://borel.slu.edu/gramadoir/manual/c409.html

(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)