[GramOOo] [tagging] petit test


Wed 30 March 2005 By nuxeo

J'ai testé notre tagger avec le petit texte suivant :



Voici une blague de Toto qui fait du surf. Seulement, sur la piste, la
neige est mauvaise, elle a fondu. Et Toto qui ne sait pas surfer se casse la
figure. Alors il hurle:

"Dorénavant je ne ferai plus de surf le week-end de Pâques !"

Les personnes qui ont skié ce week-end comprendront. Je sais, ce texte ne
fait pas trop rigoler. Je voulais voir la façon dont il était désambiguïsé.
Il est désambiguïsé !




Voici la sortie du tagger sans qu'aucune règle ne soit appliquée:

Les mots ambigus sont entre balises <B></B>



<?xml version="1.0" encoding="utf-8" standalone="no"?>

<!DOCTYPE teacs SYSTEM "/dtds/gramadoir.dtd">

<teacs>

<line> <B><Z><A/><P/></Z>
Voici
</B> <B><Z><D f
s/><J f s/><N f s/></Z>une</B> <B><Z><N f
s/><V imp pres 2 s/><V ind pres 1 s/><V ind pres 3
s/><V sub pres 1 s/><V sub pres 3
s/></Z>blague</B>
<P>de</P> <N m s>Toto</N> <R rel e
sp>qui</R> <B><Z><J m
s/><N m s/><V ind pres 3 s/><V ppa m
s/></Z>fait</B> <D m
s>du</D> <N m s>surf</N>.
</line>

<line> <A>Seulement</A>, <B><Z><J m
s/><P/></Z>sur</B> <B><Z><D f
s/><N m sp/><R pers obj 3 f s/></Z>la</B> <N f
s>piste</N>, <B><Z><D f
s/><N m sp/><R pers obj 3 f s/></Z>la</B> <B><Z><N f
s/><V ind pres 3 s/><V sub pres 3
s/></Z>neige</B> <B><Z><J e
p/><J e s/><N m s/><V etre ind pres 3
s/></Z>est</B> <B><Z><J f
s/><N f s/></Z>mauvaise</B>, <R pers suj 3 f
s>elle</R> <B><Z><N m
sp/><V avoir ind pres 3 s/></Z>a</B> <B><Z><J m
s/><N m s/><V ppa m s/></Z>fondu</B>. </line>

<line> <C coor>Et</C> <N m
s>Toto</N> <R rel e sp>qui</R>
<A>ne</A> <V ind pres 3 s>sait</V>
<B><Z><A/><N m
sp/></Z>pas</B> <V
inf>surfer</V> <R pers obj 3 sp>se</R>
<B><Z><N f
s/><N m s/><V imp pres 2 s/><V ind pres 1 s/><V ind
pres 3 s/><V sub pres 1 s/><V sub pres 3
s/></Z>casse</B> <B><Z><D f
s/><N m sp/><R pers obj 3 f s/></Z>la</B> <B><Z><N f
s/><V imp pres 2 s/><V ind pres 1 s/><V ind pres 3
s/><V sub pres 1 s/><V sub pres 3
s/></Z>figure</B>. </line>

<line> <A>Alors</A> <R pers suj 3 m
s>il</R> <B><Z><V imp pres 2
s/><V ind pres 1 s/><V ind pres 3 s/><V sub pres 1
s/><V sub pres 3 s/></Z>hurle</B>:
&quot;<A>Dorénavant</A> <R pers suj 1
s>je</R> <A>ne</A> <V ind futu 1
s>ferai</V> <B><Z><A/><D e
p/><D e s/><N m sp/><V ind psim 1 s/><V ind psim 2
s/><V ppa m p/></Z>plus</B>
<P>de</P> <N m s>surf</N> <B><Z><D m
s/><R pers obj 3 m s/></Z>le</B> <N m
s>week-end</N> <P>de</P> <N f
p>Pâques</N> !&quot; </line>

<line> <R pers suj 1 s>Je</R> <B><Z><V ind pres 1
s/><V ind pres 2 s/></Z>sais</B>, <B><Z><D m
s/><R dem e s/></Z>ce</B> <N m
s>texte</N> <A>ne</A> <B><Z><J m
s/><N m s/><V ind pres 3 s/><V ppa m
s/></Z>fait</B> <B><Z><A/><N m
sp/></Z>pas</B>
<A>trop</A> <V inf>rigoler</V>.
</line>

<line> <B><Z><D e
p/><R pers obj 3 p/></Z>Les</B> <N f
p>personnes</N> <R rel e sp>qui</R> <V
avoir ind pres 3 p>ont</V> <V ppa m
s>skié</V> <B><Z><D m
s/><R dem e s/></Z>ce</B> <N m
s>week-end</N> <V ind futu 3
p>comprendront</V>. </line>

<line> <R pers suj 1 s>Je</R> <B><Z><V ind impa 1
s/><V ind impa 2 s/></Z>voulais</B> <V
inf>voir</V> <B><Z><D f
s/><N m sp/><R pers obj 3 f s/></Z>la</B> <N f
s>façon</N> <R rel e sp>dont</R> <R
pers suj 3 m s>il</R> <V etre ind impa 3
s>était</V> <B><Z><J m
s/><V ppa m s/></Z>désambiguïsé</B>. </line>

</teacs>



Et voici la sortie après application des règles :



<?xml version="1.0" encoding="utf-8" standalone="no"?>

<!DOCTYPE teacs SYSTEM "/dtds/gramadoir.dtd">

<teacs>

<line> <P>Voici</P> <D f s>une</D> <N f
s>blague</N> <P>de</P> <N m s>Toto</N>
<R rel e sp>qui</R> <V ind pres 3 s>fait</V> <D m
s>du</D> <N m s>surf</N>. </line>

<line> <A>Seulement</A>, <P>sur</P> <D f
s>la</D> <N f s>piste</N>, <D f s>la</D>
<N f s>neige</N> <V etre ind pres 3 s>est</V> <J
f s>mauvaise</J>, <R pers suj 3 f s>elle</R> <V
avoir ind pres 3 s>a</V> <V ppa m s>fondu</V>.
</line>

<line> <C coor>Et</C> <N m s>Toto</N> <R
rel e sp>qui</R> <A>ne</A> <V ind pres 3
s>sait</V> <A>pas</A> <V inf>surfer</V>
<R pers obj 3 sp>se</R> <V ind pres 1 s>casse</V>
<D f s>la</D> <N f s>figure</N>. </line>

<line> <A>Alors</A> <R pers suj 3 m s>il</R>
<V ind pres 1 s>hurle</V>:
&quot;<A>Dorénavant</A> <R pers suj 1 s>je</R>
<A>ne</A> <V ind futu 1 s>ferai</V>
<A>plus</A> <P>de</P> <N m s>surf</N>
<D m s>le</D> <N m s>week-end</N>
<P>de</P> <N f p>Pâques</N> !&quot;
</line>

<line> <D e s>Les</D> <N f p>personnes</N>
<R rel e sp>qui</R> <V avoir ind pres 3 p>ont</V>
<V ppa m s>skié</V> <D m s>ce</D> <N m
s>week-end</N> <V ind futu 3 p>comprendront</V>.
</line>

<line> <R pers suj 1 s>Je</R> <V ind pres 1
s>sais</V>, <D m s>ce</D> <N m s>texte</N>
<A>ne</A> <V ind pres 3 s>fait</V>
<A>pas</A> <A>trop</A> <V
inf>rigoler</V>. </line>

<line> <R pers suj 1 s>Je</R> <V ind impa 1
s>voulais</V> <V inf>voir</V> <D f s>la</D>
<N f s>façon</N> <R rel e sp>dont</R> <R pers suj
3 m s>il</R> <V etre ind impa 3 s>était</V> <V ppa m
s>désambiguïsé</V>. </line>

<line> <R pers suj 3 m s>Il</R> <V etre ind pres 3
s>est</V> <V ppa m s>désambiguïsé</V> !
</line>

</teacs>

(Post originally written by Myriam Lechelt on the old Nuxeo blogs.)


Category: Product & Development