The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Saker:
For at testdata skal bli brukt, må fila slutta på *.yaml
. I tillegg så må filnamnet ha transducernamnet i seg:
analyser-gt-norm.hfst => adj_gt-norm.yaml
Yaml-testinga visar at det er forskjell på Xerox og Hfst.
./configure --with-hfst
Det krevst nyaste hfst (3.3.14)
./configure --without-xerox
Å Gjera:
Det er mange dobbeltlemma i SMJ-leksikonet: alle “svenske” former skal submerkast, og få eit korrekt lemma. Det “normala” är ju att byta ut såna här bokstäver.
Korhon:
Å gjera:
Adjektiv
Normeringa av endingane:
Korleis er desse klassane normerte i SMA og SME?
1404 - båadtsah, feejjene, læhkoladtje og rudtjege
båadtsah
båadtsah båadtsah+A+Pl+Nom <=== Fjern dette lemmaet
båadtsah båadtsah+A+Attr <=== Fjern dette lemmaet
båadtsah båadtsoes+A+Attr
båadtsah båadtsoes+A+Pl+Nom
båadtsah båedtsedh+V+TV+Ind+Prs+Uml+Sg2
feejjene
feejjene feejje+N+Sg+Gen+PxSg1
feejjene feejjen+A+Sg+Nom <=== rett opp lemma
læhkoladtje
læhkoladtje læhkoladtje +?
rudtjege
rudtjege rudtje+N+Sg+Nom+Foc/ge
rudtjege rudtjege+A+Sg+Nom
rudtjege rudtjege+A+Attr
Å gjera: Lag yaml-testar på desse adjektiva.