Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Lingvistmøte i Divvun

Saker:

yaml-testing i ny infra

For at testdata skal bli brukt, må fila slutta på *.yaml. I tillegg så må filnamnet ha transducernamnet i seg:

analyser-gt-norm.hfst => adj_gt-norm.yaml

Yaml-testinga visar at det er forskjell på Xerox og Hfst.

./configure --with-hfst

Det krevst nyaste hfst (3.3.14)

./configure --without-xerox

Å Gjera:

svenske ord i samisk: x, c og ord på -tion

Det er mange dobbeltlemma i SMJ-leksikonet: alle “svenske” former skal submerkast, og få eit korrekt lemma. Det “normala” är ju att byta ut såna här bokstäver.

Korhon:

Å gjera:

smj-normeringsmøtet i morgon

Adjektiv

Normeringa av endingane:

Korleis er desse klassane normerte i SMA og SME?

SME

SMA

Bugzilla

1404 - båadtsah, feejjene, læhkoladtje og rudtjege

båadtsah
båadtsah	båadtsah+A+Pl+Nom  <=== Fjern dette lemmaet
båadtsah	båadtsah+A+Attr    <=== Fjern dette lemmaet
båadtsah	båadtsoes+A+Attr
båadtsah	båadtsoes+A+Pl+Nom
båadtsah	båedtsedh+V+TV+Ind+Prs+Uml+Sg2

feejjene
feejjene	feejje+N+Sg+Gen+PxSg1
feejjene	feejjen+A+Sg+Nom  <=== rett opp lemma

læhkoladtje
læhkoladtje	læhkoladtje	+?

rudtjege
rudtjege	rudtje+N+Sg+Nom+Foc/ge
rudtjege	rudtjege+A+Sg+Nom
rudtjege	rudtjege+A+Attr

Å gjera: Lag yaml-testar på desse adjektiva.