Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Meeting setup

Agenda

Opening, agenda review, participants

Project review

Det blir altså ein litt annan struktur enn tidlegare - meir prosjektorientert. Vi prøver det ut, og ser korleis det funkar.

Prosjekta er (rapportør i parentes):

*Divvun 2.1: - installerarane (Børre) - buggar (Tomi)

Andre prosjekt, ikkje med på møtet:

Dis-abstract til Riga (Lene)

Ferdig, vart sendt inn på fredag. Vi laga få cg-reglar, men dei får likevel til mykje. Berre 106 reglar, men bra lemmatisering, sjølv med nesten 9 % missing.

Sma-korpus dårleg:

smekorpus (Børre)

Eng. bibel kræsjar konverteringa fordi dei er så store (kræsjar XML::Twig). Fann nokre andre filer som skapar problem, laga testar og fiksa konverteringa for desse.

smakorpus (Børre)

Språkgjenkjenning: truleg er språkmodellen for sma for dårleg, vart laga lenge før vi byrja arbeidet med sma.

TODO:

Forvaltningsordbok (Berit Merete)

TODO:

nu-oahpa (Biret Ánne)

Infrastruktur (Sjur)

Kurs i Ungarn, begynt å teste hfst hfst3 snart klar til å bli “released”, med støtte for xfst og twolc

sma-oahpa (Lene)

Denne veka skal adjektiva på plass. Dette krev at alle sma-oahpa-adjektiva ligg i fst-en og har fungerande paradigme, f.eks. ikke overgenering av Comp/Superl. Trond har generert tabellar over adjektiva og leksikona deira, og dei formene som blir generert. Ta ein titt!

“rev” er med endringer i fst, fst-endringene er foreløpig ikke sjekka inn:

Kan de sjå på det, og kommentere, evt. samanlikne med status quo:

Divvun 2.1:

installerarane (Børre)

Kort møte på fredag, 3 av 4 tilbakemeldingar var positive, den fjerde skal vi sjekka.

Lene har testa på Mac med gamal Office (Office 2008). Alt ok.

buggar (Tomi)

Dei fleste buggane fjerna i fredagsversjonen. Ny versjon til i morgon med dei siste halvstore feila retta.

VD-ÅD-lansering Mac/Win/iPxd (Ciprian)

Sma er generert på nytt, og vil bli generert ein gong til. Meir testing.

Cip ønsker forklaringer til grammatikkord => neste versjon

Merknader frå Lene:

måedtie	måedtie+Pron+Indef+Pl+Nom  <===== bort?? moadda
moadda	moadda+Num+Sg+Nom
moadda	moadda+Num+Sg+Acc

Pl kan gott tas bort
moadda tt (ackusativ = nominativ) många,
åtskilliga; flera, några, ett par; moatte bále många gånger; moadda jage åtskilliga år, i åratal; måttijt jagijt under åtskilliga, många år; moattet guovlos från flera hål  greitt - jeg fikser det :-)
måedtie	måedtie+Pron+Indef+Sg+Nom

Lanseringskoordingering

Lanseringa blir onsdag ca kl. 12.