Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

T&S-møte

Saker:

korpus

Sjur, Børre

Nasjonalbiblioteket

Trond.

Miika har ein hfst-utstyrt versjon av Tesseract. Dette er det vi treng for samiske språk.

Numra-automatane

Jf. e-post. Mål: lookup date2text skal ha 2.2. som input og andre februar som output.

date.lexc

I dag:

dato:

clock:

numbers:

Spørsmål: tal:tekst eller tekst:tal i lexc?

Det ser ut til at det er to automatar som i dag bruker tal:tekst, nemleg date.lexc og clock.lexc for sme. Alle andre bruker tekst:tal. Dette talar for å endre også dei to siste til tekst:tal.

FRAMLEGG Vi endrar sme date og clock i lexc.

russian spellrelax

Kor mange nivå med spellrelax? Vi treng eitt nivå til.

Vi går gjennom spellrelax-filene og ryddar.

Russisk: Diskusjon Trond, Sjur, Robert, Fran.

ordbøkene treng “nyinfra”

Meir standardisert infrastruktur for ordbøkene.

Vi kjem attende til dette.

ferdig versjon av LREC/ccurl-artikkel

Dette skal bli ein poster, og ein artikkel. Tidsfrist: Vi må sjekke.

tastatur og lokalisering i CLDR - alle samiske språk

Divvun + Giellatekno må sjå på dette i løpet av året.

Divvun administrerer, og koordinerer med Giellagáldu og GT.

Tidsplan: Nordsamisk, deretter resten. Resultat i år.

ENG

Vi må skrive ein tekst. Den samiske ENG-politikken må vere forankra i representative samiske organ.

Sjur og Trond skriv til sametinga, vi ber om svar på om dette er viktig for dei.

Balangen-kontakt

Sjur svarar.

dialekt-fst

Sjur har jobba med det, arbeider vidare med saka.

Err/Sub -> endra til Err/Sub og Err/LexSub, resten til Excl/ og Incl/-taggar

Incl/A betyr Excl/-A

- +Use/MT          -> +Incl/MT

- +Use/-Spell      -> +Excl/Spell
- +Use/Circ        -> +Excl/Nonirc
- +Use/CircN       -> +Excl/Nonirc
- +Use/NG          -> +Excl/Gen
- +Use/SpellNoSugg -> +Excl/Sugg

- +Use/LexSub      -> +Err/LexSub
- +Err/Sub         -> +Err/Sub
- og andre Err-taggar...