Language Technology at UiT The Arctic University of Norway

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

T&S-møte 7.11.2017

dict-make

De endringene som Trond sjekket inn på møtet hvor vi diskuterte dict-FSTer, har ikke løst problemet med at analyser-dict-gt-norm ikke blir laget. Er det sikkert at den ikke må ’slås på’ i giella-core?

Gangen er dette:

  1. Ingen lokale endringar i am-shared-fila,
    1. Endringane der skal først vere i src/Makefile.am
  2. Test at det fungerer for sme
  3. flytt endringane til am-shared lokalt (for sme) og sjekk på nytt at det fungerer i giella-templates og rull ut for alle

TODO

Korpusinnsamling

Vi tar eit oppfølgjingsmøte av førre store korpusmøte i løpet av november.

Termwiki

Måten å ta språkpar frå termwiki er å ta dei frå termwiki (dei blir generert kvar natt og sjekka inn i svn: main/words/terms/termwiki/)

Børre har eit script (i gt/scripts) for å ekstrahere termpar:

termwiki-expressions.py nb se
termwiki-expressions.py fi smn
etc.

jf.
termwiki-expressions.py -h

Ordbøker og satni-org

Sátni-org er ein visings- og søkjeservar for termwiki, NDS, andre ordbøker, som blir oppdatert kvar kveld.

På ordbokslista står berre ordbøker mellom norsk/svensk og nord- og sørsamisk.

TODO

NAV-prosjektet

Det viktige er at Giellagáldu er involvert. Skal det så vere Giellatekno eller Divvun som er involvert frå UiT-sida? I den grad arbeidet inneber handsaming av termlister er det naturleg at det er Divvun som gjer det.

TODO: Vi diskuterer med Giellagáldu om dette denne veka.

NRK- og Ávvir-stavekontrollar

Ev. òg Sámi allaskuvla-stavekontroll??

Møte på Marienlyst i desember. Det hellar mot ei listebasert løysing.

Standardisera REST-grensesnitta

Alle generert output frå sidene vår (tekstanalys, ordform, …)

Dette bør bli standardisert.

TODO: Vi tar møte om dette, involverer relevante programmerarar.

Presentasjonane i morgon

Må sendast til tolkane i dag (i det minste ein førebels versjon)

Tastaturmøtet i morgon