The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
T&S-møte 7.11.2017
De endringene som Trond sjekket inn på møtet hvor vi diskuterte dict-FSTer, har ikke løst problemet med at analyser-dict-gt-norm ikke blir laget. Er det sikkert at den ikke må ’slås på’ i giella-core?
Gangen er dette:
TODO
Vi tar eit oppfølgjingsmøte av førre store korpusmøte i løpet av november.
Måten å ta språkpar frå termwiki er å ta dei frå termwiki (dei blir generert kvar natt og sjekka inn i svn: main/words/terms/termwiki/)
Børre har eit script (i gt/scripts) for å ekstrahere termpar:
termwiki-expressions.py nb se
termwiki-expressions.py fi smn
etc.
jf.
termwiki-expressions.py -h
Sátni-org er ein visings- og søkjeservar for termwiki, NDS, andre ordbøker, som blir oppdatert kvar kveld.
På ordbokslista står berre ordbøker mellom norsk/svensk og nord- og sørsamisk.
TODO
Det viktige er at Giellagáldu er involvert. Skal det så vere Giellatekno eller Divvun som er involvert frå UiT-sida? I den grad arbeidet inneber handsaming av termlister er det naturleg at det er Divvun som gjer det.
TODO: Vi diskuterer med Giellagáldu om dette denne veka.
Ev. òg Sámi allaskuvla-stavekontroll??
Møte på Marienlyst i desember. Det hellar mot ei listebasert løysing.
Alle generert output frå sidene vår (tekstanalys, ordform, …)
Dette bør bli standardisert.
TODO: Vi tar møte om dette, involverer relevante programmerarar.
Må sendast til tolkane i dag (i det minste ein førebels versjon)