The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Til stades: Børre, Ciprian, Lene, Sjur
Overgripande tema: kva er det som hindrar arbeidet?
Vi har fleire innsamlarar, men berre nrk sin fungerer.
Viktige steder:
Legge dokumenter i en pøl:
En strategi: Laste ned alt fra nettsteder man mistenker har samisk tekst. Legge inn samiske tekster inn i korpus og manuelt legge til paralleller på andre språk. Finner man systematisk sammenheng mellom paralleller, legg slikt inn automatisk.
Opprette ei liste (hvor?) hvor alle i Giellatekno/Divvun skriver info når de kommer over (ny) samisk tekst på internett:
Børre
Dvs. innsamling som krev avtale med underskrift.
Vi treng ein person som gjer dette på full tid over ein periode. Børre pratar med aktuelle kandidatar.