Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Giellateknomøte 30.9.2019

Tilstede: Trond, Lene, Chiara

Saksliste

Nodalida

Alle tre er med på workshop og konferanse. Vi er sånn omtrent i rute. Tog og buss ordner vi seinere, også fly hjem fra Værnes.

Sørsamiske fagdager 2.-4.10

I Levanger, Trond og Lene er med der.

Korp/korpus

Göteborg

Chiara drar.

Tema:

MT

smesmx

Lene har kontakt med to forfattarar.

Dynamiske talord

Lene har lagt inn dynamiske tallord i bidixene for dei ulike samiske språka, men genereringa må kontrolleres

Metode: Ta talord frå talordsgeneratoren

cd $GTHOME/smn
yes | head -100|cat -n|cut -f1|tr -d ' '|lookup src/transcriptions/transcriptor-numbers-digit2text.filtered.lookup.xfst | cut -f2| usmn

cg-mt

Snakke med Sjur om når vi kan få lukket katalog og pipeline, vi trenger en dato. Evt. kan han og Chiara se på dette på fredag 6.9.

UB: Exhibition on Arctic Indigenous languages

No har vi sendt ein god del materiale dit (Giellatekno og Divvun), så får vi sjå kva dei svarer.

Gjester fra Melbourne og Auckland

Førebels plan: Lene om samiskundervisning inkl. relevante språkteknologiske verkty, Trond om språkteknologi frå samisk og generalisert til andre språk (30 + 30 min?).

Lene tar kontakt med arrangør og spør meir om programmet.

bruk mappa 2019/IndEduAustr.

nob/sme-preprosessering

Numeraler og preprosessering er ikkje parallell for nob og sme.

Lene skal forbedre behandlinga av romertall og datoer. Trond skal finne dømet vi snakka om på møtet (23.-24. b. / 23-24. b. osb.)

Nasjonalbiblioteket

NB har eit kurs 10.9. i Oslo, som vi ikkje drar på. Vi satsar på streaming eller å snakke med dei 12.-13. her i Tromsø.

Samisk med datamaskinen

Lene skal holde minikurs for folk på kunsthistorie og NNKM i midten av september. Slike kurs er noe som på sikt burde kunne holdes av språkkonsulent ved Samisk senter.

Lene skal skrive et notat til Torjeir om dette.

Uli-føredrag

Vi spør Uli om tidspunkt når vi alle er her.

HIF-kurs

Vi lager HIF-kurs: introduksjon til språkteknologi. Planen er at det skal gå våren 2020 og 2021, sannsynligvis samlingsbasert. Lærer: Trond (evt. andre i tillegg).

SAALS4

Lene og Trond lagar eit MT-abstract i lag og kvart sitt om LIA materiale med spontanlån og skriftspråkshistorie.