The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Tilstede: Trond, Lene, Chiara
Alle tre er med på workshop og konferanse. Vi er sånn omtrent i rute. Tog og buss ordner vi seinere, også fly hjem fra Værnes.
I Levanger, Trond og Lene er med der.
Chiara drar.
Tema:
Lene har kontakt med to forfattarar.
Lene har lagt inn dynamiske tallord i bidixene for dei ulike samiske språka, men genereringa må kontrolleres
Metode: Ta talord frå talordsgeneratoren
cd $GTHOME/smn
yes | head -100|cat -n|cut -f1|tr -d ' '|lookup src/transcriptions/transcriptor-numbers-digit2text.filtered.lookup.xfst | cut -f2| usmn
Snakke med Sjur om når vi kan få lukket katalog og pipeline, vi trenger en dato. Evt. kan han og Chiara se på dette på fredag 6.9.
No har vi sendt ein god del materiale dit (Giellatekno og Divvun), så får vi sjå kva dei svarer.
Førebels plan: Lene om samiskundervisning inkl. relevante språkteknologiske verkty, Trond om språkteknologi frå samisk og generalisert til andre språk (30 + 30 min?).
Lene tar kontakt med arrangør og spør meir om programmet.
bruk mappa 2019/IndEduAustr.
Numeraler og preprosessering er ikkje parallell for nob og sme.
Lene skal forbedre behandlinga av romertall og datoer. Trond skal finne dømet vi snakka om på møtet (23.-24. b. / 23-24. b. osb.)
NB har eit kurs 10.9. i Oslo, som vi ikkje drar på. Vi satsar på streaming eller å snakke med dei 12.-13. her i Tromsø.
Lene skal holde minikurs for folk på kunsthistorie og NNKM i midten av september. Slike kurs er noe som på sikt burde kunne holdes av språkkonsulent ved Samisk senter.
Lene skal skrive et notat til Torjeir om dette.
Vi spør Uli om tidspunkt når vi alle er her.
Vi lager HIF-kurs: introduksjon til språkteknologi. Planen er at det skal gå våren 2020 og 2021, sannsynligvis samlingsbasert. Lærer: Trond (evt. andre i tillegg).
Lene og Trond lagar eit MT-abstract i lag og kvart sitt om LIA materiale med spontanlån og skriftspråkshistorie.