Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

gt-møte 25.2. 2015

Til stades: Ciprian, Lene, Marja-Liisa, Trond

Saksliste

NRK

Kommer folk fra NRK Sápmi kl 10. De har snakka med Sjur. De ønsker et bredt bilde av hva vi holder på med, men formatet er uklart.

Korpus

Innsamlingsarbeid

Enkeltfiler

Lagring av filer på divvun-serveren

  1. månedsvise referanseversjonar som grepkorpus i analyzed
  2. tre dagar
    1. Sjekkerutine: bit-mengde skal vere omtrent like stor, aldri slett filer viss nye filer er drastisk mindre enn eldre
  3. Det skal aldri vere slik at repositorium er tomt

Ciprian gjer dette.

Strukturering av arbeidet

Ordbøker

Lene har lagt geo inn i NDS smenob. Dette er et foreløpig arbeid fordi det er bare gjort for sme og definerer alle språk sme2x som sme2nob.

Ciprian snur fila til nobsme. Dette gjelder bare denne fila: smenob/src/N_Propgeo_smenob.xml. Den inneholder bare navn som ikke er med i N_Prop_smenob.xml. smenob/src/N_Propgeo_smenob.xml snues til nobsme/src/N_Propgeo_nobsme.xml.