Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

T&S-møte 8.1.2015

Saker:

MacVoikko

Fungerer for alle gtd-språka, etter Sjur sine siste bugfiksar. Neste steg:

  1. For oss i miljøet
    1. Lag dokumentasjon (epost til jspwiki)
  2. For resten av verda, litt lenger fram:
    1. Legg til språknamn i staden for språkkode
    2. lag installasjonsprogram
    3. legg ut til nedlasting
    4. vurder om vi kan leggja han ut i Mac App Store (ei pakke pr språk)

Tastaturstatus + neste steg

Nye mobiltastatur

Testing av bokstavfrekvens: Denne kommandoen har alltid fungert, men gjer det ikkje no. Kommentar?

Trond:

LANG=no_NO.UTF-8 echo bø |  sed 's/\(.\)/\1 /g;'
 b ? ?

$ locale
LANG=
LC_COLLATE="C"
LC_CTYPE="UTF-8"
LC_MESSAGES="C"
LC_MONETARY="C"
LC_NUMERIC="C"
LC_TIME="C"
LC_ALL=

Sjur:

$ echo bø | gsed 's/\(.\)/\1 /g;'
b ø

BSD May 10, 2005 BSD

$ locale
LANG="no_NO.UTF-8"
LC_COLLATE="no_NO.UTF-8"
LC_CTYPE="no_NO.UTF-8"
LC_MESSAGES="no_NO.UTF-8"
LC_MONETARY="no_NO.UTF-8"
LC_NUMERIC="no_NO.UTF-8"
LC_TIME="no_NO.UTF-8"
LC_ALL="no_NO.UTF-8"

Ny funksjonalitet på mobiltastatura

Ny funksjonalitet

Skoltesamisk letter prime vs acute accent

Vi ventar på svar frå skoltesamane - kva vil dei eigentleg ha?

Nye plattformar

ENG

Skulle ha sendt svar i går.

  1. Trond har skrive eit utkast
  2. Sjur les og reviderer
  3. Deretter diskuterer vi og sender.

SamEst-møtet i går

Vi heldt møte utan Fran og Trond, Heli har sjekka inn referat.

Ordbøker og analysatorar - felles kjeldekode og infrastruktur

Dei separate ordbøkene

Her er standardisering viktig og velkome.

Lemmasynkronisering av ordbøker og analysator

  1. Som i dag (jf. Kone-språka)
  2. Med fjernintegrering words/dicts – langs/LANG (dvs. separate ordbøker)

Det er ikkje opplagt kva som er den beste løysinga

Tiltak: Ha eit møte om dette. Når? Kor? Kven? Neste veke, medan Jaska og Sjur er i Tromsø.

KMD-prosjektet

Lulesamisk, korpus + ordbok

Deltakarar: Unhammer, Sandra, Sjur, Trond. Tid: i morgon kl 11.

Vårplanar

Dette er ein start for vidare diskusjon:

Divvun:

Infra:

Giellatekno: