Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

T&S 7.3.2017

Saker til tysdagsmøtet

Orienteringssaker

mt og skriftkultur - Trond orienterte om ei sak T og L har diskutert.

Testbenken

Er det mogleg å ha typos med

rett	rett

eller må det berre vere

feil	rett

Det skal vere slik:

rett
feil<tab>rett

Vekting

Kva er formatet?

… | c-conv -W | … <W:4>

hfst:

ordformlemma+tag+tag4.00000

" "lemma" tag tag <W:4.0000>

Kommando som gjev dette formatet:

ccat -a -l sme $GTFREE/converted/sme \
|  hfst-tokenise --giella-cg tools/preprocess/tokeniser-disamb-gt-desc.pmhfst

Vi ber Kevin setje opp pmatch-oppsettet i courses/lexctwolc/weights

Det fungerer i langs/ men ikkje i courses.

Vi må sjå til at russisk cg fungerer i langs/.

Korpus

Reetta - ny korpusarbeidar for Trond, treng opplæring av Børre. Arbeider V-17. Truleg sme-smn-fin m.m. - samisk i Finland.

mhr: Framgang med svn-tilgang, neste steg er å evaluere status.

Mobiltelefontastatur og app-bygging

App-systemet er komplekst. Sjur vil på råd frå Brendan gå over til fastlane, eit program for å effektivisere app-bygging for mobiltelefonar.

Det vil ta tid å få det til, lenger tid enn 14 dagar, men når det er på plass vil det gje oss:

gt-maskina

Trond og Børre ser på dette.

OmegaT & tokenisering / hfst, lucene, osb

Plan for integrering av fst. Vi held eit møte i morgon tidleg for å sjå nærmare på detaljane, i lag med Børre og Tomi.

personar i bugzilla, jf lusmelding 2018

Sjur har nye metodar, vi ser på det.

Kortkurs i grønlandsk

Trond: ja.

ConNeg i mordvinske språk

Trond og Sjur ser på dette.