Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Sjur og Trond, 134.10.14

Saksliste

sme-flytting

Yaml-testing

Ciprian har gamle paradigme frå VD, dei kan vi bruke som (utgangspunkt for) yaml-testar.

Vi vil ha testar etter:

Dokumentasjon for yaml-testane finst på: [/infra/infraremake/AddingMorphologicalTestData.html]

TILTAK: Ciprian tar eit utval frå VD-paradigmet og sett inn i ` main/langs/sme/test/src/gt-desc-yamls/ (der det ligg ei modellfil), evt. main/langs/sme/test/src/gt-norm-yamls/`. Dette skjer etter Göteborg.

Korpustesting

Analyser eit rimeleg stort korpus med analysatorane frå både ny og gamal infra, sjekk at resultata er like eller kompatible.

Oahpa-testing

Heli har genrerert og laga diffar, Lene har kommentert, vi fann ei lus i ny infra som no er retta. Vi treng ein ny diff -> Heli.

TILTAK:

Møterommet

Vi har fått e-post frå Kyrre Soleng. Møte om ca 2 veker (i november).

Sør-Afrika

Trond har skrive e-post, vi ventar på svar.

TTS

Vi har ein betaversjon! Våre testarar bør få litt meir eksplisitt dokumentasjon.

Fleire betatestarar:

Børre lagar nettskjema med lydfilene, og deretter ber vi folk på FB om å testa.

Direkte nedlasting av fst-ar

Folk vil analysera sjølve, men vil ikkje ha heile pakka, og vil ikkje byggja frå kjeldekoden.

Språk? I prinsippet alle, men sme.

Kompiler på xserve, legg ut på static_files

Vi kan ha eit shellscript

Dei treng tre typar filer:

Mål: vi lagar ei pakke som kan distribuerast og som inneheld alt bortsett frå eksterne verkty.

Timeplan? Vi må koma attende til saka.

Teksting-korpus

Vi får tilgang til eit korpus av samisk teksta TV-sendingar, frå univ i Joensuu. Men kravet er at det er lukka, og til forskingsformål.

Lukka ok, vi har ein lisens for det. Men vi kjem til å nytta deriverte data til produktutvikling til beste for det samiske samfunnet. Det må vera ok. Alle produkt er gratis og open kjeldekode.

TILTAK: Trond følgjer opp.

Mobiltastatur

For seg sjølv eller i langs? Trond: for seg sjølv.

ENG

Møte: kl 8. torsdag

Neste CLARINO-møte

Når? 1-2.12.2014 (UB er arrangør). Skal vi prata om Akan? Utveksla data?

Tiltak: skriva svar - men vi ventar, vi må prata meir.