Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Møte Sjur og Trond, 7.8. 2013

Saker

Fran-arbeid

ny infra

Fran fylgjer ikkje strukturen og arkitekturen i ny infra slik det er tenkt. Sjur må be Fran om å retta opp endringane, og helst skriva dokumentasjon som han kan fylgja.

nye språk og samarbeid med AnttiA

Antti Arppe og Juhani Järvikivi arbeider i Alberta i Kanada (begge tidlegare Lingsoft). Andre folk i dette (sam)arbeidet:

Planar: fleire folk frå oss dit (til USA/Kanada) for å halda kurs? Antti et al vil gjera fornuftige ting for desse språka og brukarane av dei.

termredigeringskurs i september

Veke 38. Enare, Karasjok, Tromsø, …

Fyrst og fremst for terminologane i Giellagáldu, men òg truleg folk frå SD,

omsetjarkurs i oktober

Autshumato - full pakke for SD. Truleg siste del av oktober.

Vi vil ha både ordbok og termbase. I dag: Berre ordbok.

TTS

Prosjektet er i ferd med å starte. Vi skriv kontrakt. Tidsperspektiv for prosjektet er eitt år. Firmaet tar hovudprosjektleiinga, og krev derfor visse ressursar til visse datoar.

Arbeid med infrastrukturen, arbeid med IPA-konvertering og forkortingar.

Apertium, d9

MT i sumar:

Nettservar, victorio

cgi-bin

Trond har diskutert med Ryan, og sagt kva han vil ha.

TILTAK

Trond diskuterer med Ryan og seier “køyr”.

stallo

configure.ac:35: require Automake 1.12, but have 1.11.1

Denne feilen dukkar opp (på nytt?). Sjur ser på 1.11 på nytt i lag med Fran, og prøver å få til ei løysing som fungerer for både 1.11 og 1.12 og nyare.

Børre har arbeidd med å parallellisere korpusanalyse og -konvertering. Analysetida har gått ned frå 2 døgn til 2 timer (med 16 parallelle prosessar).

Børre (og andre) gjer seg klar til diskusjon med IT-avd. Neste gong Børre er i Tromsø har vi ein konkret diskusjon med IT-avd om implementering av jobbane våre som parallelle jobbar.

TILTAK

GT-wiki

TILTAK

semantiske roller

Linda vil gjerne at Thomas legg til semantiske roller i leksikonet - ei vekes innsats. Til nytte for:

Det blir ikkje i august, men i september.

Thomas Gramstad og Göteborg

Heile språkteknologi sundag 10.11. tils. maks 3 timar (Trond, Sjur?, ev. Tommi?)

Enaresamisk, skoltesamisk

Workshop i Enare:

LibreOffice-pluggen:

Harri Pitkänen har gjort bugfixen som han og Sjur fann offisiell.

Arbeid for Windows (forenkle avhengigheit) må bli gjort før vi kan få voikko + hfst for Windows. Dette arbeidet blir starta (?) i august av hfst-gjengen.

Fram til i dag fungerer libreoffice-voikko-kjeldekoden for LO 3 og OO 3, men snart vil han berre fungera for LO 4.1. og nyare. Dette gjer Harri sin kode enklare, men vil blokkera bruk i OOo (truleg).

LibreOffice - språkkodar

Kva er url-en for LO-bugzilla for registrering?

Tiltak:

FAD - parallellkorpus

Arbeidet med FAD-sme-nob går vidare. Vi vil ha sme-sma-tekstar.

Barents

Trond skal snakke med dept.