Language Technology at UiT The Arctic University of Norway

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Meeting setup

Saksliste

Opening, agenda review, participants

Lingvistikk

sørsamisk leksikon (missing-liste)

Framleis mindre enn 90% dekning i vanleg tekst. Ikkje-sma-missing: Namn, tal, osb. Thomas arbeider med missing.

Viktige tekstar:

sørsamiske adjektiv (orientering)

Arbeid undervegs.

Ordbøker

Status quo

Ciprian ventar på nytt innhald. Deadline 8. mai

Arbeid fram mot nykompilering

TODO:

Korpus

Børre har arbeidd med tca2, for å få den til å bli kommandolinebasert att, dvs ved å skilja grensesnitt frå operasjon. Då kan ein ha to grensesnitt, eitt grafisk, og eitt kommandolinegrensesnitt.

Denne endringa bør inn i kjeldekoden i Bergen.

Berit Merete har arbeidd med europarl-aligneren, laga lister over forkortingar for se og no. Dette er forkortingar som krev punktum, men som ikkje markerer slutten av ei setning (TRAB-dot i vår terminologi).

TODO:

Barents - orientering

Trond i Joshkar-Ola: 15-20 ulike min.språk representert, stor entusiasme og interesse for arbeidet vårt. Nokre språksamfunn hadde eigne tastatur, andre ikkje. Her ligg presentasjonane frå Joshkar-Ola-konferansen

Vi har fått orientering frå FAD, og arbeider vidare.

Bugzilla

Frå førre møtet:

Nytt på dette møtet:

FAD-besøk

FAD kjem med ny departementsråd (ein byråkrat) Killinggren på onsdag før kl 10. Trond vil ha hjelp til presentasjonen, og lagar ei mappe for dette.

Oahpa på konferanse denne veka

Nettgrensesnittet må fungere når Rørosgjengen har presentasjon av Oahpa 4.5.

Infrastuktur

Victorio - Orientering

Victorio har ikkje nytt minne. Det kjem tidlegast på onsdag, Trond må avtale tidspunkt med IT-avd når det ikkje kolliderer med demonstrasjonar. Deretter kjem diskusjonen om å dele vic i svn - online-tenester (cgi + oahpa) - utvikling (= alt anna enn svn og online-tenester).

Forrest-gtuit blir no bygd på xserve.

GSoC-prosjekt med Apertium-QA (kvalitetssikring)

GSoC med Brendan Molloy i Australia, har laga HfstTester.py, det nye scriptet for å teste fst-ane våre (brukt med stor suksess for sma og kirgisisk).

Møte: Har vi i Gt/Divvun synspunkt på kva som skal inn i dette prosjektet?

TODO:

infra - restruktureringsplan

Sjur har sjekka inn eit plandokument. Synspunkt? Viss ja, så møte, viss nei går Sjur vidare.

TODO:

Xerox

Ny versjon tilgjengeleg no. Fiksar flag-diacritic-lus som stoppa våre transducarar.

Divvun 2.2

Kjerne: Oppdatere sme, smj lingvistisk innhald etter 2008.

Thomas, Tomi: …

status:

some hyphenation-problems:

ANC-reahccut	AN-C--reah-c-cut
10-jahkásačča	10--jah-kásačča
Davimušaláš-geađggit	Da-vi-mušaláš--ge-ađg-git
Koskivuori-plánenreaiddut	Kos-ki-vu-ori--plá-nen-re-aid-dut
duhtadanládje	du-ht-a-dan-lád-je
Skuvla	Sku-vla

hyphenation-rules works

TODO

NoDaLiDa 2013

status, aksjon?

Direktefly Riga-Tromsø er mellom €81 og €171 for ein veg (men det er fly berre 2 dagar i veka). Vil den være der i 2013? Veit ikkje. Direktefly Riga-Oslo? mellom 20 og 137 for Baltic Air.