Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Meeting setup

Agenda

Opening, agenda review, participants

Projects & topics

Admin routines (Sjur)

Dersom folk er borte frå måndagsmøtet, så må ein sjølv passa på å lesa det så fort ein får høve til det. Sjekk inn referat – og les dei, ev $GTHOME/techdoc/admin/weekly/2011/xxx

Speller (Sjur)

2.1. vart lagt ut på fredag, men pressemeldinga har ikkje gått ut.

Vi oppdaterte berre sma, ikkje sme, smj. Hunspell for smj, sma er no brukbar: Både copula og nektingsverb er inne.

TODO

Barents (Trond)

Komi

Arbeidet går vidare, Marina har arbeidd med budsjettet. NFR er utilgjengeleg.

Kildin

Det skjer ingen ting enno, Trond og Sjur må fylgja opp.

Sørsamisk (Trond, Maja)

I eit møte for 14 dagar sidan bestemde vi å gå frå +Pred til +Sg+Nom. No er det gjort, litt forseinka pga ordboks- og stavekontrollslepp.

Maja vil gjerne gå gjennom alle adjektiva, ikkje berre dict og Oahpa-adj. Svært nyttig med tabellane med alle viktige former. Vil gjerne prioritera arbeidet.

TODO

Ordbøker (Lene, Ciprian)

sme-dict er ikkje revidert

sma-dict: Stor del av de 113 lemmaene som ikke ble generert, er nå fiksa - noen stedsnavn fremdeles hos Thomas. Vi ventar på adjektiva. Trond har rydda i te og re-elementa. Anna kodeopprydding. Det burde no vera svært få ord som ikkje blir generert neste gong.

Vi treng fleire som testar ordbøkene, også av dei som ikkje kan språka - dei har andre augo enn dei språkkyndige.

No genererast: Attr - Sg Nom - Comp Sg Nom - Superl Sg Nom. Vi legg til: Ill Sg

Føreløypig lanseringsfrist: 28. mars 2011

TODO

Korpus (Børre)

Har retta opp resten av feila i bound (mange feil i xsl-metadata og feilkoding av title og person feltene i Word document). Før han starta var det meir enn 1800 feil, no er vi nede i 107 feil.

Retta ein feil i ccat, kompilert og installert på Victorio, snart på XServe.

Trond: /home/apache_corpus/ 19,2 mill ord. /home/trond 5,8 mill ord.

TODO

Depworkshop (Trond)

GT har invitert P Sammallahti til Tromsø for å diskutera dependensanalyse av samisk, 14-15.4. CG som tema er aktuelt for fleire av oss.

Praktisk om innkalling osb.: Lene, Trond.

Infra (Sjur (& Ciprian?))

Sjur: Prosjektstopp.

Uklåre:

Ny infra før Barents. Momentliste:

spring planning - year of cleanup? (Sjur (& Ciprian?))

TODO:

  1. autotools-oppsett/-infra (Børre, Ciprian, Sjur)
  2. “JavaDoc”-infrastruktur (Børre)
  3. Unit-test-rammeverk (Børre?)
  4. LexC-opprydding (Maja, Thomas, Trond)