Language Technology at UiT The Arctic University of Norway

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Trond-og-Sjur-møte 28.8.2018

Arbeidsoppgåver

Det er mykje å gjere. Vi prioriterer først ein del ting med eksterne tidsfrister, deretter eigne ting. Lista over eigne ting er her ikkje fullstendig, og vil gå parallelt.

  1. LIA til Oslo + Kautokeino (12.9.)
  2. Konteaksta (samarbeid med Nordreisa)
  3. Oahpa-flytting til nye gtoahpa
  4. Korpus-prossessering av andre språk (u_korp)
  5. Vidareutvikling av NDS
  6. Anna flytting til servarane servarane

Orddeling

Fst-basert orddeling er no betre enn tidlegare (leksikonbasert orddeling fungerer som ho skal)

NB! Vi må sjekke pipeline for orddeling i cgi-bin-scriptet

orddeling i grammatikkontrollen

Rettinga fjernar orddelinga Ávvir har i tekstane sine. Vi veit ikkje kor den orddelinga kjem frå.

Vil vi tilby orddeling som autogenerert softhyp? Ja, truleg.

Aili-tekst

Fredag ettermiddag denne veka.

Mogleg inspirasjon: 2016/brasil/infoark.tex i art.

divvun.org vs divvun.no

samisk og proofing.xml

[http://divvun.no/no/korrektur/otherapps.html]

Hald fram med diskusjonen i lag med andre.

innkjøp - utlysing

Gjekk ut på fredag, to firma har meldt (uformell) interesse.

serverane våre

Vi bed om 200 GB for svn-servar i dokumentet vårt. Dette er for lite i eit framtidsperspektiv. Vi trengte den plassen i vår allereie.

Trond kontaktar IT (Roy) og ber om møte i neste veke. Dette gjeld i alle fall svn-servar, gtweb, gtoahpa.

xserve

Trond pratar med Børre.

preprosesseringsgullkorpus

Trond legg til setningar for slike ting som vi treng testar for:

test/data/analysis_check_corpus.txt

Lyd-workshop

Trond har skrive til miljøet på Aalto, og antyda at vi gjerne vil ha samarbeid.

divvunveka

sosialt neste veke: måndag kveld (Lene) og fredag kveld (HSL-fak) - anna?

Logging

private/logs/00_README.txt

Arbeid framfor oss (förste del av lista meir akutt enn siste punkt)

  1. inventere prosessar (i readme-fila)
  2. sjekke om dei blir loggfört
  3. systematisere lagring av loggar
  4. deretter vurdere korleis dei kan brukast

Sjur ser på Divvun-sida.