Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Saksliste for fellesmøtet:

oppsummering etter FAD/SD/UiT-møtet med Divvun 31/5-2011

arbeidsdeling mellom Divvun og GT

korpus

Konvertering av korpuset ocrfeil, pdf-feil, teiknsett

  1. spørsmål: korleis rettar vi desse feila
    1. rette manuelt i ein kopi av originalen eller av xml-fila
    2. rette via xsl-konverterings-prosessen og convert2xml.pl
    3. flytte til gullkorpus og rette via leif$feil-formatet
  2. Moglege svar
    1. svn-repositorium med konverterte data: xml som er stabil (dvs. maskinelt korrekt konvertert)

planlegging av tida framover:

finplanlegging for den nærmaste månaden = alt ferdig før sumarferien

sumarferieplanar/-tider

grovplanlegging for hausten

Det vart ikkje tid til dette punktet. Vi kjem attende.