Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Divvun-møte

Til stades: Børre, Inga, Maja, Sjur, Thomas, Tomi

Saker:

Topp-3 saker sidan sist

Status for stavekontrollar

Hunspell

Hunspell-konverteringa fungerer igjen. Genererer svært stor dic-filer (500+ Mb). Ordmengda kan delast opp i prefiks og ordstammer. Børre arbeider vidare med dette, med samansetjignar og med MWE.

HFST+Voikko

Støtte for HFST er no offisielt ein del av Voikko (sjølv om det ikkje er default). Vi må testa hfst-stavekontrollane og betra forslaga.

Word/PLX

Etter Hunspell skal vi ha ut ny versjon med oppdatert Win-installering, og med feilrettingar av buggane som har dukka opp.

Risten2 - status

Search is still quite slow on client-side. Tomi will move client-side code into another javascript framework. Terminology and dictionary xml source files structure need to be unified.

MediaWiki/termredigering

Børre jobbar med det, stort prakk å få det til. Deretter installera MediaWiki-pluggar og termtilpassingar.

Easter-holiday

Namn Dato
Thomas No holiday :(, working from Ruoŧŧa, probably not regular hours
Inga No holiday, jobber fra Kauto uke 13 & 14.
Børre No holiday
Tomi No holiday
Sjur 27.3. + 2.4., 3.4. kort dag

Bugzilla-status

Reviderte vårplanar

Dato Oppgåve
22.3. mediawiki-servar på plass for terminologiredigering
22.3. SD- og mekanikktermane konverterte og importerte
22.3. stavekontrollar for Hunspell (InDesign + OpenOffice/LibreOffice)
22.3. stavekontrollar for HFST (OpenOffice/LibreOffice/Windows8)
10.4. Juss-termane konverterte og importerte til Risten2 og mediawiki
10.4. beta av Risten2
23.4. TTS-søknadsfrist
30.4. TTS-leverandør vald
31.5. grammatikkontroll - teknisk arbeid (Francis)
31.5. nye PLX-stavekontrollar for SMJ og SMA = språklege oppdateringar
31.5. Risten2 ferdig
30.6. Nordplus-prosjekt heile våren
čađat meir ny infra
čađat korpusinnsamling
haust alle delar av omsetjingsarbeidsbenken på plass, kurs for SD-oms.
31.12. Aajege-prosjektet
Konvertere Kintels ordbok
grammatikkontroll - språkleg arbeid
Korpus-søkegrensesnitt (Korp og Karp, GU)

denne veka

Neste møte

  1. mars kl 9.30 (berre lyd).