Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Saksliste Sjur og Trond 21.10.14.

Bugzilla

prinsipp for lukking

også: diskusjon rundt saka (t.d. #1893)

prinsipp for oppfølgjing

(evt. nedprioritering formelt, ikkje berre reelt)

Få Bugzilla til å senda e-post med status for opne meldingar - ein gong i månaden? Vurdera eit anna system enn Bugzilla? Tettare integrering mellom lusmeldingssystemet og resten av byggjesystema.

Tiltak:

Børre er oppteken dei nærmaste to (?) vekene, etter det kan han sjå på det.

radikale grep – korleis sikre at ting ikkje blir liggande i årevis

Lusmeldingar som ikkje har vorte kommenterte på minst 2 månader genererer e-post til Trond og Sjur

Bugzilla-allmøte/-arbeidsmøte

bug 1363 (derivasjonar, # og twol-reglar)

Vi tek opp denne neste veke.

Forrest

Altså:

Divvun har ei bygging av den tekniske dokumentasjonen, og ei bygging av framsida (den brukarretta delen). Den siste blir bygd fort. Her er det språkval, her kan vi ta i bruk plugin med fleksibel ordning av innhaldet.

Tilsvarande kan vi for Gt ha eigne opplegg for dei fleirsrpåklege sluttbrukarsidene, og eigne sider for dei einspråklege tekniske sidene. Denne bør ha ei tredje, separat grafisk utforming, slik at det går fram at dette er Giellatekno + Divvun, og at dette er teknisk dokumentasjon. Ein fordel er at bygginga går fortare: Dei fleirspråklege sidene tar tid, men er færre.

Tiltak:

Korpus

Romanar

Davvi girji + forfattarar. Siri Broch Johansen har sagt ja, vi er optimistisk når det gjeld Jovnna-Ánde Vest, og også andre kan vere positive. Det viktige er å kome seg ut av daudvatnet. Vi må også ta opp saka med Skånland-tekstane

Oversyn:

Avvir

Ávvir etter 2010 manglar i korpuset vårt

Dei ventar truleg på nye verkty frå oss, vi bør laga slike før vi neste gong ber om nye korpusfiler.

Tiltak:

Talesyntesetesting

Nettskjema

Finst på [https://docs.google.com/forms/d/1z-IyTnQQ5V_iemnBUQVAc0C_t2AB28Zn_H-C_j0xN2U/viewform]

Lokal testing

Alle kan installera demo-pakka. For å få stemmene til å fungera i Words treng ein ei lisensfil. Kan skaffast via Sjur.

Problem skal rapporterast til Ritva eller Marja.

Døme på feil vi har funne:

Apertium-problem

Med fin, est, ikkje rus - og berre på ubuntu! kan fiksast med GNU Make 4.0, make 3.81 (standard på dei fleste system) funkar bra for alle andre system/språk enn Ubuntu og est eller fin. Konfigurering:

./configure --without-xfst --with-hfst --enable-apertium

Resultat for est og fin med hfst på ubuntu:

make[4]: Entering directory `/home/ARTSRN/moshagen/fin/tools/mt/apertium'
make[4]: *** No rule to make target `apertium-fin-est.fin-est.LR.att.gz', needed by `all-am'.  Stop.

Derimot fungerer det på debian og på mac.

Feilen er sannsynlegvis ein feil i ei Makefile.am på systemet vårt, som våre make er robust nok til å tolerere, men som ubuntu-make protesterer mot.

Tiltak:

Mac-store og uit

Samarbeidet med UiT-IT går ikkje så bra. Etter diskusjon i vår måtte Divvun/Giellatekno koble seg på UiT sin utviklarkonto sin som Apple-utviklar, noko dei også gjorde. Samtidig viste det seg at UiT uhøveleg nok har meldt seg av utviklarkontoen sin på mobil-sida.

Sjur melde dette til IT. Svaret var at IT-avdelinga ikkje hadde bruk for det, og dermed logga seg av. Espen Thijssen Amundsen.

Tiltak:

sme-kompileringstid

& filstorleik

Apertium-xfscript/regex for MT. Det er ikkje dette skriptet åleine som gjer at kompileringa tek lang tid, dette krev meir undersøkjing.

Stavekontrolltesting

Vi lagar ny versjon, Børre og Tomi jobbar med den.

Er det mogleg å få testdata ut av korrigerte Word-dokument som inneheld endringssporing? Døme: To versjonar av same smn-dokument, ukorrigert og korrigert. Med testdata meiner vi feil/korrektur-merka korpus til stavekontrolltesting.

Sjur: ja, det kan vi nok klara.

Tromsø-tur

Neste veke. Børre, Sandra og Sjur.

Ymse

NDS som ekte app (som kan installerast).