The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Sjur og Trond, 134.10.14
Ciprian har gamle paradigme frå VD, dei kan vi bruke som (utgangspunkt for) yaml-testar.
Vi vil ha testar etter:
Dokumentasjon for yaml-testane finst på: [/infra/infraremake/AddingMorphologicalTestData.html]
TILTAK: Ciprian tar eit utval frå VD-paradigmet og sett inn i
` main/langs/sme/test/src/gt-desc-yamls/ (der det ligg ei modellfil), evt.
main/langs/sme/test/src/gt-norm-yamls/`. Dette skjer etter Göteborg.
Analyser eit rimeleg stort korpus med analysatorane frå både ny og gamal infra, sjekk at resultata er like eller kompatible.
$GTHOME/langs/sme/test/data/move/
Heli har genrerert og laga diffar, Lene har kommentert, vi fann ei lus i ny infra som no er retta. Vi treng ein ny diff -> Heli.
TILTAK:
$GTHOME/langs/sme/test/data/move/
Vi har fått e-post frå Kyrre Soleng. Møte om ca 2 veker (i november).
Trond har skrive e-post, vi ventar på svar.
Vi har ein betaversjon! Våre testarar bør få litt meir eksplisitt dokumentasjon.
Fleire betatestarar:
Børre lagar nettskjema med lydfilene, og deretter ber vi folk på FB om å testa.
Folk vil analysera sjølve, men vil ikkje ha heile pakka, og vil ikkje byggja frå kjeldekoden.
Språk? I prinsippet alle, men sme.
Kompiler på xserve, legg ut på static_files
Vi kan ha eit shellscript
Dei treng tre typar filer:
Mål: vi lagar ei pakke som kan distribuerast og som inneheld alt bortsett frå eksterne verkty.
Timeplan? Vi må koma attende til saka.
Vi får tilgang til eit korpus av samisk teksta TV-sendingar, frå univ i Joensuu. Men kravet er at det er lukka, og til forskingsformål.
Lukka ok, vi har ein lisens for det. Men vi kjem til å nytta deriverte data til produktutvikling til beste for det samiske samfunnet. Det må vera ok. Alle produkt er gratis og open kjeldekode.
TILTAK: Trond følgjer opp.
For seg sjølv eller i langs? Trond: for seg sjølv.
Møte: kl 8. torsdag
Når? 1-2.12.2014 (UB er arrangør). Skal vi prata om Akan? Utveksla data?
Tiltak: skriva svar - men vi ventar, vi må prata meir.