Divvun-møte 30.3.2021
Til stades: Duommá, Børre, Linda, Tommi, Inga, Katri, Sara, Siri, Sjur
Saker:
- Sidan sist
- Årsrapport
- Arbeid framover
- Ymse
Sidan sist
Duommá
- ej mottagit text til tále frå Acapela
- ej gjort annet enn gram-chk yaml
- og gram-chk testing o forbedring - word additions, disambiguahtor, bugzilla, errorth forms
Børre
- Artikkel / grammatikktestverktøy
- filnavn i grammatikktestresultat
- forbedre håndteringen av mellomromsfeil
- sátni.org
- møte med folket bak julev.no
- dokumentere api
- jobbet med lemmatiser/generator etter modell fra NDS
- Fikse sertifikat- og apache-oppsett gtsvn.uit.no/pahkat.uit.no
Nettsideproblem:
- divvun.no med andre lokale enn dei som allereie finst (berre for Safari på Mac, ok for alle andre) - ikkje ok enno
- SEE-server - ikkje på nett enno?
Linda
- yaml-tester i lag med Duommá (kongruens)
- artikkel om regresjonstester ilag med Børre og Tommi
- fiksing av feiloppmerking i goldstandard etc.
- fiksing av regressjonstestartikkelen
- yaml make fila
- CG-workshop med Inga
Vi treng ein modul for å indentifisera språk, både i grammatikkontrollen og for taleprosesseringa.
Tommi
- divvun-normaliser
- naacl-artikkel oppdatering for en ny workshop
- en statuscake for pahkat.uit.no og
- jobba litt med smj lånordgenerator medn guesser:
echo xyzurista | hfst-lookup guesser-gt-desc.anl.hfstol
- fikk svar fra sigma2.no
Inga
- Samlet og rettet på tekster fra vårt freekorpus for bruk i TTS
- TTS-møte
- Cg-workshop med Linda
- Rettet på MT-oversettelser
- Ordboksmøte med Ntec
- Smårettinger og lagt til enkeltord
Katri
- tts-møte
- Abstrakt till fonologikonferensen nästan färdig: min presentation ska diskutera quantity för samiska språken och hur kan de beaktas vid byggandet av en TTS
- espeak-tts: jobbat med G3 ord som är ortografisk homonymer i nom&gen: espeak har inte en syntaktisk disambiguator; i estnisk samma problem, ortografiskt homonym G3 och G2 uttalas inte annorlunda -> output har “finsk accent”
- Installerat, lärt mig att använda och eksperimenterat med Merlin-tts (DNN parametric synthesis): training användar GPU nu och jag får Merlin att fungera med Engelsk data -> börjar med Lule Saami data
- Lite mera python skripter för att processera data vidare om behövs/göra systematisk ändringar etc
Sigma2 kan snart nyttast til meir krevande trening.
Sara Marja
- missing
- term wiki
- har sett på feil i stavekontrollen, paradigmegenereringa
Siri
- Missinglista
- Termwiki
- rettet i ordböker
- Jobbet litt med Lenes liste, treng litt hjelp - Sjur ser på det, og Sara er med :)
Sjur
- Møte med ny instituttleder, informert om oss.
- tts-møte
- Fiksa byggefeil i crk (sammen med Tino)
- Møte med Linda og Inga om å få yaml-testinga til å fungere
- Trond har laget skript for å lage cg-lister ut fra lexc-koden, diskusjon om det
- har jobba med tekstnormalisering (abbr og tal til full tekst) i sme og smj
- forenkla stavekontrollbygging
- testa ny versjon av libdivvun
- budsjett og rekneskap for Divvun
- Kintel-ordboksmøte
Göteborg
- På Windows så synkroniseres språkinnstillinger på nettet med ein av dei siste oppdateringane. På grunn av det forsvinner språk, har jobbet med å løse det.
- meir arbeid med one-click-installer
- skal gjera LO-integreringa
Edmonton/Alberta/Canada
- har laga ferdig Python-bindinga mot Divvunspell
Årsrapport
Kommentarar til utkastet:
- satni.org: tidlegare 300 treff pr dag i 2019, har stige til 3300/dag no
- låneordsgeneratoren bør inn i 2.2(?), framhev at det forenklar kvardagen, da språkbrukere får ut tilpassede ord til (lule)samisk. Dette vil også kunne effiktivisere arbeidet i GG.
- Anders Kintel si ordbok i 1.3: bør nemnast at det er lulesamisk-norsk og norsk-lulesamisk
- omsetjingsverkty: jobba for å forbetra maskinomsetjinga og integrera den i omsetjingsverktyet, den mest aktive brukaren er veldig nøgd
- 1.3 - leksikografi/terminologi: sørsamisk er ikkje nemnt - vi får lister frå GG som vi legg inn.
- flytting til GitHub: websider skal også flyttast. Står lite om artiklar og akademisk publisering, skriv litt meir?
Arbeid framover
Ymse
- neste møte tysdag 6.4.2021