Divvun-møte 3.9.2025
Til stades: Sjur, Maja, Helena, Børre, Flammie, Katri
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Børre
- administrere og hjelpe nye sms-, krl- og olo-utviklere
- Kauto-reise: informere om og installere verktøyene våre
- oppdatere innhold på sátni.org
- fikse feil i CorpusTools
- infra-møte med Sjur og Anders
- sammen med Maja: info om talesyntese på Facebook
- divvun.uit.no: tjenester over til ny maskin
- Sámi voice recognition-møte
-
Installerte verktøyene våre på interne og eksterne maskiner
Boahtteáiggis:
- Bugzilla-flyttinga
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
Flammie
Sjur
- Divvun-veke m/ intro og opplæring for Helena
- møte i ASTIN - ny konferanse etter Trondheim, neste i Helsingfors, om ca eit år
- laga Rust-program for å ta cg-utdata med
"xxx"phon
-tekst, og konvertera det til “rein” tekst, dvs lik original men normalisert/fonemisert
- infra-møte: korp-prosessering på CI-maskiner
- avlusa feil på TTS-servaren, betre avlusingsstøtte som resultat
- møte om SJD-arbeid
- betre venstremeny og mørk modus for giellalt.github.io, har byrja arbeid med ein høgremeny (sitemap/sideoversikt)
Katri
- SSW konferens og reiseregning
- Yle Karjala prosessering
- Monthly Sámi speech recognition
- smn-TTS:
- møter
- kontakt med Bibliaseura
- møte om karelsk TTS
- legt til LIA Sápmi til speech-sme-x-private
- UiO kontakt om å hente mer LIA material & få ny avtale
- sme-TTS publisering på YLE
- pressemelding? finsk/nordsamisk
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Maja Lisa
- Dict: TV/IV + lagt til eksempelsetninger
- jobbet systematisk igjennom alle “begynne-setninger”
- Samtale om dict med Linda
- Skrevet abstract til Oulu 12.-15.11: Oulu - om 2.stavelsesnomen
- pres. 2016 - pres:feilmodell/levenstein-modellen: artikkel for hvordan situasjonen er for stavekontrollene (sma)
- innstallert og testet Aanna
- 14.-16.10 Nord Universitet (Samisk og urfolk)
- Sjå lista lenger ned for lenke og fleire detaljar
Helena
- arbeider med å få oversikt over systemet og alle filene og detaljane
Necessary Innovations
- CI-serveroppsett:
- byggjestatusside:
- tilgjengeleg frå framsida vår
- innlogging med GitHub-konto
- mobiltastaturrettingar
- feilsøking kring manglande stavekontroll på Apple-dingsar
- Android-oppdatering
-
Windows-tastaturproblem og feilsøking
Framover:
- pahkat-infra
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- i samband med personalseminaret i desember: 1.-5.12.2025.
Neste møte: tysdag 9.9. til vanleg tid.