Divvun-møte 12.8.2025
Til stades: Katri, Linda, Sjur, Flammie
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Sjur
- CG3-arbeid for TTS
- dei fleste feila som YLE har meldt er fiksa
- TTS-testing for tekstprosesseringa for sme/sma/smj
- mobilstavekontrollar for språk med alternative skriftsystem i lag med Brendan/Dylan og Flammie
- SMN-TTS-møte
- GitHub-rydding i ulike feil som er melde
- Taskcluster UT, Buildkite INN - endeleg!!
- prøvde å hjelpa finsk WinDivvun-brukar, fekk det ikkje til
Linda
- søknadsmøte med Judithe, Trond og Marja-Liisa (NORDPLUS)
- møte med Trond for å rette opp søknadsteksten
- jobba med Duommá sine bugger for nordsamisk GramDivvun
- møte med Trond og Seanán om irsk grammatikkontroll
- bestillt reise til Ljubliana
Katri
- permisjon 50%
- smn-TTS
- planleggingsmøte
- booket studion
- sjekket tekster til opptak
- møte med Trond
- olo-TTS
- prosesserer material
- e-post om prosjektet
- NRK / Divvun TTS
- diskusjon om anonyme stemmer, har sendt material for å jæmføre stemmer i NRK sin intern evaluering
- Jobbet med SSW presentasjon med Antti
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Flammie
framover:
- yamltesting i egen pipx pakke
Børre
Boahtteáiggis:
- libdivvun 88 og 89
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Necessary Innovations
- CI-serveroppsett: Taskcluster er no ut, og Buildkite er inn
- betre integrering mot Zulip, som vi styrer ganske langt sjølv
- mobiltastaturrettingar
- særleg feilsøking kring manglande stavekontroll på Apple-dingsar
- TTS-oppdatering:
- fleirspråkleg syntesemodell (ein modell for alle språk)
- tal blir konverterte til tekst
- tekstprosesseringa uavhengig av syntesemodellen
- berre på API-servaren inntil vidare
Framover
- pahkat-infra
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samling etter sommaren: 25.-29.8.
Divvun-samling i samband med innovasjonsfrokosten? 8.-12.9.2025.
Divvun-samling i samband med personalseminaret i desember: 1.-5.12.2025.
Neste møte: tysdag 19.8. kl 10.00 norsk tid.