Divvun-møte 9.9.2025
Til stades: Sjur, Maja, Helena, Børre, Flammie, Katri
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Maja Lisa
- Dict: lagt til flere oppføringer + lagt til eksempelsetninger
- Artikkel: adjektiv
- påbegynt lemma-arbeid
- abstract-fonologi - pres. til Oulu-
Børre
- kickoff-seminar for prosjektet WebData. Zulip-tråd
- divvun.uit.no
- stavekontrollene på divvun.no og divvun.org funket ikke, restarte dem
- Få forrest til å bygge giellatekno.uit.no på divvun.uit.no
- Laget en posting om YLE Sápmi og oss på Facebook
- lang-sme: gramcheck-tests
- divvun-runtime
- prøve å bygge divvun-runtime
- rapportere feil, foreslå endring
Boahtteáiggis:
- Bugzilla-flyttinga
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
Flammie
- Pythonpakke fra onverteringsskripter til UD / Unimorph osv. https://github.com/flammie/giellaltconversiontools
- Pythonproto av byggeverktöy til giellalt repoer https://github.com/flammie/divvundev
- fikse noen feil i giella-core om divvun-runtime
Sjur
- høgremeny (sitemap/sideoversikt) for giellalt.github.io
- bygginga stoppar på CI-servaren/GitHub, fungerer lokalt
- stutt møte med GG om skoltesamisk arbeid framover
- TTS-arbeid i samband med YLE-lanseringa
Katri
- olo-TTS:
- Yle Karjala prosessering av materialer, kanskje litt over 50% gjort
- var med å organisere ansatte for å lage tekstprosessering (Sjur óg)
- kan ikke finne
speech-olo-x-private-repoen fra GitHub (med lfs)
- YLE Sápmi publisering, testing
- lunsjmøte med Aalto om sme-asr (talegjenkjenning)
- Multilingual TTS: ny vokoder testet og implementert til demosiden; raskere overallt og bedre med mannlige stemmer
- smn-TTS:
- sjekket frekvenser av stamkonsonanter
- skrev dokumentasjon
- organisert/planlagt tidstabell til opptak og avtale med stemmene
Framover/Ideer:
- publisering av datasetter for alle TTS-prosjekter??
- UiO kontakt om å hente mer LIA material & få ny avtale
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language identification), kan brukes til å filtrere norsk material (tekst) ut fra t.ex. sametingets plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Helena
- arbeider med å få oversikt over systemet og alle filene og detaljane
- går igenom de markeringar divvun gör i min avhandling
Necessary Innovations
- CI-serveroppsett - no òg korpusbygging
- mobiltastaturrettingar
- feilsøking kring manglande stavekontroll på Apple-dingsar
- Android-oppdatering
- Windows-tastaturproblem og feilsøking
- macOS-tastaturproblem (språkkode istf språknamn)
- pahkat-infra (ikkje ferdig)
Framover:
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 14.-16.10.2025: Nord-konferansen samisk og urfolk, Levanger (frist for samandrag: 1. september, påmelding 25. september)
- 22.-23.10.2025: Konrad Nielsena 150 jagi ávvoseminára, Kautokeino
- 12.–14.11.2025: Sámegiela, sámi girjjálašvuođa ja sámi kultuvrra symposia (Oulu universitehta)
- 1.-5.12.2025: Divvun-uke
- 4.-5.12.2025: ISL-personalseminar
- 10.–12.12.2025: IWCLUL, Joensuu, innsendingsfrist: 19.10.
- seinare: sigmorphon eller andre tba
- Ankarede: Midtsommerhelga 2026 - rekruttering av sma-studenter
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- i samband med personalseminaret i desember: 1.-5.12.2025.
Neste møte: tysdag 16.9. til vanleg tid.