Divvun-møte 24.6.2025
Til stades: Katri, Linda, Børre
Språk: davvisámegillii
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Børre
Framover:
- libdivvun 88 og 89
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Linda
- Munin konferanse abstrakt
- begynte med lang-sme bugger
- irsk grammatikkontroll med Elaine og Seanán (nye regler)
- sommeravslutning (vi ble nevnt pga innovasjonsprisen)
- møte om norplus-søknad (samarbeid mellom kal-smi)
- forbedret syntaxfest-artikkelen og sendte inn
Katri
- sme-ASR: bygger ny datasett, legger til metadata og ny data som er sist transkribert
- hentet og prosessert ny material for transkribering
- monthly speech technology møte med nordiske enheter, skrev beskrivelser av treningsprosesser i talemodeller til NRK
- Cristin – markert alle resultater 2023-2025
- Karelsk TTS material - går gjennom transkriberinger med lyd
- Speech synthesis workshop: fikk reviews av 2 artikler: en akseptert og en rejected
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Necessary Innovations
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
- mobiltastaturrettingar
- TTS-oppdatering:
- fleirspråkleg syntesemodell (ein modell for alle språk)
- tal blir konverterte til tekst
- tekstprosesseringa uavhengig av syntesemodellen
- berre på API-servaren inntil vidare
- har levert fungerande prototype på ny grammatikkontroll i nettlesar
Framover
- pahkat-infra
- ny grammatikkontrollplugg
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samling etter sommaren: 25.-29.8.
Neste møte: tysdag 1.7. kl 10.00 norsk tid.