Divvun-møte 5.8.2025
Til stades: Katri, Linda, Sjur, Flammie
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Linda
- søknadsmøte med Judithe og skrev epost til de andre partene (NORDPLUS)
- jobba med sma artikkel om
- čoahkkin Marja-Liissain (smn fst lohkosánit)
- jobba med Duommá sine bugger for norsk GramDivvun
- flere møter med Flammie om syntaksfest poster
- admin
Katri
- permisjon 50%
- sme-ASR: bygget en ny datasett, sendt videre til trening av modellen ved NB
- Karelsk TTS material - går gjennom transkriberinger med lyd
- Demo med 6-språkig TTS-modell https://huggingface.co/spaces/divvun-tts/6L-TTS
- presentert litt mer og ba om at folk kunne teste den
- Monthly møte om samisk taleteknologi
Framover/Ideer:
- smn-TTS – opptak??
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Flammie
- har fiksa fleste tts-buggene fra github issues
- poster til syntaxfest
- en regresstest-typ skript til pipespeccer
- lexc-tester (generate lemmas / accept lemmas / paradigms) i egen repo
- skrev noen skripter for en app som handlar giellalt repoer og dependenser osv.
Sjur
- IGF25-paneldebatt
- sluttrapport og rekneskap for Borealium.org og Trondheimskonferansen i november til Nordisk ministerråd
- ny vedlikehaldsavtale med Necessary Innovations
- møte med NRK og andre (taleteknologi)
Børre
Boahtteáiggis:
- libdivvun 88 og 89
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Necessary Innovations
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
- mobiltastaturrettingar
- TTS-oppdatering:
- fleirspråkleg syntesemodell (ein modell for alle språk)
- tal blir konverterte til tekst
- tekstprosesseringa uavhengig av syntesemodellen
- berre på API-servaren inntil vidare
- har levert fungerande prototype på ny grammatikkontroll i nettlesar
Framover
- pahkat-infra
- ny grammatikkontrollplugg
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samling etter sommaren: 25.-29.8.
Neste møte: tysdag 12.8. kl 10.00 norsk tid.