Divvun-møte 19.8.2025
Til stades: Katri, Linda, Sjur, Flammie, Børre, Maja
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Børre
- Møte med Rolf, pontoon på produksjonsmaskiner på Azure
- offentliggjorde python_tca2 og corpustools
- ny batch av artikler fra nrk.no
- møte om nordiske taledata for samisk (NRK, SVT, m.fl.)
Boahtteáiggis:
- Bugzilla-flyttinga
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
Sjur
- meir TTS-testing og CI
- pipx obligatorisk - var ikkje heilt heldig
- Meir arbeid med Buildkite INN og Zulip-integreringa
- springane gut => trikk!
- Buildkite-statusside:
- kan lokaliserast
- tilgjengeleg frå framsida vår
- Rust-versjon av morph-test (
morph-test2
)
- med lokalisering
- gjort for det meste med ChatGPT og Claude (KI)
- koden rydda i av Brendan
- dokumenterte oppsettet for private repo
- planleggingsarbeid for innovasjonsfrokosten
- oppstartsplanlegging for Helena
- ta kontakt med Biret Merete
- møte om nordiske taledata for samisk (NRK, SVT, m.fl.)
Linda
- postermøter med Flammie (fikk feedback fra Thomas og Sjur)
- sendte inn posteret til trykkeriet
- møte med Flammie for å lage presentasjonen
- søknadsmøte med Trond
- møte med Trond, Seanán, Elaine om irsk grammatikkontroll
- søknad om reiseforskudd
- påmelding personalseminar
Katri
- permisjon 50%
- møte med Kati Eriksen om taleteknologiprosjekter (Arvil), kartlegging av samisk taleteknologi i Norden
- møte Sámi speech recognition-gruppe
- olo-TTS
- prosesserer material, gått til neste steg (oppdeling, force-align)
- repo for TTS-prosjekten?
- Jobbet med SSW presentasjon med Antti
- planleggingsarbeid for innovasjonsfrokosten
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Flammie
- yamltesting i egen pipx pakke
- poster og slides til syntaxfest
Maja Lisa
- Dict- TV/IV + lagt til eksempelsetninger - SMA-området har mye fokus på dict pga. studier i sma - forventninger om lyd til Dict + tilgang til tekn.
- artikkel m/Linda
- normering-spørsmål
- Sikkerhetsoppdatering av maskina
- poster til syntaxfest m/Flammi og Linda
- rydding av kontor
- pres. 2016 - pres:feilmodell/levenstein-modellen: artikkel for hvordan situasjonen er for stavekontrollene (sma)
- Snakka med Siri om konferanser:
- 28.-29.08. Nidelven hotell, Trondheim (Samisk møteplass 2025 – saemien tjåanghkoesijjie)
- 14.-16.10 Nord Universitet (Samisk og urfolk)
- 12.-15.11: Oulu
- Sjå lista lenger ned for lenke og fleire detaljar
Necessary Innovations
- CI-serveroppsett:
- Buildkite
- betre integrering mot Zulip, no “trikk”
- byggjestatusside:
- tilgjengeleg frå framsida vår
- innlogging med GitHub-konto
- mobiltastaturrettingar
- feilsøking kring manglande stavekontroll på Apple-dingsar
- Android-oppdatering
Framover
- pahkat-infra
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- fyrste etter sommaren: 25.-29.8.
- i samband med innovasjonsfrokosten 8.-12.9.2025.
- i samband med personalseminaret i desember: 1.-5.12.2025.
Neste møte: tysdag 26.8. kl 10.00 norsk tid.