Divvun-møte 23.9.2025
Til stades: Sjur, Maja, Helena, Flammie, Katri, Børre, Linda
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Katri
- olo-TTS:
- Yle Karjala: prosessering av materialer, kanskje 85% gjort
- smn-tts
- opptak med P onsdag-fredag
- nye opptak med P måndag 29.9.
- møter
Framover/Ideer:
- publisering av datasetter for alle TTS-prosjekter??
- UiO kontakt om å hente mer LIA material & få ny avtale
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Helena
- arbeider med å få oversikt over systemet og alle filene og detaljane
- går igenom de markeringar divvun gör i min avhandling
- försöker förstå mig på taggarna i lexc
- twolc- og lexc-kurs med Lene
Maja Lisa
- pres til Oulu: 2.stavelsesvokal - på nytt katigorisere ODD-adjektiver også
- artikkel
- Forespørsel om stedsnavns-seminar - Helgeland (sør, ume og pite)
- dict
Børre
- Møte om NB-samarbeid
- Møte med kunnskapstrening.no. Ba om API fra oss, har satt opp interessante prototyper, f.eks Unna sánit
- grammatikkontroll
- lang-sme: teste og flytte tester
- lang-sma: teste, flytte tester, inkludere alle yaml-filer, finne en test som sinker grammatikkontrollen i flere minutter
- lang-sme bug
- nrk.no-batch
Boahtteáiggis:
- Bugzilla-flyttinga
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
Flammie
- fikse små problemer med multichar testinga
- lagte en ny pythonbaserte skript
- mer jobb med tts https://github.com/giellalt/speech-sme/issues/12
- hfst-tokenise updatering til multitoken-word subreadings
- artikkeljobb
- fikk spörsmål om besök og oppläring
- nb vi har fikk mye interesse i oppläring og “internships” og sånt i det sist??
Sjur
- TTS:
81-jahkásažžan
(løyst)
- rapportert fleire feil i stavekontroll og grammatikkontroll til Brendan et co
- retta feil i TTS-normalisering knytt til talområde som
10-15 sentimehtera
- diverse feil og problem med TTS og grammatikkontroll
- retta ein feil med bygging av drb-pakker for grammatikkontrollen
Linda
- admin
- reiseregning
- svarte på Duommá sine kommentarer om erret-earret
- testa GramDivvun i Word og meldte ifra om bugger
- gikk gjennom adjektivstammer med Maja
- NORDPLUS søknadsmøte med Trond og Judithe
Necessary Innovations
- CI-serveroppsett - no òg korpusbygging
- meir robust API-server
- grammatikkontrollane bruker no ny Divvun-pipeline
- beta-server for intern testing
- pahkat-infra (ikkje ferdig)
- grammatikkontrollen:
- problemet med språkval i Word for Mac løyst
- no ein eigen knapp for beta-versjon
- tilbakemeldingane igjen på samisk
- framleis nokre feil
Framover:
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- veke 44, 27.-31.10 (Katri ikkje slutten av veka)
- i samband med personalseminaret i desember: 1.-5.12.2025.
Alle som er i Tromsø 16.10.: meld dykk gjerne på ISK-middagen.
Neste møte: tysdag 30.9. til vanleg tid.