Divvun-møte 16.9.2025
Til stades: Sjur, Maja, Helena, Flammie, Katri
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Helena
- arbeider med å få oversikt over systemet og alle filene og detaljane
- går igenom de markeringar divvun gör i min avhandling
- försöker förstå mig på taggarna i lexc
Maja Lisa
- lemma-arbeid + lexicon- takk til Børre
- Tronds matpakkeseminar - KI-assistenter i arb.livet- praktisk guide
- spørsmål om å koble til “Aanna” til nettsider (fredag)
Børre
Boahtteáiggis:
- Bugzilla-flyttinga
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
Flammie
Sjur
- giellalt.github.io:
- høgremeny (sitemap/sideoversikt) no på plass
- berre synleg i breie vindaugo
- alle andre kjende feil og manglar retta
- tilpassa mobiltelefonar og nettbrett
- både mørk og ljos modus
- TTS-feilsøking knytt til
81-jahkásažžan
- rapportert fleire feil i stavekontroll og grammatikkontroll til Brendan et co
Katri
- olo-TTS:
- Yle Karjala prosessering av materialer, kanskje 70% gjort
- smn-tts
- forberedt og organisert allt for opptak men 1 talere kansellert
- avtaler, tekstprompter, studion…
- i stedet: planlegging av vitenskaplig samarbeid om enaresamisk, knyttet til talesyntese
Framover/Ideer:
- publisering av datasetter for alle TTS-prosjekter??
- UiO kontakt om å hente mer LIA material & få ny avtale
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Necessary Innovations
- CI-serveroppsett - no òg korpusbygging
- meir robust API-server
- grammatikkontrollane bruker no ny Divvun-pipeline
- mobiltastaturrettingar
- feilsøking kring manglande stavekontroll på Apple-dingsar
- Android-oppdatering: begge tastaturappane no ute i ny versjon
- Windows-tastaturproblem og feilsøking
- macOS-tastaturproblem (språkkode istf språknamn)
- feil/manglar i macOS - spørsmål sendt til Apple
- pahkat-infra (ikkje ferdig)
- arbeider med å løysa problemet med språkval i grammatikkontrollen i Word for Mac
- ser på problema med LibreOffice vs Pages, og handteringa av bindestrek
Framover:
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- i samband med personalseminaret i desember: 1.-5.12.2025.
Alle som er i Tromsø 16.10.: meld dykk gjerne på ISK-middagen.
Neste møte: tysdag 23.9. til vanleg tid.