Divvun-møte 30.9.2025
Til stades: Sjur, Maja, Helena, Flammie, Katri, Børre, Linda
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Linda
- sma dependenser
- fiksa noen bugger i GramDivvun fra Lene
- fiksa litt feedback til GramDivvun
- sendte NORDPLUS søknaden i lag med Judithe
- artikkelarbeid med Maja og kategorisering av adjektivstammer
- snakka med studentan om CG-innføring
Katri
- ferie torsdag-fredag
- olo-TTS:
- Yle Karjala: prosessering klar for min del, prøver å få morsmålstaler/prosjektarbeider til å gå igjennom materialen før trening
- smn-tts
- møter
Framover/Ideer:
- publisering av datasetter for alle TTS-prosjekter??
- UiO kontakt om å hente mer LIA material & få ny avtale
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Helena
- arbeider med å få oversikt over systemet og alle filene og detaljane
- lagt in ord i lexc
- twolc- og lexc-kurs med Lene
- Tar hjälp av Lenes kursmaterial
- 24-25.9 borta på Giellagáldumöte
Maja Lisa
- Deltok på sma-forelesinger om lexikografi, deltok på sosial sammenkomst med MA-studentene, terminalkommandoer, frek.lister
- organisering av arb. m/Børre
- artikkel-skriving med Linda + videre stammeinndeling + flere feiltyper
- Spurt 2 ma-studenter om hvordan de opplever sma-TTS
Børre
- jobbe med bugzilla2github
- fikse problemer med mapping mellom med bugzilla- vs github-brukernavn og en god del andre problemer i scriptet
- har lagt inn alle bugger
- nettstavekontrollene har vært ustabile i det siste, satte opp systemd-timere for å sjekke dem, og evt. omstarte dem hver annen time
- møter med Maja
- starte med å få gielese.no på føttene igjen
- endre logo på termwikien
- Møte: Info om CorpusTools og korpus til sms- og liv-gruppen
- PNMA Meeting VIII, avslutning etter sommerens IGF2025
- Svare på e-post om Skuolfi sine ordbøker, tilbød han legge dem til på borealium.org og hvilken info vi behøver for å gjøre det
- Sette opp feilmelding om 404-sider etter melding fra Lene.
Boahtteáiggis:
Flammie
- artikeljobb og ud konversion
- ny tts-problemer
- fikse små ting med lexc filer som ä fant ut med ny multichars test script:
- ingen ord entries på samma linja med LEXICON
- en ord (/morfem) per linja
- nbsp i ord
- jobba med trond om invitasjonsbrev og
Sjur
- rydda i genereringa av giellalt.github.io, mange katalogar vart ikkje med
- møte om kvensk talesyntese
- administrativt
- testa arbeid frå Brendan
- møte i Trondheim om norsk dialekt-TTS med vår teknologi og vår infra
Necessary Innovations
- API-server:
- grammatikkontrollane bruker no ny Divvun-pipeline
- divvun-runtime standard denne veka
- TTS oppdatert
- pahkat-infra (ikkje ferdig)
- grammatikkontrollen:
- nokre serverproblem løyst (smn)
- Android:
- arbeid med å få på plass stavekontrollen igjen
Framover:
- byte til divvun-runtime, truleg denne veka
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- veke 44, 27.-31.10 (Katri ikkje slutten av veka)
- i samband med personalseminaret i desember: 1.-5.12.2025.
Alle som er i Tromsø 16.10.: meld dykk gjerne på ISK-middagen.
Workshop om samisk KI 30.10., truleg i Trondheim - kolliderer med Divvun-veka.
Neste møte: tysdag 7.10. til vanleg tid.