Divvun-møte 3.3.2026
Til stades: Flammie, Børre, Maja, Linda, Katri språk: samisk (nord-, enare-)
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplanar
- Ymse
Sidan sist
Maja Lisa
- Artikkelmøte m/ Linda - sendt til gjennomlesing
- VS Code(editor)(regelskriving)+ Claude m/Børre -
Framover:
- språkhaldningar og syn på språk og kultur blandt forskarar, og korleis dette påverkar forskingsarbeidet -
- 6 masteravhandling - lage missinglist - Starta opp dette arbeidet m/ hjelp av Børre
Flammie
- redaktørmøte
- lemmatesting
Linda
- review for The Symposium on Artificial Intelligence for Cultural Heritage and Indigenous Futures i Paris (April 16-17, 2026, Paris, France)
- redaksjonsmøte
- første versjonen av SDA artikkelen er ferdig
- irsk møte (grammatikkontroll & TTS) mellom Divvun & ISOF
Katri
- sme-Whisper evaluering (NB)
- word-error-rate
- smn-prosessering: 3:41 timer igjen med ML
- diskutert med Trond
- ny multilang-TTS - fikk bare Finsk data
- men: fant norsk og kanskje svensk datasetter
- monthly meeting om samisk ASR
- irsk TTS møte
- SAALS-tidskriftsartikkel: abstrakten må endres litt
---------------------------------------
9. REFERENCE: Mii han oaidnit makkár váikkuhusaid biila lea dahkan.
PREDICTION: Mii han oaidnit makkár váikuhusaid biila lea dahkan?
NORMALIZED: mii han oaidnit makkár váikuhusaid biila lea dahkan
----------------------------------------
10. REF: Dá leat čoahkkinjođiheaddjit, mun sottinen, ja thomas åhren nsras.
PRED: Dál leat čoahkkinjođiheaddjit mun sottinen ja thomas åre ain na sarras.
NORM: dál leat čoahkkinjođiheaddjit mun sottinen ja thomas åre ain na sarras
----------------------------------------
11. REF: Muhto dan guovžža dan gal godde ja.
PRED: muhto don guovžža dan gal godde ja.
NORM: muhto don guovžža dan gal godde ja
----------------------
Framover/Ideer:
- Aalto ASR-demo (test gjerne!)
- kontakt med/om LIA Sápmi: avtale må fylles inn
- publisering av datasetter for alle TTS-prosjekter??
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language identification), kan brukes til å filtrere norsk material (tekst) ut fra t.ex. sametingets plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Børre
- Donate your speech
- møte med NRK, YLE, SR/SVT
- app: oversettelser, opptak
- backend: ekte data
- lang-sma
- maja: claude, regler
- jobbe med noen regler
Boahtteáiggis:
- rette feil i borealium
-
få pontoon til å virkelig synkronisere
- laga oppsett for gramcheck-testdata i cg3-filer
Necessary Innovations
- grammatikkontrollserver
- Windows-VM
Framover:
- nytt installeringsprogram
- oppdatert kbdgen:
- linux-tastatur
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 2.-3.3.2026: CEPS/IdeasLabs (Bryssel) - Sjur/panelsamtale
- 6.3.2026: disputas for Helena
- 24.–29.3.2026: EACL, tidsfrist hovedkonferanse Oct 10
- 11-16 May 2026: LREC, paper submission: 17 October 2025 (Mallorca)
- seinare: sigmorphon eller andre tba
- 15-18 juni Gávnnadeapmi 3 (Ohcejohka(?))
- 18-21 juni Sámiid konferánsa Ohcejohka
- Midtsommerhelga 2026: Ankarede - rekruttering av sma-studenter
- July 4th, 2026 - ComputEL 2026, San Diego, California
- oktober/november 2026: Oppfølgingskonferanse etter Trondheimskonferansen sist november, i Helsingfors
- 4.-5.11.2026: 7th Saami Linguistics Symposium SAALS7, Nord Universitet, Bodø. Frist for sammendrag: 10.4.2026
- 12.-16.4.2027 Tromsø CG-seminar
- 20.-24.9.2027 Nuuk CG-seminar
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- veke 13, dvs 23.-27.3.2026
Neste møte: tysdag 10.3.2026 til vanleg tid