Divvun-møte 10.3.2026
Til stades: Flammie, Børre, Maja, Linda, Katri, Sjur, Helena
Språk: samisk (nord-, enare-)
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplanar
- Ymse
Sidan sist
Helena
- Disputation och förberedelser
- Incoming filerna, börjat titta på dem
Maja Lisa
- Disputasen til Helena :-)
- Analysatoren hyler og skriker = rød -> lemmaarbeid + leksikonarbeid:
- Felles_Sugestion_ MA_Avhandlingene
- SMI-lemma m.fl språk + typos-feil (slettet)
- adj/noun-leksikon -slå sammen
- låneord med Siri - sender siste liste til Gg-styret - deretter oppdatere fst:en! - 5 nye suffix + endring i 3 + ett(1) suffiks som gjenstår.
- to dager borte/avspasering
- kontaktet Jussi ang. noen syntaktiske konstruksjoner
Framover:
- språkhaldningar og syn på språk og kultur blandt forskarar, og korleis dette påverkar forskingsarbeidet -
- 6 masteravhandling - lage missinglist - Starta opp dette arbeidet m/ hjelp av Børre
Flammie
- möte om testing med lene og trond
- disputas
- redaktörmöte og -arbeid
Linda
- disputas
- leste gjennom artiklene for Nordlyd
- redaksjonsmøte
- irsk grammatikkontrollmøte med Seanán og Harald
Katri
- sme-Whisper evaluering (NB)
- word-error-rate
- smn-prosessering: 2 timer igjen med ML
- diskutert neste steger med Trond
- ny multilang-TTS - fikk alle datasetter fra Antti, ska starte med trening snart
- men: fant norsk og kanskje svensk datasetter
- SAALS-tidskriftsartikkel: abstrakten må endres litt
- Bestillt reise til Tromsø
Framover/Ideer:
- sma manlig stemme
- Combined TTS/ASR with new technologies
- Aalto ASR-demo (test gjerne!)
- kontakt med/om LIA Sápmi: avtale må fylles inn
- publisering av datasetter for alle TTS-prosjekter??
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language identification), kan brukes til å filtrere norsk material (tekst) ut fra t.ex. sametingets plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Børre
- Donate your speech
- fant ekte innhold, tilpasset appen til det
- lagde web-app, med fake opptak, som demo for hvordan flyten er i appen og som inspirasjon for nytt innhold
- gtgramtool: varsle om feil i
Variantsi yaml-filer
Boahtteáiggis:
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
Sjur
- mykje arbeid med stavekontrolltesting
- forbetringar av både divvunspell og accuracy
- førelesing på Helsingfors universitet
- Bryssel / CEPS/IdeasLab
- møte om DYS Sápmi
- disputasen til Helena
- testa nyaste
gut- no ferdig for ei lang tid framover :)
Necessary Innovations
- gut
- divvunspeller
- Windows-VM
- DYS Sápmi-app i lag med Børre
Framover:
- nytt installeringsprogram
- oppdatert kbdgen:
- linux-tastatur
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 24.–29.3.2026: EACL, tidsfrist hovedkonferanse Oct 10
- 11-16 May 2026: LREC, paper submission: 17 October 2025 (Mallorca)
- seinare: sigmorphon eller andre tba
- 15-18 juni Gávnnadeapmi 3 Ohcejohka
- 18-21 juni Sámiid konferánsa Ohcejohka
- Midtsommerhelga 2026: Ankarede - rekruttering av sma-studenter
- July 4th, 2026 - ComputEL 2026, San Diego, California
- oktober/november 2026: Oppfølgingskonferanse etter Trondheimskonferansen sist november, i Helsingfors
- 4.-5.11.2026: 7th Saami Linguistics Symposium SAALS7, Nord Universitet, Bodø. Frist for sammendrag: 10.4.2026
- 12.-16.4.2027 Tromsø CG-seminar
- 20.-24.9.2027 Nuuk CG-seminar
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samlingar framover:
- veke 13, dvs 23.-27.3.2026
Sjur er oppteken neste tysdag, Linda dreg møtet.
Neste møte: tysdag 17.3.2026 til vanleg tid