Divvun-møte 17.6.2025
Til stades: Sjur, Katri, Linda, Maja, Børre
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Lávdan Sámi Arena
- fekk prata med mange
- mange spennande innleiingar, men fekk ikkje tid til å høyra på så mange - betre fordeling av tida
- behov: ordboksapp og stavekontroll med forslag/fullføring/neste ord - stavekontrollen har ikkje fungert for mange på eit heilt år!
- meir tilgjengeleg plassering/organisering neste gong?
- vi treng alle trening i kva vi skal seia, og korleis
- planleggja øving for alle
- Divvun-logo øverst på bannere og annet markedsføringsmateriale
Børre
- gtgramtools: parse .correct.txt.xml-filer
- corpustools:
- fikse problemer med at .tmx-filer skrives til feil plass
- problemer med parallelisering
- Møter med IGF
- sátni.org
- Lávdan sámi arena:
- GiellaLab
- Introduksjon til Divvun-verktøy på hotellet
- Kjøre Linda og Flammie til Alta
- KI-diskusjon på lørdag
- Avtalte å komme til Kautokeino i uke 35, i samband med studieoppstart
Framover:
- libdivvun 88 og 89
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Linda
- Kautokeino-presentasjon
- artikkelmøter med Maja og Flammie (Syntaxfest)
- sendte inn artikkelen (Syntaxfest)
- dependensanalyse av sma
- plakater til Helene Eira
- svarte Keoni
Sjur
- førebuingar for ny SME-medarbeidar
- rekneskap og rapport for NMR-prosjektet Nordisk LT for alle
- Kautokeino (reise, førebuingar, m.m.)
- enaresamisk TTS
- møte om skoltesamisk språkteknologi
- Borealium
- vedlikehaldsavtalen og utlysinga:
- svara på spørsmål
- byrja å sjå på tilboda som har kome inn
- TTS-tekstprosessering - betre no for alle språk
- abbr-ekspandering for SME
Framover:
Maja Lisa
- Presentasjon til Kautokeino m/Trond, Linda og Marja Liisa - Diedavahku Kautokeino - samtale om sma-ressurser
- artikkelmøte med Maja og Flammie (Ljubliana)
- dependensanalyse av sma
Todo:
- Artikkel: Adjektiv, 4-2-system +
Framover:
- TTS - tall
- Ny liste fra Gg - FST + dict
- Gramcheck - regler for bl.a pronomener
- Talesyntese og få denne til å fungere + hvordan bruke/implementere denne teknologien i hverdagen? - Smarthus jfr. - + se på diskusjonen i TTS-tråden om Aanna som ikke fungerer - talesyntesen funker iflg. Josefina
- halvveis avtalt pres. av Gramcheck for Gg-medlemmer - spikre datoen etter jul.
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- Lávdan/DutkanSápmi, presentasjoner etc.
- smn-TTS: leggt til en tekstfil med fraser (sano se saameksi)
- samarbeid YLE, API, debugging
- reiseregning
- Cristin
- Karelsk TTS material
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Necessary Innovations
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
- mobiltastaturrettingar
- TTS-oppdatering:
- fleirspråkleg syntesemodell (ein modell for alle språk)
- tal blir konverterte til tekst
- tekstprosesseringa uavhengig av syntesemodellen
- berre på API-servaren inntil vidare
- har levert fungerande prototype på ny grammatikkontroll i nettlesar
Framover
- pahkat-infra
- ny grammatikkontrollplugg
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samling etter sommaren: 25.-29.8.
Neste møte: tysdag 24.6. kl 10.00 norsk tid.