Divvun-møte 13.5.2025
Til stades: Sjur, Katri, Flammie, Maja, Børre, Linda, Mikko
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Sjur
- Organiserte arbeid framover:
- Anna arbeid:
- ny vedlikehaldsavtale – offentleg utlysing
- rapportering til Nordisk mininsterråd
- SJE-oppdateringar for korrekt segmentering av klitisert kopula
- møte med KDD om IGF-25
- Giellalab-møte
Framover:
Maja Lisa
- Forberedelse til Kautokeino m/Linda, Flammi og Trond
- Error-markup med Linda og Flammi
- Artikkel med Linda (litt)
- 17 sma-barnebøker - Masse interessante feiltyper! f.eks 1) nekting og adj-systemet 2) kasusbruk vs. adposisjoner 3) possesive sufikkser 3) kondisjonalis (luvnem-lidtjie), aktive-passive, utnedh-hab, dem-num frase, bruken av de 8 pronomene
Todo (Nå):
- Artikkel: Adjektiv, 4-2-system med Trond
Framover:
- TTS - tall
- Ny liste fra Gg - FST + dict
- Gramcheck - regler for bl.a pronomener
- Talesyntese og få denne til å fungere + hvordan bruke/implementere denne teknologien i hverdagen? - Smarthus jfr. - + se på diskusjonen i TTS-tråden om Aanna som ikke fungerer - talesyntesen funker iflg. Josefina
- halvveis avtalt pres. av Gramcheck for Gg-medlemmer - spikre datoen etter jul.
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- Tidsskriftsartikkel om sme-TTS til SAALS6 proceedings: utvikling av sme-TTS og evalueringstest (Frist 31.5.)
- hentet hele Manin ja Danin-podcast fra NRK, prosesserer den slik at vi kan transkribere den
- Kahoot/Quiz til Giellalab
- Review til Speech Synthesis Workshop
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Flammie
- lemma tester i python
- glottolog id’s til språk
- möte om kautokeino
Børre
- python_tca2
- flytte over til divvun
- legge til tmx-output
- corpustools: bruk python_tca2, slett java-tca2
- lang-sme: gramatikkkontrolltester funker ikke, startet feilsøk
- oversettelser til UiT Machine Learning Group and SFI Visual Intelligence
- jobbe med IRC<->Zulip, må flytte maskin til moderne Linux-distro
- Facebook-posting om innovasjonsprisen
- søkt om ferie, meldt i fra på Zulip
Framover:
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
- Facebook-oppdatering (jubileum)
Mikko
Framover:
- artiklar etter Trondheims-konferansen
- prosjektrapport
- reiseregninger som ikke har blitt innsendt
Linda
- SAALS artikkel med Trond og Marja-Liisa
- sma-oppmerking med Maja
- Giellalab quiz
- Kautokeino-presentasjonsmøte
- irsk grammatikkontroll med Trond og Seanán
- reiseforskudd
- møte med Flammie
Necessary Innovations
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
Framover
- møte i dag
- pahkat-infra
- ny grammatikkontrollplugg
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samling etter sommaren: helst 18.-22.8. pga konferansar veka etterpå for Katri, Linda, Flammie.
Neste møte: tysdag 20.5. kl 10.00 norsk tid.