Divvun-møte 8.4.2025
Til stades: Sjur, Katri, Børre, Linda, Flammie
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Linda
- artikkelmøter med Flammie
- fst sammen med Trond
- sma oppmerking med Maja
- fokus på regelskriving/-finpussing sma-grammatikkontroll
- prisutdeling
- ansettelsesarbeid
Børre
- corpustools: bruk divvun-checker og zpipe fra lang-xxx istedet for hjemmestrikket modes.xml
lang-XXXsom følge av endringen ovenfor- fjerne
korp.cg3fra alle repoer, strømlinjeforming av korpusanalyse - korp-analyser inn i
lang-XXX/tools/analyser/pipespec.xml.in - altorth-tokenisers
- fjerne
- python_tca2: opprydding
- bytte sertifikat på satni.uit.no
Framover:
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
- Facebook-oppdateringar
Mikko
- Reiseregninger Trondheim
- Reiseregninger i forbindelse med jubileet
Framover:
- artiklar etter Trondheims-konferansen
- prosjektrapport
Sjur
- årsrapport til KDD
- jubileumsførebuingar og jubileum
- presentasjon for jubileseminaret
- møte med den nye statssekretæren
- møte med KDD
- presentasjon av Borealium.org for nordiske språkfolk på Hanaholmen i Helsingfors/Esbo
- førebuingar for prisseremoni
- arbeidsintervju og referanseintervju for nordsamisk lingvist, med førebuingar og etterarbeid
- møte med NRK og andre om samiske taledata i arkiva deira
- feilsøking og rapportering for ein feil i Borealium
Framover:
- svar Daan
Maja Lisa
- Oppretting i feilretting (subj_verbal_kongruens + numeraler)
- Gramcheck-möter med Linda
- Feiring av pris! <3 spiste middag :-)
Todo (Nå):
- Følge opp artikkelen med Katri, Thomas, Sjur
- Mark-up-møte med Linda + artikkelen
- 4-2 -system med Trond
Framover:
- TTS - tall
- Ny liste fra Gg - FST + dict
- Gramcheck - regler for bl.a pronomener
- Talesyntese og få denne til å fungere + hvordan bruke/implementere denne teknologien i hverdagen? - Smarthus jfr. - + se på diskusjonen i TTS-tråden om Aanna som ikke fungerer - talesyntesen funker iflg. Josefina
- halvveis avtalt pres. av Gramcheck for Gg-medlemmer - spikre datoen etter jul.
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- Monthly møte: Sami voice recognition, AI and Nordic PBs and universities.
- Tidsskriftsartikkel om sme-TTS til SAALS6 proceedings: utvikling av TTS og evalueringstest
- multi-sami TTS & artikkel: mer utvikling, språkgjenkjenning, mer språk og stemmer, ska bli en artikkel og presentasjoner (Fonetiikan päivät & Speech Synthesis Workshop)
- ny TTS evaluering for sme med setninger med kodeveksling/lånord
- evaluering med “voice transfer” stemmer for smj
- sendt inn sørsamisk TTS-artikkel og abstrakt av multilingual TTS
- samarbeid med YLE om TTS
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language identification), kan brukes til å filtrere norsk material (tekst) ut fra t.ex. sametingets plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Instagram-oppdateringar
Flammie
- stötte til xerox og xfst er bort
- fikser til alt orth bygging
- var bort fra torsdag–fredag
- artikkelarbeid
Inga
Framover:
- Siste fiksing av flagg som bestemmer kasus på 100, 1000, 10 000, 1 000 000, 1 000 000 000
Necessary Innovations
- Windows-signering fungerer ikkje
- sertifikatet gamalt
- Brendan arbeider med å fornya det
- oppdaterte dev-mobiltastatura
- feilrettingar for borealium og grammatikkontrollen
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
- pahkat-infra
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 24.-25.4.2025 Fonetiikan päivät Turku Finland (Katri)
- 6.-7.5.2025 GG-sørsamisk i Tromsø?
- 13.-14.5.2025 Språksentermøte i Alta
- 09.-15.06.2025 Lávdan Sámi Arena (Kautokeino)
- ca 26.6.2025 KDD med på konferanse på Lillestrøm, nokre frå oss bør vera med
- 25.-26.8.2025 Speech Synthesis Workshop (Leeuwarden)
- 18.–23.08.2025 CIFU — Congressus XIV Internationalis Fenno-Ugristarum (Tartu, Estland)
- 26.-29.08.2025: syntaxfest
- 2.-3.10.2025 SKY symposium, Tampere
- 22.-24.10.2025 The 22nd Annual EFNIL Conference i Wien — «Language Norms and Linguistic Justice in a Multilingual World», innlegg om Open Language og plattformtilgang for normative verktøy for alle europeiske språk
- seinare: sigmorphon eller andre tba
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Neste møte: tysdag 15.4. kl 10.00 norsk tid.