Divvun-møte 7.5.2025
Til stades: Sjur, Katri, Flammie, Maja, Børre, Linda
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Maja Lisa
- Planlegging til Gg-mötet med Linda og Lene
- DNorm/NotDNorm-lemma sammen med Siri - fölge opp
Todo (Nå):
- Artikkel: Adjektiv, 4-2-system med Trond
Framover:
- TTS - tall
- Ny liste fra Gg - FST + dict
- Gramcheck - regler for bl.a pronomener
- Talesyntese og få denne til å fungere + hvordan bruke/implementere denne teknologien i hverdagen? - Smarthus jfr. - + se på diskusjonen i TTS-tråden om Aanna som ikke fungerer - talesyntesen funker iflg. Josefina
- halvveis avtalt pres. av Gramcheck for Gg-medlemmer - spikre datoen etter jul.
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- Tidsskriftsartikkel om sme-TTS til SAALS6 proceedings: utvikling av sme-TTS og evalueringstest (Frist 31.5.)
- møte: Monthly: Sami voice recognition, AI and Nordic PBs and universities
- møte med NB om sme-Whisper
- sjekket karelsk TTS-data
- publisert sme-ASR testsett for evaluering av nye ASR-modeller i speech-sme
- mye e-post-konsultering
- hentet hele Manin ja Danin-podcast fra NRK så at vi kan transkribere den
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language identification), kan brukes til å filtrere norsk material (tekst) ut fra t.ex. sametingets plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Flammie
- omorganisering av test:
- en ny paradigm test i
src/fst/morphology/test - hjelpade folk med ports og gmake osv
framover:
- lemma tester i python (generate/accept-lemma)
Børre
- Møte med ÅSV (Åarjelsaemien vierhtiesåafoe)
- Møte med Gïelegaaltije
- Rydding i python_tca2
- Reiseregninger
- TermWikiTools: skrive lister for sme, not sma, med hjelpespråk
Framover:
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
- Facebook-oppdateringar (jubileum + pris)
Mikko
Framover:
- artiklar etter Trondheims-konferansen
- prosjektrapport
- møte ang. budsjett
- reiseregninger som ikke har blitt innsendt
Linda
- forbereda presentasjon for sma GG med Maja
- møte med sma GG
- 2 møter om CG bugger med Kevin
- fiksa både sma og sme bugger
- artikkelmøte med Trond og Marja-Liisa (SAALS)
- reisebestilling
- feriesøknad
Sjur
- omorganisering av
test/i langs:- Empty
$ROOT/testing/dir (i lag med Trond)
- Empty
- Anna arbeid:
- sma-GG-møte
- prata med Yngvil Beyer på NB
- møte med NB/Javier
- møte med KDD om sidearrangement på Lillestrøm-konferanse
- utlysing av vedlikehaldsavtale
- møte med NRK m.fl. om samiske taledata
- rydda i gamle møtedokument
- møte med Arkivverket om metadata for audiovisuelle data
Framover:
- svar Daan
Necessary Innovations
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
Framover
- pahkat-infra
- ny grammatikkontrollplugg
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 13.-14.5.2025 Språksentermøte i Alta
- 09.-15.06.2025 Lávdan Sámi Arena (Kautokeino)
- ca 26.6.2025 20th Annual Meeting of the Internet Governance Forum (IGF-2025) (Lillestrøm):
- Hovudside
- Registreringsside (frist: 1. juni, 1731 registrerte deltakarar så langt)
- KDD lagar eit sidearrangement der, Sjur er med og planlegg programmet, Divvun bør delta
- 18.–23.08.2025 CIFU — Congressus XIV Internationalis Fenno-Ugristarum (Tartu, Estland)
- 25.-26.8.2025 Speech Synthesis Workshop (Leeuwarden)
- 26.-29.08.2025: syntaxfest
- 2.-3.10.2025 SKY symposium, Tampere
- 22.-24.10.2025 The 22nd Annual EFNIL Conference i Wien — «Language Norms and Linguistic Justice in a Multilingual World», innlegg om Open Language og plattformtilgang for normative verktøy for alle europeiske språk
- seinare: sigmorphon eller andre tba
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Neste møte: tysdag 13.5. kl 10.00 norsk tid.