Divvun-møte 25.3.2025
Til stades: Katri, Maja Lisa, Børre, Sjur, Linda, Flammie, Mikko
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Børre
- Møte med LearnLabs om AI
- TermWikiTools: sjekke og undersøke installasjon, gjøre endringer for å få den installerbar
- Forberedelser til Divvun-jubileet
- grammatikkontroll: røre ting i sme, sma og smn
- statistikk om sátni.org til Sjur
- lage Folkuniversitetetliste til GG
- jobbe med korpusdokumentasjon
- crawle nrk.no, konvertere og parallelisere
- møter (Divvun-uke): zulip, automatisere korp, jubileum
- intervju med SR Sápmi om Divvun-jubileum
- lang-sme: bruke analysatorer via divvun-checker for å analysere korpus
Framover:
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Linda
- artikkelmøte med Flammie (Universal Dependencies)
- irsk grammatikkontroll med Seanán
- planleggingsmøte med TartuNLP folk om samarbeid om maskinlæringsbasert oversetting
- CG-møte med Maja
- nye regler til sma-grammatikkontroll
- reiseregning
- fst arbeid med Trond
- artikkelarbeid med Marja-Liisa
- divvun-jubileum
Mikko
- Reiseregninger Trondheim
- middag til jubileet
- reisebestilling for tre personar
Framover:
- Divvun-jubileet
- artiklar etter Trondheims-konferansen
Sjur
- Divvun-jubileet:
- alt klart
- testa tolking og teknisk opplegg
- byrja på presentasjonen min
- Ymse/admin:
- rekneskap og budsjett, årsrapport - møte og skriving
- reiserekningar
- møte om Zulip
- møte om automatisk korpusbygging/-konvertering
Framover:
Maja Lisa
- pres. til Tärnaby, men ble avlyst, men reiste likevel til Hattfjelldal
- gode møter - taleteknologi, stavekontroll og grammatikkontroll, ordbøker (minnefunksjon?) + analysere tekst
- Divvun-jubileum - sørsamisk klar
- litt lemmaarbeid -
- litt artikkel adjektiv -
- reiseregning - praktisk arbeid
Todo (Nå):
- Følge opp artikkelen med Katri, Thomas, Sjur
- Mark-up-møte med Linda + artikkelen
- 4-2 -system med Trond
Framover:
- TTS - tall
- Ny liste fra Gg - FST + dict
- Gramcheck - regler for bl.a pronomener
- Talesyntese og få denne til å fungere + hvordan bruke/implementere denne teknologien i hverdagen? - Smarthus jfr. - + se på diskusjonen i TTS-tråden om Aanna som ikke fungerer - talesyntesen funker iflg. Josefina
- halvveis avtalt pres. av Gramcheck for Gg-medlemmer - spikre datoen etter jul.
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- reise & møter
- Tidsskriftsartikkel om sme-TTS til SAALS6 proceedings: utvikling av TTS og evalueringstest
- multi-sami TTS & artikkel: mer utvikling, språkgjenkjenning, mer språk og stemmer, ska bli en artikkel og presentasjoner (Fonetiikan päivät & Speech Synthesis Workshop)
- ny TTS evaluering for sme med setninger med kodeveksling/lånord
- eksperiment med mannlig sma-stemme
- sørsamisk TTS artikkel –– finaliserer artikkelen
- stemmeavtale for TTS 100% ferdig, har også sendt prosessert materiale tilbake til stemmen
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Flammie
- fleire ny tastatur og langs fra Jack
- den melding om mac os x gnu make blir en fatal feil
- möter
framover:
Inga
Framover:
- Siste fiksing av flagg som bestemmer kasus på 100, 1000, 10 000, 1 000 000, 1 000 000 000
Necessary Innovations
- oppdatert iOS-tastaturet, ny versjon ute
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
- pahkat-infra
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Neste møte: tysdag 1.4. til vanleg tid.