Divvun-møte 17.12.2024
Til stades: Sjur, Flammie, Mikko, Katri, Linda, Maja, Børre, Inga
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Inga
- Missing fra Anta Pirak - lemma, ordformer og bøyninger fst
- Endra -stit verb til egne lexicon for ikke å få doble analyser
- Dálla ja dalloj
- Scannet bok for OCR og sendt til Børre
- Gramchecker
- Reiseregning og styr med reiseforsikring - Trondheim
- Hjulpet språksenteret på Árran med TTS på mac
- Testet TTS og rapportert issue
- Deltok på seminar i Kiruna som Spårkcentrum arrangerte
Fremover:
- Siste fiksing av flagg som bestemmer kasus på 100, 1000, 10 000, 1 000 000, 1 000 000 000
Linda
- søknadsmøte med Judithe
- fiksa en word order regel for kal
- testa kal grammatikkontroll i Word
- førebudd føredrag om NZ-reisa med Maja
- flere artikkelmøter med Kevin om CG-dokumentasjon
- jobba med falske positiver for sme grammatikkontroll
- CG-workshop med Inga (smj grammatikkontroll)
- Nodalida-workshop planlegging med Flammie og Trond
Framover:
- presentera IIRC for oss andre måndag 18.12. kl 1300 norsk tid.
Mikko
- reiseregninger, registrering av eksterne
- samle presentasjonene fra konferansen i Trondheim
Sjur
- grammatikkontrolltesting
- kontrakt for Duommá
- siste møte med Arkivverket/Samisk arkiv
- litt API-dokumentasjon
- feilsøking for å hjelpa Trond
- oppdaterte grønlandsk grammatikkontroll
Framover:
Maja Lisa
- oppsummering/presentasjon med Linda + gode saker til diskusjon til onsdag 18.12
- nye termer fra Gg + rettinger på dict fra Gg-Siri - liste på dette + masse bra tilbakemelding fra Lene og Berit Merete på dict - må redigere!
- testing av Gramcheck i Google docs - funker ikke
- Planlegging av Divvun-jubileum
Framover:
- Talesyntese og få denne til å fungere + hvordan bruke/implementere denne teknologien i hverdagen? - Smarthus jfr. - Josefina/Nils Johan spør + se på diskusjonen i TTS-tråden om Aanna som ikke fungerer
- halvveis avtalt pres. av Gramcheck for Gg-medlemmer - spikre datoen etter jul.
- Interessante ASR-resultat: legge til Err/Orthformer f.eks for “tjoeredh”? Hvordan er dagens språk jfr. f.eks AJ:s?
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- transkriberer nordsamisk datasett – 80% transkribert av 10 timer
- fortsatt med artikkelskriving om sørsamisk TTS-prosjektet (dokumentasjon) – savner medforfattere: https://www.overleaf.com/4318457146csvdcxkntvns#974bb6
- møte med SEG Deatnu om Samisk AI – Presentasjon om taleteknologi i Divvun
- utvikler bedre skripter for lydprosessering
- samarbeid med NB, begynnelse av sma-ASR?
- Arkivverket: POC og avslutningsmøter
- Lene
Framover/Ideer:
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Artikkel om TTS: evalueringstest i små språksamfunner er vanskelige
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Samarbeid med Kanada om TTS?
Flammie
- emojis i shared-mul: oppdatere shared-mul med giella-core om dere ikke vanligvis gör det sammen
- fikser til bygging av feilmodell i stavekontroll https://github.com/giellalt/lang-tkl/issues/1
- begynte med nodalida artikkel
- nodalida workshop organisering
Børre
- Östersund:
- sørsamisk språkkonferanse
- installasjon av Divvun-verktøy
- elektroniske ordbøker, samamrbeid med Språkcentrum?
- borealium, finne ut av synkronisering mellom Pontoon og git-repo
- Rettssymposium (Samisk rettsspråk). Ser ut til at myndighetene skal satse på dette.
- oppdatere innhold på sátni.org
- satni-backend: jobbe med å bytte bort nåværende database-løsning
Framover:
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Necessary Innovations
- private repo kan no byggjast i CI
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i MT-sida (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i nettstavekontrollen
- sjå over nettstavekontrollen:
Divvun-jubileum
- på nyåret - det er alt for usikkert i desember
- kavalkade over det vi har gjort
- invitera nokon utanfrå til å seia noko om:
- bruken av verktøya
- nytte for samfunnet
- gjester ved UiT, men òg strøyma slik at andre kan fylgja med
- invitera alle som har jobba i Divvun + folk frå SD og KDD + rektor
- middag
- pressemelding og mediedekning
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 24.-26.02.2025: LT4All 2.0 (Paris)
- 02.–05.03.2025: nodalida (https://www.nodalida-bhlt2025.eu/conference), October 21, 2024: Paper submission deadline
- 03.-04.03.2025: Computel. «We invite submissions to the 8th workshop on the Use of Computational Methods in the Study of Endangered Languages, by October 7, 2024.»
-
- eller 26.3.2025: Divvun-jubileum (Tromsø)
- 09.-15.06.2025: Lávdan Sámi Arena (Kautokeino) — vil vi vera med? Abstract Submission Deadline: January 31th, 2025
- 17-21.8.2025: Interspeech (Rotterdam) https://www.interspeech2025.org/home
- 25.-26.8.2025 Speech Synthesis Workshop (Leeuwarden)
https://blogs.helsinki.fi/ssw13-2025/
- 18.–23.08.2025 CIFU — Congressus XIV Internationalis Fenno-Ugristarum (Tartu, Estland)
- 26.-29.08.2025: syntaxfest
- seinare: sigmorphon eller andre tba
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Neste møte: tysdag 7.1. til vanleg tid.