Divvun-møte 4.12.2024
Til stades: Sjur, Flammie, Mikko, Katri, Linda, Maja
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Mikko
- reiseregninger, registrering av eksterne
- innkjøpsordre
Sjur
- borealium.org:
- Samisk arkiv/Arkivverket
- smj-twolc
- IWCLUL
- lønskrav
- kontrakt for Duommá for neste år
Framover:
Maja Lisa
- Reiseregning + dfø
- Orakel, omtart på maskina - problemer med å få mail
- lyttet til Samerettssymposiet 2024, Universitetet i Oslo –> Majas mening: Lulesamisk og Sørsamisk må sees på som egne språk, med egne utfordringer
- Teams-møte med Morten Olsen Haugen og August Sjøvoll om sørsamiske oversettingsstrategier - ny oversettingsworkshop for litteratur over til sørsamisk under emning.
- Spørsmål om talesyntese som ikke fungerer
- sjuk i to dager og hele helga ødelagt
- Nytt lexicon for tjoeredh?
- Lagerkrantz hadde tjoeveridh som eneste, og klare, variant under sitt besøk i 1923 bla. Oldeforeldregenerasjon og besteforeldregenerasjon klar variant -men, så er det foreldregenerasjon og min generasjon:
Vi sier mange av oss “tjoeroe” i 3.p.sg. Her skjer det en bortfall av -v- . Mange blir forvirra av denne og tror vi henter paradigmet fra “tjearodh” - det er så mange like diftonger, f.eks “æ” og “ae”, som for mange av min generasjon nå faller sammen! Det andre er
“åa” og “ua”
“æ” og “ae”
Dette med bortfall av -v- og -j- er et tilbakevendende spørsmål, det “verste” er likevel f.eks dette:
En tredje er stryking av -j- som er selveste flertallsmarkeringen i den gamle skrivemåten:
Framover:
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- fortsatt med artikkelskriving om sørsamisk TTS-prosjektet (dokumentasjon)
- prosessert del av nytt material (samtaler fra DigiSami) til nordsamisk ASR
- møte med Arkivverket x2
- møte med nordisk samarbeidere
- transkriberer nordsamisk datasett – 30% transkribert av 10 timer
- fant nytt sme-taledata fra Yle Arkiv, mange, mange timer
- hjelpte Irja med mange ting
Framover/Ideer:
- Teste NVDA på Win
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Artikkel om TTS: evalueringstest i små språksamfunner er vanskelige
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Samarbeid med Kanada om TTS?
Flammie
Børre
Framover:
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Linda
- IIRC / Aotearoa
- SAALS / Helsingfors
Framover:
- presentera IIRC for oss andre måndag 16.12. kl 1300 norsk tid.
Necessary Innovations
- grammatikkontroll
- anna smårusk
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i MT-sida (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i nettstavekontrollen
- sjå over nettstavekontrollen:
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 24.-26.02.2025: LT4All 2.0 (Paris)
- 02.–05.03.2025: nodalida (https://www.nodalida-bhlt2025.eu/conference), October 21, 2024: Paper submission deadline
- 03.-04.03.2025: Computel. «We invite submissions to the 8th workshop on the Use of Computational Methods in the Study of Endangered Languages, by October 7, 2024.»
- 09.-15.06.2025: Lávdan Sámi Arena (Kautokeino) — vil vi vera med?
- 17-21.8.2025: Interspeech (Rotterdam) https://www.interspeech2025.org/home
- 25.-26.8.2025 Speech Synthesis Workshop (Leeuwarden)
https://blogs.helsinki.fi/ssw13-2025/
- 18.–23.08.2025 CIFU — Congressus XIV Internationalis Fenno-Ugristarum (Tartu, Estland)
- 26.-29.08.2025: syntaxfest
- seinare: sigmorphon eller andre tba
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-jubileum:
- på nyåret - det er alt for usikkert i desember
- kavalkade over det vi har gjort
- invitera nokon utanfrå til å seia noko om:
- bruken av verktøya
- nytte for samfunnet
- gjester ved UiT, men òg strøyma slik at andre kan fylgja med
- invitera alle som har jobba i Divvun + folk frå SD og KDD
- middag
- pressemelding og mediedekning
Fyrste planleggingsmøte måndag 9.12.2024 kl 13.00 norsk tid.
Neste møte: tysdag 10.12. til vanleg tid.