Divvun-møte 1.7.2025
Til stades: Katri, Linda, Børre Språk: davvisámegillii
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Børre
- Internet governance forum Lillestrømas
- lang-sme
- čoahkkin testendábiid birra
- make check iská dušše PASS
- Bargen testenváttisvuođaiguin
- divvun-phon-meattáhusat: 88 ja 89
Boahtteáiggis:
- libdivvun 88 og 89
- rette feil i borealium
- få pontoon til å virkelig synkronisere
- Borealium1.1/Nordisk ministerråd:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Linda
- søknadsmøte med Trond (NORDPLUS)
- čoahkkin Marja-Liissain (smn fst lohkosánit)
- lang-sme GramDivvun (Duommá buggat)
- buggat Kevinii (evttohusat mannet endorii)
- gramtool čoahkkin Børriin
- čoahkkin Catheriniin
Katri
- sme-ASR: bygger ny datasett, mye arbeid med å rense transkripsjoner
- hentet og prosessert ny material for transkribering (NRK)
- Karelsk TTS material - går gjennom transkriberinger med lyd
- Speech synthesis workshop: artikkelreview
- ny demo med 6-språkig TTS-modell https://huggingface.co/spaces/divvun-tts/6L-TTS
- møte med NB
Framover/Ideer:
- Undersøker en mulighet for å få GUI for Whisper-modeller
- Undersøker TTS til Anki (språklæringssapp) via API
- NB: nordic automatic LID (language identification), kan brukes til å filtrere norsk material (tekst) ut fra t.ex. sametingets plenumaudio?
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
Necessary Innovations
- CI-serveroppsett. Mål: å kvitta seg med Taskcluster og få enklare administrasjon og vedlikehald
- mobiltastaturrettingar
- TTS-oppdatering:
- fleirspråkleg syntesemodell (ein modell for alle språk)
- tal blir konverterte til tekst
- tekstprosesseringa uavhengig av syntesemodellen
- berre på API-servaren inntil vidare
- har levert fungerande prototype på ny grammatikkontroll i nettlesar
Framover
- pahkat-infra
- ny grammatikkontrollplugg
- nytt installeringsprogram
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 18.–23.08.2025 CIFU — Congressus XIV Internationalis Fenno-Ugristarum (Tartu, Estland)
- 25.-26.8.2025 Speech Synthesis Workshop (Leeuwarden)
- 26.-29.08.2025: syntaxfest
- 2.-3.10.2025 SKY symposium, Tampere
- 22.-24.10.2025 The 22nd Annual EFNIL Conference i Wien — «Language Norms and Linguistic Justice in a Multilingual World», innlegg om Open Language og plattformtilgang for normative verktøy for alle europeiske språk
- RANLP-2025 workshops:
- 4.-5.12.2025: ISL-personalseminar
- 10.–12..12.2025 https://acl-sigur.github.io/iwclul2025.html IWCLUL
- seinare: sigmorphon eller andre tba
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Divvun-samling etter sommaren: 25.-29.8.
Neste møte: tysdag 5.8. kl 10.00 norsk tid.