Divvun-møte 17.9.2024
Til stades: Katri, Sjur, Mikko, Flammie, Inga, Børre, Maja, Linda
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Mikko
Sjur
- bokmessa i Gøteborg - planlegging og materiale (faldar m.m.)
- møte med Arkivverket/Samisk arkiv
- møte om konferansen i Trondheim
- møte med Trond
- oppdaterte artikkel til MultiLingual - framleis att noko arbeid
- fleire møte med UNESCO-adhic-grupper
- nettdugnad om etikk og taleteknologi
Framover:
- EU-AI-act-høyring:
- frist i morgon
- kopi til digitaliseringsdep
- ta med Open Language og kvifor dette gjeld AI
- svar Keoni, vil testa mac-versjonen
- svar Daan
- send TTS-avtaletekst til UiT-jurist, treng engelsk versjon
Maja Lisa
- Forberedelse til Gøteborgsmessa - utfordrende oversetting
- lexc -retta opp i lexicon for gradbøying + lemma og missinlister (takk til Børre!)
- administrativt - svart mail: Kari Sommerseth
- artikkel -begynt å rette opp inkonsekvenser og legge til i fst:en.
Fremover:
-spørsmål om speechify - talesyntese-app -
- Forespørsel fra Gg: Forberede presentasjon om grammatikkontroll - Variasjon i negation og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
- Forberede presentasjon av talesyntese - Forberede sammen med Katri
- Missinglist fra Orre Testamente
- Missinglist fra 6 sma-masteravhandlinger
- tekstnormalisering for SMA (tal og forkortingar til tekst) - se sammen med Inga - lexc-arbeid
Børre
- Gøteborg: møter, oversettelser, korrektur
- Hjelpe med git og missinglister
- gtgramtools: fikse feil i xml-testingen
- jobbe med å fikse semver i lang-und-template, ingen løsning
Framover:
- oppdatera og reinska i innhaldet på divvun.no innen 25.09
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Inga
- Mye bokmesse
- Gramchecker, hovedsaklig numphraseregler
- FST: la til +Long tag på lange former av pronomen, gjøre gramchekregler?
- Plagdes med make check resultat: Børre fikser alt!
- Fikset stavekontroll-yaml
Fremover: Workshop på Árran?
Linda
- møte med Judithe, Tino, Flammie om tilpassing av disambiguator med Streamcommand
- møte med Judithe om grammarchecker feedback
- smj grammatikkontroll med Inga
- møte med Børre om gramtools
- fiksa noen av Duommá sine bugger for sme grammatikkontroll
- møte med Marja-Liisa
Katri
- Prosessert sma-material til treningkorpus, sjekket den inn til speech-sma-private
- Trener sma-tts
- lydprøver
- Value of voice Expert session måndag 10-12.30
- Summering: “If any data is out there on the internet, people will use it. No possilbity to regulate that. What you do with the data matters, you can’t stop people from taking it.”
- skrev en introduksjon til Finsk språkbanken om Divvun, arbeid med samisk taleteknologi…
- ASR Irja
- Maiju Saijets: mottatt mer data, vi må ordne avtale om bruk til TTS
- møte med Arkivverket
- NordForsk søknad -> neste rund
- reiseplanlegging
Framover/Ideer:
- Teste Divvun Manager på Windows, TTS
- Teste Divvun Dev Keyboard?
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Artikkel om TTS: evalueringstest i små språksamfunner er vanskelige
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Samarbeid med Kanada om TTS?
Flammie
- kal-versjoner og jobb med Trond og Judite
- telefonnummer i shared-mul og lang-smj
- fikser til generate-lemma testing
- libhfst-rust-bindings wip
TheTC
- har sagt opp vedlikehaldsavtala med heimel i
svensk konkurslovgjeving, er inne i ein
omstruktureringsprosess
Framover:
- Android: ny versjon av Divvun Dev er ute
- sjekk at stavekontrollane fungerer
- sjekk at alt anna fungerer
- om ok: => ny versjon av Divvun-tastaturet for Android
- Divvun Manager
- CLI for Páhkat på mac/windows
Necessary Innovations
- arbeider med TTS for iOS og macOS
- oppdatert TTS-motor tek mykje mindre plass
- vil ha ferdig ny TTS til Gøteborgsmessa, truleg
òg grammatikkontroll, men er avhengig av info
frå MS
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i MT-sida (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i nettstavekontrollen
- sjå over nettstavekontrollen:
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 26.-29.09.2024: Bokmässan (Göteborg)
- datamaskin til video
- høyretelefonar + desinfeksjon
- dei siste billettane
- “kurs”?
- henting og transport av trykt materiale og ståbanner
- noko interaktivt?
- andre enn Sjur?
- oppdatera divvun.no?
- 02.-03.10.2024: Lulesamisk språkseminar i Jokkmokk (Inga skal vise fram talesyntesen)
- 30.-31.10.2024: Minneseminar etter Anna Jacobsen
SMA-talesynteselansering (Maja, Katri, Sjur, Thomas og Ina Theres) (Hattfjelldal)
- 05.-06.11.2024: Språk og AI i Norden - for alle? (mange/alle?), presentera sørsamisk TTS (Trondheim)
- 06.–07.11.2024: SAALS6 (Helsingfors)
- 12.-15.11.2024: IIRC (Auckland)
- 29.11.2024 IWCLUL i helsingfors
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Sjur kanskje borte onsdag og torsdag denne veka.
Inga avspaserer 25.-26 sep.
Bør vi arrangera fleire release-partyar eller kurs på nettet? Kan kanskje nå fleire folk lettare på den måten. Målsetjing: nettseminar to gonger om året
Maja: F.eks nettseminar om språkteknologi, nyoppdatering av f.eks grammatikkontroll eller oppdatering av dict -lagt til nye ord og funksjoner i dict
Neste møte: tysdag 24.9. til vanleg tid.