Divvun-møte 22.10.2024
Til stades: Sjur, Flammie, Linda, Inga, Børre, Mikko, Katri, Maja
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Maja Lisa
- abbr-normalisering for TTS
- grammatikkontrollpresentasjon
- feiltypar, særleg pronomen
- talesyntesepresentasjonen for Hattfjelldalen m.m.
- Borealium-omsetjing
Fremover:
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- Forberede presentasjon av talesyntese - Forberede sammen med Katri
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
- møter med AI mater, Maja, Arkivverket
- presentasjon sørsamisk TTS-lansering (Hattfjelldal & Trondheim)
- presentasjon til SAALS6
- Modeller til Brendan
- Ny material lastet ned og diarisert til sørsamisk ASR – en annen NRK podcast, Hævvi
- Planleggt ny artikkel til Speech Synthesis Workshop i August 2025
- hjalp Maja med presentasjonen
Framover/Ideer:
- Teste Divvun Manager på Windows, TTS
- Teste Divvun Dev Keyboard?
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Artikkel om TTS: evalueringstest i små språksamfunner er vanskelige
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Samarbeid med Kanada om TTS?
Flammie
- shared-smi tall og böjing med inga
- iwclul artikeljobb
- cg workshop
- nodalida artikkel
Sjur
- konferansen i Trondheim
- borealium
- normalisering for SMA
- utlysinga av stillinga som nordsamisk lingvist
- Samisk arkiv/Arkivverket
- Acta Borealia
- Open Language-dokumentasjon
- møte med AI Mater
Framover:
- svar Keoni, vil testa mac-versjonen
- svar Daan
Børre
- Melding om plakat til astin24
- borealium
- Få resources i borealium til å bli oversettbar i Pontoon
- møte med Sjur og andre om borealium. Alle filer borte!
- ordne grunnen til at borealium-core hadde mistet alle oversettelsene
- sme-oversettelser på Pontoon
- fikse dokumentasjon og hjelpetekster i GiellaLTGramTools
- TermWikiTools
- Gjøre det mulig å flette Excel-lister med eksisterende innhold
- flere oppryddingsverktøy til TermWikien
- Jobbe med sms-liste til TermWikien
- Påviste duplikater
- Rydde opp i TermWikien
- Konvertere og flette sms-liste inn i TermWikien
- ocr-et bok fra Inga
Framover:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Inga
- Nye kasusendelser for arab numerals via flagg (GG har normert “nye”) - Flammie har hjulpet!
- SAALS6-presentasjon med Linda: Flammie har hentet ut numphrases og jeg har grovsortert bort det som likevel ikke er numphrase
- Forelesning om talesyntese via Árran - giellavahkko
- Gramcheck: forbedret numphrase-regler etter nye kasusendelser på Arab
- Gramcheck: Nye regler for datoer (1.mai)
- Utlysning (Møte Sjur og Linda)
- Mye kontakt med brukere da jeg var i Tysfjord
- Testet TTS på windows, også NVDA
- bok sammen med Børre
- reisebestilling Trondheim
Linda
- møter med Inga
- møter med Maja - presentasjon iirc
- møter med Marja-Liisa - presentasjon iirc
- møter med Flammie - computel
- SAALS presentasjon med Inga
- CG-møter med Kevin
- ansettelsesmøte med Sjur og Inga
- reviewer
- hjalp Maja med presentasjonen
- flere Nodalida CG-workshop møte med Flammie og Trond
Mikko
- planlegging av bevertning til konferansen med Karolina Storesund fra NTNU
- sett på budsjettet
Necessary Innovations
- ny versjon av TTS for sme og smj ute
- fiksar problem med ikkje-ASCII-bokstavar
- fiksar problem med xml-element som blir ein del av den opplesne teksten
- arbeider med TTS for macOS
- arbeider med kart istf knappar for framsida av borealium.org
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i MT-sida (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i nettstavekontrollen
- sjå over nettstavekontrollen:
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 30.-31.10.2024: Minneseminar etter Anna Jacobsen
SMA-talesynteselansering (Maja, Katri, Sjur, Thomas og Ina Theres) (Hattfjelldal)
- 05.-06.11.2024: Språk og AI i Norden - for alle? (mange/alle?), presentera sørsamisk TTS (Trondheim)
- 06.–07.11.2024: SAALS6 (Helsingfors)
- 12.-15.11.2024: IIRC (Auckland, NZ)
- 29.11.2024 IWCLUL i Helsingfors (Tidsfrist: 20.10.)
- 24.-26.2.2025: LT4All 2.0 (Paris)
- 2.–5.3.2025: nodalida (https://www.nodalida-bhlt2025.eu/conference), October 21, 2024 Paper submission deadline
- 3.-4.3.2025: Computel. «We invite submissions to the 8th workshop on the Use of Computational Methods in the Study of Endangered Languages, by October 7, 2024.»
- 18.–23.08.2025 CIFU — Congressus XIV Internationalis Fenno-Ugristarum (Tartu, Estland)
- seinare: UD Workshop eller sigmorphon eller andre tba
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Neste møte: tysdag 29.10. til vanleg tid.