Divvun-møte 29.10.2024
Til stades: Sjur, Flammie, Linda, Inga, Børre, Mikko, Maja
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Inga
- SAALS6-presentasjon med Linda: Flammie har hentet ut numphrases og jeg har grovsortert bort det som likevel ikke er numphrase
- Gramcheck: forbedret numphrase-regler etter nye kasusendelser på Arab
- Gramcheck: Nye yaml for datoer (1.mai)
- Testet TTS på mac
- endre å>á i bok (spørs om det er verdt det)
- forelesning av Olle Kejonen
Maja Lisa
- abbr-normalisering for TTS
- kome ca halvvegs, noen spörsmål:
- IIRC-presentasjon med Linda: markup,språklige henvendelser, laget statistikk - begynt å få overblikk over typiske feiltyper i sma
- Komplex feiltype, pronomen
- talesyntesepresentasjonen for Hattfjelldalen m.m med Katri
- Språkhenvendelse i forb. med Aanna100-konferansen - introtekst
- -praktiske saker; DFÖ, reisebestillinger etc.
Fremover:
- tekstnormalisering for SMA (tal og forkortingar til tekst) m/ Inga
- Forberede presentasjon av talesyntese - Forberede sammen med Katri
- spørsmål om speechify - talesyntese-app
- Missinglist fra Orre Testamente - endringer i lexiconer
- Missinglist fra 6 sma-masteravhandlinger - endringer i lexiconer
- Se sammen med Inga - lexc-arbeid
- Foreberede pres. av lånetilpassinger - hva er vedtatt og hvor er det fortsatt stor variasjon?
- Forberede pres. av GramDivvun - også fra GG: Forberede presentasjon om grammatikkontroll - Variasjon i negasjon og adj-systemer - en faktor til språksperre? Forberede sammen med Linda
Katri
Framover/Ideer:
- Teste Divvun Manager på Windows, TTS
- Teste Divvun Dev Keyboard?
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Artikkel om TTS: evalueringstest i små språksamfunner er vanskelige
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Samarbeid med Kanada om TTS?
Flammie
- sendte artiklar
- jobb med presentasjon og poster
- överallt debugging med smj og smi tall og
Sjur
- konferansen i Trondheim
- borealium
- Samisk arkiv/Arkivverket
Framover:
- svar Keoni, vil testa mac-versjonen
- svar Daan
Børre
- ocr og manuell retting av bok fra Inga
- melding om problemer med Divvun Manager og Microsoft arm-prosessor fra norsk side
- borealium.org
- ordnet med beskrivelse av språk
- oversette
- språkkode-endring: yid -> yi
- Pontoon
- gjennomgang av Pontoon sammen med Sjur
- hvordan oppdateres referansespråk: fikses i git, plukkes opp av Pontoon
- TODO: git-krok som fjerner oversettelser fra andre filer når referansespråk endres
- fikse yid, ble til yi (etter feilmelding fra ISOF)
- fikse GiellaLTGramTools
- få interne tester til å passe fungere igjen
- fikse regresjon i håndtering av anførselstegn (bugmelding fra Duommá)
- få på plass parallelprosessering, uformell sjekking av tider på store filer
- begynne med å implementere henting av tester fra grammarchecker.cg3 (korrekte/ukorrekt par og korrekte setninger som ikke skal rettes)
- Parallelprosessering av grammatikktester. Sjekker tider på
make check
i lang-smj og lang-sme.
- lang-sme
- jobbe med -PASS/-FAIL i egen grein
- melde om forskjell i smegram og smegram-dev
- git bisect for å sjekke når committen ble gjort der smegram og smegram-dev skilte lag.
- TermWiki: Fikse navn på samling
Framover:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Linda
- møteuke med Marja-Liisa og Trond (SAALS presentasjon)
- møter med Maja - presentasjon iirc
- SAALS presentasjon med Inga
- møter med Flammie
- CG-møter med Kevin - dokumentasjon/artikkel
- reviewer til COLING, IWCLUL og COMPUTEL
- sme GramDivvun bugfiksing
- planleggingsmøte med Judithe og Trond
Mikko
- bestilling av kontrakt og reise for tolk
- planlegging av livepodkasten med NRK
- møte om konferansen
Necessary Innovations
- ny versjon av TTS for sme og smj ute
- fiksar problem med ikkje-ASCII-bokstavar
- fiksar problem med xml-element som blir ein del av den opplesne teksten
- arbeider med TTS for macOS
- arbeider med kart istf knappar for framsida av borealium.org
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i MT-sida (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i nettstavekontrollen
- sjå over nettstavekontrollen:
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 30.-31.10.2024: Minneseminar etter Anna Jacobsen
SMA-talesynteselansering (Maja, Katri, Sjur, Thomas og Ina Theres) (Hattfjelldal)
- 05.-06.11.2024: Språk og AI i Norden - for alle? (mange/alle?), presentera sørsamisk TTS (Trondheim)
- 06.–07.11.2024: SAALS6 (Helsingfors)
- 12.-15.11.2024: IIRC (Auckland, NZ)
- 29.11.2024 IWCLUL i Helsingfors (Tidsfrist: 20.10.)
- 09.-13.12.2024 Divvunsamling i Tromsø
- 24.-26.2.2025: LT4All 2.0 (Paris)
- 2.–5.3.2025: nodalida (https://www.nodalida-bhlt2025.eu/conference), October 21, 2024 Paper submission deadline
- 3.-4.3.2025: Computel. «We invite submissions to the 8th workshop on the Use of Computational Methods in the Study of Endangered Languages, by October 7, 2024.»
- 18.–23.08.2025 CIFU — Congressus XIV Internationalis Fenno-Ugristarum (Tartu, Estland)
- 26.-29.8.2025: syntaxfest
- seinare: sigmorphon eller andre tba
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Neste Divvun-samling 9.-13.12.2024.
Neste møte: tysdag 12.11. til vanleg tid.