Divvun-møte 14.3.2023
Til stades: Sjur, Flammie, Katri, Børre, Linda, Inga
Saker:
- Sidan sist
- Taleteknologiseminar
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Flammie
Framover:
- artikkel til nodalida-minoritetsworkshop, tekstprosessering for taleteknologi (overleaf-lenke i zulip)
- divvunspell cree
- Brendan kan hjelpe med divvunspell/32
Katri
- Nodalida artikkel med Sjur og Flammie
- sametingets taledata: språkgjenkjenning (norsk/samisk) med Speechbrain
- planlegging til nye sme-tts opptak: mikrofon, prompter, tekster med Børre…
- endringer til reiseplan
Framover:
- sme-materialer til Risten (er allerede i OneDrive & github)
- se mer om common voice
- ASR output: Store bokstaver, punktum etc.? Se finsk whisper: More info about the casing+punctuation correction model can be found here
- Overflow-tts?
- info on Whisper transcription og diarization: (Whisper)
Maja Lisa
- møte med Linda to ganger
- jobbet for det meste med mark-up, tar lengre tid enn forventet
- snakket med lena Kappfjell, hun ønsker snarlig møte med oss
Framover:
- Fremover: Legge til flere ex-setninger til yaml-tester, teste etc
- markup
- Fremover: Jobbe med A.J-lydfiler + kommunisere videre om det resterende matierialet
- artikkel om adjektiv - hvorfor viktig å ha en standard og norm?
- Typisk feil: daltese - legge til “daltesne”, “aajegesne” etc. som Err/Orth-tagg i fortsettelseslexiconet N_ODD,for illativ, inessiv og ellativ - Diskuter med Trond og Sjur
- Luobbal Sammol-artikkel + Partikler/Adverb og Tronds artikkel
Linda
- datacrash og bestilling av ny datamaskin
- nyinstallering av programmvare
- CG-workshop med Maja
- møte med Máret Láilá
- CG-workshop med Knut
- regler for bestemthet av substantiver
- CG-workshop med Marja-Liisa
- artikkelskriving
- oppmerking av yaml-tester
- artikkelskriving med Flammie
- CG-workshop med Inga
Børre
- sme-tts
- Tekster til tts-korpus
- Oversette prompter-tekster
- Eksportere terminologi fra UiTs buohccedikšutearbmaprošeakta til TermWikien
- grep_corpus til Trond & Lene
- Møte om ILO-169-rapport
Framover:
- Nordsamisk tts-innspillingskorpus
- sende avtaletekst for bruk av heile korpuset til NorwAI (via Sjur)
- gielese:
- forsiden oppe og går på http, Play-knappen fører til tom side
Inga
- TTS: tekst etter tale
- Gramcheker: evaluering f forbedring av regler og disambiguering. Noe sammen med Linda. HUsk: Etterlyse evalueringsskript fra Børre
- Sme-smj-ordbok
- IDIL-arbeid
- ILO-rapport
Sjur
- kommentarar til ILO-169-rapport til KDD
- byrja på artikkel til NoDaLiDa
- møte med TheTC
- møte med KDD om PFII, IDIL
- gramcheck-release
- orddelingsbygging, minneluke i SMS
Framover:
- transkriberingsprosjekt med Risten
- søknad til Kulturdepartementet om tilgang til heile NB-tekstsamlinga
- tts-analysator
- send e-post med dongelbestilling til Flammie
- diskuter
lookup
i divvunspell
med Brendan, Flammie - gjera ferdig det
som alt ligg der, evt. legg til API-kall
Infra-arbeid framover (Børre, Flammie, Sjur):
- flytta fst-bygginga inn i fst-mappa
- flytta alle test-katalogane (til underkatalogar av det som skal testast)
Gøteborg
- Forbedring av byggestruktur
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer)
- grammatikkontroll inn i MT-sida (unhammer)
- grammatikkontroll inn i LO (Kevin sin oxt)
- grammatikkontroll inn i nettstavekontrollen
Reiser og konferansar
- 22.-24.5.2023: Nodalida, på Færøyane
- CG-workshop deadline 10.april
Andre potensielle konferansar:
- 02.-05.05. EACL. (RAIL, LoReSMT…) Dubrovnik
- 12.-15.06. EAMT. - Tampere
- 10.-12.07. ACL. (SIGMORPHON) Canada
- 20.-24.08. INTERSPEECH, Dublin (Katri)
- 04.-06.09.(-08.09.) RANLP. Bulgaria
- 18.-22.09. KONVENS. Ingolstadt
LREC - framtidsplaner
- maori-grammatikkontroll - zoom-møte?
- nasjonalbiblioteket og samiske tekstar - skrive til dei
- islandsk regelbasert grammatikkontroll
- Wikimedia-ting: LinguaLibre
- søramerikanerne var interessert i fst - evt ha et kurs for dem
Ymse