Divvun-møte 16.5.2023
Til stades: Sjur, Katri, Børre, Maja, Linda, Inga
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Maja Lisa
- Lexc-møte med Börre
- Lexc-Dict-møte med Lene - plan fremover
- Artikkel og Gramcheckmøte med Linda
- syk onsdag
Framover:
- PRIO: Fremover: Transkribering av AJ-filer: speech-sma-x-private
- artikkel/presentasjon
- dict-1500 lemma inn fra dict
Børre
- CorpusTools: parallelise
- corpuspath til converter, analyser, korp
- Korpus i git
- Tilgang til ISOF for “deres” repoer
- Bug og korpusinfo med Thomas BK
- Info til Jacob Larsson
- Gjennomgang av skript i samband med utlyst stilling
- corpus-fao
- make check i sma
- ny maskin m/oppsett
Framover:
- tilgang til korpusrepoene
- oppfølging av samarbeidet med Tromsø kommune om å få installert stavekontroll og tastatur på kommunens maskiner
- gielese:
forsiden oppe og går på http, Play-knappen fører til tom side
Inga
- Gramchecker: forbedret regler og organisert yaml-setninger
- Gramchecker: Presentasjon og artikkelarbeid
- Gramchecker: Beskrivelser til rettinger
- Retta markup i freecorpus
- Tekster med lyd til ASR, litt vanskelig med MSM, hvor finner vi våre avtaler?
Katri
- sme-opptak: gjort filtrering, denoise, loudness normalization etc. til nye sme opptak
- Dokumentert sme og smj talekorpuser
- Dokumentert lydprosessering
- Fortsatt med artikkeljobb til SIGUL2023 (frist 23.5.): tenkt på metoder for å evaluere synteskvaliteten, (“survey”)
- litt planlegging av lulesamisk whisper (talegjenkjenning)
Framover:
- lulesamisk Whisper? - venter på korpuslisenser
- tilbake til Gradio TTS demo platform på nettet, eksternt server til dette?
- se mer om common voice
- ASR output: Store bokstaver, punktum etc.? Se finsk whisper: More info about the casing+punctuation correction model can be found here
- Overflow-tts?
- info on Whisper transcription og diarization: (Whisper)
Linda
- støttebrev og -møte til Eckhard med Trond/Sjur/Flammie
- presentasjoner til Nodalida (sma/smj/smn)
- flere CG-workshop/artikkel med Inga
- CG-workshop/artikkel med Maja
- CG-workshop med Knut (nob)
- fiksing av disambigueringsregler smj
- flere CG-workshop med Marja-Liisa og Trond
- fiksing av grammatikkontrollregler smn
- artikkelmøte med Flammie
- git greier med Sjur/Børre/Trond
- en del GramDivvun lanseringsting
Sjur
- SMA-Nordlyd
- arbeidsintervju til programmerarstilling i Giellatekno
- hjelpte Linda, Inga, Trond
- møte i Trondheim med Davyth Hicks, KDD
- tilboda på nettportal m.m.
- møte med Gøteborg/TheTC
- møte med Tino m.fl. om morfemprediksjon på mobiltastatur
- Nodalida-plakat
Framover:
- søknad til Kulturdepartementet om tilgang til heile NB-tekstsamlinga
- tts-analysator
- send e-post med dongelbestilling til Flammie
Infra-arbeid framover (Børre, Flammie, Sjur):
- flytta fst-bygginga inn i fst-mappa
- flytta alle test-katalogane (til underkatalogar av det som skal testast)
- få på plass GDPR-oppsettet, slik at vi kan logga all bruken av ressursane våre
Gøteborg
- ny versjon av Divvun Manager, med eksplisitt feilmelding når det er nettverksproblem
- automatisk installering av grammatikkontrollen på API-server
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer)
- grammatikkontroll inn i MT-sida (unhammer)
- grammatikkontroll inn i LO (Kevin sin oxt)
- grammatikkontroll inn i nettstavekontrollen
Reiser og konferansar
Andre potensielle konferansar:
- 12.-15.06. EAMT. - Tampere
- 10.-12.07. ACL. (SIGMORPHON) Canada
- 20.-24.08. INTERSPEECH, Dublin (Katri)
- 04.-06.09.(-08.09.) RANLP. Bulgaria
- 18.-22.09. KONVENS. Ingolstadt
- 19.-20.10. Samisk symposium (Sámegiela ja sámi girjjálašvuođa dutkan- ja bagadallansymposia) i Tromsø, Divvun-samling veka etterpå (23.-27.10.)?
LREC - framtidsplaner
- maori-grammatikkontroll - zoom-møte?
- nasjonalbiblioteket og samiske tekstar - skrive til dei
- islandsk regelbasert grammatikkontroll
- Wikimedia-ting: LinguaLibre
- søramerikanerne var interessert i fst - evt ha et kurs for dem
Ferie
Legg han inn i Outlook-kalenderen og i Zulip.
Ymse