Divvun-møte 10.10.2023
Til stades: Sjur, Linda, Børre, Inga, Flammie, Katri, Maja
Saker:
- Sidan sist
- Tastaturarbeid
- Arbeidstid og avspasering delar av arbeidsdagen
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Børre
- Nye giella-core:
giella-core/34,
giella-core/35,
giella-core/36
- Sjekke bygging av lang-sme, lang-smj
- Litt mer med dicts-svn-til-git
- Møte med sms fra GG
- Korpus fra samediggi.no
- Hjelpe folk
- Artikkelmøte med Linda og Flammie
- møte om Sami voice recognition, AI and Nordic PBs and universities-møte om Sami voice recognition, AI and Nordic PBs and universities
Forslag: jamne møte mellom GG, GT og Divvun for å synkronisera oss.
Katri
- fortsatt med presentasjon om sme TTS til symposium
- kanskje viser en lenke til evalueringstest i sluttet av presentasjonen
- generert syntessampler med olike Fastpitch modeller og Acapela
- 1) Acapela (Elle)
- 2) FastPitch med Acapela material (4 timer)
- 3) FastPitch med Acapela + Divvun material (7 timer), “yngre” Laila som stemme (modellen trent med speaker embeddings)
- 4) FastPitch med Acapela + Divvun material (7 timer), “2023 opptak” Laila som stemme (modellen trent med speaker embeddings)
- The speaker embedding is an additional input into the model that captures a particular speaker’s voice characteristics
- forbereder sme-TTS demostrasjon
- møte med Maja, Thomas og Sjur om sma-TTS, transkribering, organisering av jobbet
- møte om Sami voice recognition, AI and Nordic PBs and universities
- spørsmål om vi kan dele talematerialer til andre forsker etc.
- Bare TTS material som vi har selv produsert blir open source
- reisebestilling
Inga
- Propernouns: SMI-navn ut av SMJ og inn i SMI
- Jobber systematisk med Err/Orther
- TwolC med Sjur
- GramChecker: ADDRELATION med Linda
- MT: forbedring av setninger og møte med Lene
- Foredragsmøte med Lene og Trond
Maja
- Dict - fokus på høyfrek. norske ord som mangler i sma.nob-dict + fraser
- Forsøke å få oversikt over Incomming lemmalister
- Rydding i filer, fått mer oversikt + sma-transkribering
- møte med Sjur, Thomas Kjærstad, Katri om sma-transkripsjon
- Workshop: Presentasjon + feilmerking med Linda
- Arbeid med liste over lydfiler + tekst (innsendt liste av Trøndelag Fylkeskommune)
- Rapportskriving
- fikset out-print på maskina mi
Framover:
- lag liste over hvilket materiale av alt som finnes av lydfiler, og hvor dette materalet er (ev med tekst) (i
speech-sma-x-private
)
- konvertering frå CD til lydfiler etter avtale med Börre
- Katri bör gå igjennom fila som er transkribert og kommentere hvordan jeg bedre kan transkribere.
- Syntaks: Gramcheck - yamltester, regel, feilmerking, presentasjon
- Fonologi - transkribering - TTS
Flammie
framover:
Linda
- 2 CG-møter med Inga - begynte med ADDRELATION og gjennomgående strek i GramDivvun
- tekniske samtaler med Tino og Kevin
- artikkelmøter med Sjur, Trond og Lene
- presentasjonsmøte med Maja
- LREC artikkelmøte med Flammie, Trond og Børre
- fiksa noen GramDivvun regler for smn
- apertiummøte med Flammie
- litt disambigueringsarbeid for sme - samtaler med Lene om det
Sjur
- testa og melde feil i iPad-tastatur
- artikkel til Acta Borealia med møte
- twolc-feil i SMJ (?)
- møte med TechnoCreatives
- prata med Samisk arkiv om sørsamisk transkribering
- møte med Brendan et co - logo for Borealium presentert
- kontakta Kavi
- har bede om dokument kring avtale mellom UiB og KD, har fått to
- møte med NRK m.fl.
Framover:
- risikovurdering for dei nye prosjekta (krevst for nye prosjekt)
TheTC
Framover:
- fiksa grammatikkontrollfeil i GDocs/Office
Necessary Innovations
- arbeid med nettportalen
- Logo for Borealium
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer)
- grammatikkontroll inn i MT-sida (unhammer)
- grammatikkontroll inn i LO (Kevin sin oxt)
- grammatikkontroll inn i nettstavekontrollen
Tastaturarbeid
Status:
- SJE-utforming ugjort
- sjekka alle feil som vi har fått melding om
Arbeidstid og avspasering delar av arbeidsdagen
Frå Beathe:
[…] det bare er hele dager man trenger å sende søknad om avspasering. Avspasering deler av dag føres bare i timeoversikten. […] Dere kan lese mer om dette i medarbeiderhåndboka under arbeidstid.
Reiser og konferansar
Tar alt for lang tid å få reiseoppgjer!
Et alternativ: https://cp.compendia.no/uit/medarbeiderhandbok/208693
Både potensielle og påmeldte, og planlagde reiser:
- 18.-19.10. Samisk konferanse ved Nord-universitetet
- 19.-20.10. Samisk symposium (Sámegiela ja sámi girjjálašvuođa dutkan- ja bagadallansymposia) i Tromsø,
- 23.-27.10. Divvun-samling
- 30.10.-2.11. Inga til Canada, National Gathering of Elders?
- 1.-3.12. NLP4DH & IWCLUL https://rootroo.com/en/joint-nlp4dh-iwclul-2023/
- april 2024: UNPFII i New York (i alle fall Inga og Sjur)
- 20.-25.05.2024 LREC-COLING Torino (13.10. submission)
- June 16–21, 2024 NAACL
- juni 2024: Språkteknologikonferanse i Bodø - alle?
- oktober 2024: Språkteknologikonferanse i Trondheim/Trøndelag - små språk i Norden, ev òg SMA-2-konferanse (mange/alle?), lansering av sørsamisk TTS
LREC - framtidsplaner
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Nettføredrag av ein Google-person i kveld, jf e-post. Kven kan vera med? Vi bør ha folk til stades.
Sjur har haustferie neste veke, mykje borte.
Bør vi arrangera fleire release-partyar eller kurs på nettet? Kan kanskje nå fleire folk lettare på den måten. Målsetjing: nettseminar to gonger om året,