Divvun-møte 3.9.2024
Til stades: Katri, Sjur, Mikko, Flammie, Inga, Børre, Maja
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Maja Lisa
- Transkribering (bl.a fem fortellinger) - ferdig - til korrektur til Thomas
- Missinglist fra Artikkel med Linda m/flere feiltyper om negation
- Sensor ved SAAL-kurs - onsdag
- Møter
- lemmaryddig og lexc
- SAC - MT + lemma - tilpassing av lånord -
- kort møte om innledere til 100-årsmarkering - Marhkosen Vaentjele
Fremover:
- Missinglist fra Orre Testamente
- Missinglist fra 5 sma-masteravhandlinger
- tekstnormalisering for SMA (tal og forkortingar til tekst)
Børre
- Møter:
- Infra
- Samisk arkiv
- Felles infom (Divvun & Giellatekno)
- Linux-stave- og grammatikkontroll
- Historisk korpus
- Planlegge Göteborg
- OCR-info fra NB
- Anders: info om metadict, info om redigering
- CorpusTools: støtte for historisk korpus
- Bugzilla til GH.
200 åpne issues, totalt 2058 klar til å bli flyttet der de hører hjemme.
- Fikse Linux-dokumentasjon i https://giellalt.github.io
Framover:
- laga oppsett for gramcheck-testdata i cg3-filer
- Bugzilla-flyttinga
Inga
- Gramchecker, hovedsaklig numphraseregler
- Issues
- Fst-arbeid
- Lønnskrav
- Reiseregning
Katri
Framover/Ideer:
- Teste Divvun Dev Keyboard?
- NB: nordic automatic LID (language
identification), kan brukes til å filtrere norsk
material (tekst) ut fra t.ex. sametingets
plenumaudio?
- Artikkel om TTS: evalueringstest i små språksamfunner er vanskelige
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Samarbeid med Kanada om TTS?
Flammie
- møter på divvunuke
- grønlandsk
- meta
- IIRC artikkel godkjent men ML kan ikke r
Mikko
- bokmessa i Gøteborg
- konferanseplanlegging
Sjur
- artikkel til MultiLingual - etterarbeid
- bokmessa i Gøteborg - planlegging
- diverse møte i Tromsø
- arbeidsmøte med Arkivverket/Samisk arkiv
- møte med Standard Noreg
Framover:
- nettmøte om språkteknologi (16.9.)
- svara Meta, koordiner med Flammie
- svar Keoni, vil testa mac-versjonen
- svar Daan
- Sjekk med Trond om OCR og samarbeid med NB - korleis kan vi få NB til å samarbeida meir med oss?
TheTC
- har sagt opp vedlikehaldsavtala med heimel i
svensk konkurslovgjeving, er inne i ein
omstruktureringsprosess
Framover:
- Android: ny versjon av Divvun Dev er ute
- sjekk at stavekontrollane fungerer
- sjekk at alt anna fungerer
- om ok: => ny versjon av Divvun-tastaturet for Android
- Divvun Manager
- CLI for Páhkat på mac/windows
Necessary Innovations
- arbeider med TTS for iOS og macOS
- oppdatert TTS-motor tek mykje mindre plass
- vil ha ferdig ny TTS til Gøteborgsmessa, truleg
òg grammatikkontroll, men er avhengig av info
frå MS
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i MT-sida (unhammer) => Flammie pratar med Kevin, bruk api-serveren
- grammatikkontroll inn i nettstavekontrollen
- sjå over nettstavekontrollen:
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 26.-29.09.2024: Bokmässan (Göteborg)
- 02.-03.10.2024: Lulesamisk språkseminar i Jokkmokk (Inga skal vise fram talesyntesen)
- 30.-31.10.2024: Minneseminar etter Anna Jacobsen
SMA-talesynteselansering (Maja, Katri, Sjur, Thomas og Ina Theres) (Hattfjelldal)
- 05.-06.11.2024: Språk og AI i Norden - for alle? (mange/alle?), presentera sørsamisk TTS (Trondheim)
- 06.–07.11.2024: SAALS6 (Helsingfors)
- 12.-15.11.2024: IIRC (Auckland)
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Kjernearbeidstid: 9-14:30 (norsk tid)
Ferie: skriv inn i Zulip
Bør vi arrangera fleire release-partyar eller kurs på nettet? Kan kanskje nå fleire folk lettare på den måten. Målsetjing: nettseminar to gonger om året
Maja: F.eks nettseminar om språkteknologi, nyoppdatering av f.eks grammatikkontroll eller oppdatering av dict -lagt til nye ord og funksjoner i dict
Neste møte: tysdag 10.9. til vanleg tid.