Divvun-møte 28.3.2023
Til stades: Sjur, Flammie, Katri, Linda, Inga, Maja
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Flammie
Framover:
Katri
- sme-opptak og gått igjennom opptakfiler og tilsvarende tekster som var lest
- sametingets taledata: kjører ASR til north-spor av materialer
- planlegt nytt sme whisper med ny/mer data; og lulesamisk asr med NB (Javier)
- reise, reiseregning
- sma-materialer med Maja
- github problemer
- syk
Framover:
- se mer om common voice
- ASR output: Store bokstaver, punktum etc.? Se finsk whisper: More info about the casing+punctuation correction model can be found here
- Overflow-tts?
- info on Whisper transcription og diarization: (Whisper)
Maja Lisa
- Divvun-uke
- sma-tidskrift
- Møte med Linda: Mark-up + Artikkel grammatikkontroll: hvordan endre/stoppe språkendring?Viktigheten av gramatikkontrollen: Negasjon og adj-systemet
- Møte med Katri, Inga: Startet opp arbeidet med å legge til tekst til recording
- div annet, møter, orakel og ny skjerm etc. + added lemma
Framover:
- PRIO: Skrive artikkel + markup + rette opp noen adjektiv-regler med Linda
- PRIO: Fremover: Jobbe med A.J-lydfiler + med Katri
- Artikkel grammatikkontroll: hvordan endre/stoppe spårkendring?Vikitgheten av gramatikkontrollen: Negation og adj-systemet:
- Typisk feil: daltese - legge til “daltesne”, “aajegesne” etc. som Err/Orth-tagg i fortsettelseslexiconet N_ODD,for illativ, inessiv og ellativ - Diskuter med Trond og Sjur
Linda
- artikkelskriving med Marja-Liisa og Trond
- artikkelskriving med Maja
- artikkelskriving med Inga
- prøver å få goldstandard-analyse til å funke
- koordinere møter
Børre
Framover:
- gielese:
forsiden oppe og går på http, Play-knappen fører til tom side
Inga
- Gramchecker: evaluering og forbedring av regler og disambiguering. Skrevet på artikkel, og fått litt gramchekcerangst.
- Evaluering av sme-smj-ordbok, sortering av ord og litt arbeid med artikkel
- Reisedag
- Error markup
- AI-seminar
- Lest deler av Kowalic
Sjur
- TTS-førebuingar
- Vitec og StatPed
- lt-support-arbeid (IDIL-dokumentasjon)
- førebuingar for møtet i Oslo på fredag
- artikkelskriving (til Nodalida, vart stoppa)
- utlysingstekst for nettportal, TTS-integrering, grammatikkontroll
- møte om SMA-spesialnummeret
- planla infraarbeid med Flammie
- møte med Riksarkivet/Arkivverket/Samisk arkiv
- møte om CARE-prosjekt via Interreg-Aurora
Framover:
- transkriberingsprosjekt med Risten
- søknad til Kulturdepartementet om tilgang til heile NB-tekstsamlinga
- tts-analysator
- send e-post med dongelbestilling til Flammie
- diskuter
lookup
i divvunspell
med Brendan, Flammie - gjera ferdig det
som alt ligg der, evt. legg til API-kall
Infra-arbeid framover (Børre, Flammie, Sjur):
- flytta fst-bygginga inn i fst-mappa
- flytta alle test-katalogane (til underkatalogar av det som skal testast)
Gøteborg
- Forbedring av byggestruktur
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer)
- grammatikkontroll inn i MT-sida (unhammer)
- grammatikkontroll inn i LO (Kevin sin oxt)
- grammatikkontroll inn i nettstavekontrollen
Reiser og konferansar
- 22.-24.5.2023: Nodalida, på Færøyane
- CG-workshop deadline 10.april
Andre potensielle konferansar:
- 02.-05.05. EACL. (RAIL, LoReSMT…) Dubrovnik
- 12.-15.06. EAMT. - Tampere
- 10.-12.07. ACL. (SIGMORPHON) Canada
- 20.-24.08. INTERSPEECH, Dublin (Katri)
- 04.-06.09.(-08.09.) RANLP. Bulgaria
- 18.-22.09. KONVENS. Ingolstadt
LREC - framtidsplaner
- maori-grammatikkontroll - zoom-møte?
- nasjonalbiblioteket og samiske tekstar - skrive til dei
- islandsk regelbasert grammatikkontroll
- Wikimedia-ting: LinguaLibre
- søramerikanerne var interessert i fst - evt ha et kurs for dem
Ymse