Divvun-møte 29.5.2024
Til stades: Katri, Sjur, Mikko, Børre, Maja, Flammie
Saker:
- Sidan sist
- Reiser og konferansar
- LREC - framtidsplaner
- Ymse
Sidan sist
Flammie
- LREC:
- möter med gboard, maori osv
- korpuslisens og slik
- omorganisert test-katalogane:
- jobba med irsk
- reiseregning
- reisebestilling
Mikko
- Hævvi: er positive, har ikkje svara endeleg enno
Sjur
- sjukemeldt 1,5 dag
- Acta Borealia-artikkel
- møte med Samisk arkiv/Arkivverket
- hjelpte folk med stavekontroll før eksamen
- testa SMN-dok mot grammatikkontrollen - vi har problem med lange dokument
- testa automatisk oppdatering i DM
- retta VPATH-feil med nye
make devtest
Framover:
- sjekk personar for lulesamisk og nordsamisk transkribering
- Sjekk med Trond om OCR og samarbeid med NB - korleis kan vi få NB til å samarbeida meir med oss?
Børre
- bugzilla2github: ca halvparten ferdig
- support
- pdf-konvertering
- Møter med Samisk arkiv
- Grammatikkontroll i lang-gle
- hide-passes i gtgramtool, legge det inn i giella-core (slik at bare fails blir skrevet til loggene)
Katri
- Metadata og organisering av Sametinget-material (for CSC); lisensfil mangler og trenger hjelp med det
- Epost med den samiske sannings- og forsoningskommisjonen om transkribering…
- Hentet mer Dalla ja dálloj-sendninger fra NRK
- Dokumentasjon om TTS og ASR
- Sme-arkivmaterial: kjørte pyannote diarization
- Møte x 2 med arkivverket: Status samarbeid + Hunt Cloud
- Nordforsk-søknad, intro om nordsamisk språk, møte
- Mottatt mer sma-material fra Arkivverket (AJ)
- Bestillt reise
- Fortsatt med prosessering av AJ-materialer, med filer som er nå ferdig transkribert
- Koordinert videre transkribering med Maja og Thomas
- Diskutert videre samarbeid med NB (ASR oppdatering til sme og smj, og ny ASR til sma)
Framover/Ideer:
- NB: nordic automatic LID (language identification), kan brukes til å filtrere norsk material (tekst) ut fra t.ex. sametingets plenumaudio?
- Artikkel om TTS: evalueringstest i små språksamfunner er vanskelige
- Til folk som er interessert av TTS-prosjekter: https://docs.coqui.ai/en/latest/what_makes_a_good_dataset.html
- Samarbeid med Kanada om TTS?
Maja
- LREC
- Presentasjon
- Resourced/Endangered/Less-studied Languages, Machine Translating, parsing, tagging, chunking, grammar, syntax
- Reise/-Hotelbestilling og reiseregning
- transkribert og fått mer oversikt over AJ-materiell som må jobbes videre med
- artikkel med Linda - negation
- Inga Marja Steinfjell - 1 mill.
Prio fremover:
- transkriber - Gullietjååtsele + OCR-lesing
- listearbeid - lemma
- artikkel med Katri og Thomas?
Linda
Framover:
- møte om reiserekningar, forskot og ikkje-fungerande byråkrati
TheTC
- sjekkar oppdateringssystemet for DM
Framover:
- CLI for Páhkat på mac/windows
- Android:
- Katri: fungerer, stavekontrollen fungerer ikkje => har truleg eldre versjon
- har 0.2.1, version code 88 => Katri må leggjast til i betatestargruppa
- Flammie: har gamal telefon, kræsjar heile tida, har sendt kræsjrapport
- Sjur: sjekkar om det må gjerast noko for å gjera ny versjon tilgjengeleg
- Divvun Dev, Børre (0.2.6, version code 179):
- tastatura ser riktige ut
- det er forslag frå stavekontrollen (sma og sme)
- dvs alt ser bra ut
Necessary Innovations
1-2 veker forseinka med alfa-versjonen, kanskje beta òg. Endeleg versjon i juni kjem til rett tid, tidsnok til Bodø-konferansen.
Som kompenasjon vil dei forbetra CI-oppsettet vårt.
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer)
- grammatikkontroll inn i MT-sida (unhammer)
- grammatikkontroll inn i LO (Kevin sin oxt)
- eige prosjekt med Nec. Innov.
- grammatikkontroll inn i nettstavekontrollen
Reiser og konferansar
Både potensielle og påmeldte, og planlagde reiser:
- 16.–21.06.2024: NAACL
- 25.-26.06.2024: Giellabiellje - alle
- 09.-13.09.2024: KONVENS Vienna
- 26.-29.09.2024: Bokmässan (Göteborg)
- 05.-06.11.2024: Språkteknologikonferanse i Trondheim/Trøndelag - små språk i Norden (mange/alle?), lansering av sørsamisk TTS
- 06.–07.11.2024: SAALS6 (Helsingfors)
Bodø-konferansen
- 25.6. kl 12.00 - 26.6. kl 13.00 (ca)
- lansering av talesyntese (SMJ, SME-oppdatering/-nylansering)
- lansering av grammatikkontroll for win/mac (raud-/blåstrek, ikkje sidepanel)
- fysisk arbeidsmøte i lag med Arkivverket etter, forslagsvis på torsdag, men onsdag ettermiddag som alternativ
- Divvun-samling resten av veka?
- Sjur: GALA-webinar 27.6. kl 17.00 norsk tid
Plass for konferansen: Stormen kulturhus (Stormen språksenter held til i huset, har andsvar for pite- og lulesamisk)
Oppgåver:
- møterom - Inga sjekkar (2 rom for torsdag, kanskje heile tida?)
- tinga reiser+hotell (alle tingar kvar for seg via Berg Hansen) - Divvun-samlinga byrjar til lunsj på måndag, og går fram til lunsj på fredag
- lanseringar: tysdag morgon, før konferansen. Både fysisk og på nett.
- planleggja tekst til FB-event
- melding på andre sosiale medium
- alle melder seg på!
LREC - framtidsplanar
- maori: grammatikkontroll, datastyring og tilgang, etikk og plattformkontroll
- nasjonalbiblioteket og samiske tekstar - skrive søknad til KD
Ymse
Bokmessa i Gøteborg
Skal vi dra på bokmessa i Gøteborg? 26.-29. september, har samisk som tema i år. Argument for:
- vi blir synlege i den svenske språkdebatten
- vi når nye brukarar
- vi kan få kontakt med forfattarar og forlag med tanke på korpus
Konklusjon: vi legg opp til at nokre dreg.
Møte med Sametingsråd Mikkelsen
Vil gjerne ha møte med oss i (slutten) juni.
Anna
Bør vi arrangera fleire release-partyar eller kurs på nettet? Kan kanskje nå fleire folk lettare på den måten. Målsetjing: nettseminar to gonger om året
Maja: F.eks nettseminar om språkteknologi, nyoppdatering av f.eks grammatikkontroll eller oppdatering av dict -lagt til nye ord og funksjoner i dict
Neste møte: 4.6. til vanleg tid.