Divvun-møte 17.01.2023
Til stades: Sjur, Maja, Flammie, Katri, Børre, Inga
Saker:
Sidan sist
Flammie
Framover:
- divvunspell cree
- Brendan kan hjelpe med divvunspell/32
- laga automatisk konvertering frå Unicode NFC til NFD, som valfri teiknrepresentasjon i deskriptive FST-ar (pga problema vi får t.d. med å analysera pdf-ar)
Katri
- sme-tts med fastpitch, Acapela data, trent 2 dagar med mannstemme
- šleađgakriisa blir syntetisert dårleg, problem med šl og đg
- sme-Whisper ASR workshop/samarbeid med Javier fra NB
- skript for å kunne produsere automatisk teksting med Whisper-modellen
- møte med alle som jobber med nordsamisk ASR
Framover:
- En webapp/user interface til TTS – Helsingfors?
- eksperimentera med sørsamisk når lydfiler og korpus er tilgjengeleg
- se mer om common voice
- ASR output: Store bokstaver, punktum etc.?
- Overflow?
Maja Lisa
- Tilbake på jobb 11.01
- Gïelegaaltije-möte m/forberedelser
- Jobbet med artikkel, Overleaf.com - Forelopig tittel “Nodalida sma: Bootstrapping a South Sami grammar checker”
- Presentasjon for [UHR-Samisk] (https://www.uhr.no/strategiske-enheter/fagstrategiske-enheter/uhr-samisk/) m/forberedelser
- Besök av [Hemis] (https://hemis.no/om-oss)
Børre
- nettsteder overført fra xtdoc
- sjekke ut nett-siter fra git, bygge derfra
- slette siter fra xtdoc
- zulip<->irc-brua
- Teste på tre forskjellige maskiner
- Lage feilmelding om
problemet
- https://indigenous-langtech.uit.no fra svn til
git
- Begynne å jobbe med nrk-crawler, som også plukker opp sma og smj.
- Be om 2022 fra Ávvir
- Admin: reiseregninger og -bestilling
Framover:
- bestemme hvordan vi redigerer den medisinske ordboka, gjøre kildekoden offentlig
- korpus-repoar i git - heng på git-lfs. Kommet forslag på løsning fra it-avdelingen
- sende avtaletekst for bruk av heile korpuset til NorwAI (via Sjur)
- gielese:
- forsiden oppe og går på http, Play-knappen fører til tom side
Inga
- lite jobb pga fravær
- TTS: begynte arbeidet med å tilpasse tekst til lyd
- registrert BIS i UiTs lønnssystemer
- OmegaT-veiledning
- vi treng stavekontrollen i OmegaT!
Sjur
- innkomne tilbod - evaluering
- dokumentasjon på manglande støtte for minoritets- og urfolksspråk
- diskusjonar og arbeid med skoltesamisk
Framover:
- søknad til Kulturdepartementet om tilgang til heile NB-tekstsamlinga
- tts-analysator
- GitHub-kurs
- git-kurs
- send e-post med dongelbestilling til Flammie
- diskuter
lookup
i divvunspell
med Brendan, Flammie - gjera ferdig det
som alt ligg der, evt. legg til API-kall
Infra-arbeid framover (Børre, Flammie, Sjur):
- flytta fst-bygginga inn i fst-mappa
- flytta alle test-katalogane (til underkatalogar av det som skal testast)
Kan dela arbeidsrom via VSCode (med innebygd lydchat). Har ei felles arbeidsøykt etter påske.
Sjur sjekkar butikkane til Apple og Google for å finna flutter-appen.
Gøteborg
- Fiksa feil i iPhone-tastaturet
- diverse arbeid med infra for tastaturbygginga
- overføring frå person som sluttar til annan person
Framover:
- gjera ferdig one-click-installeraren
- stavekontroll til MS Office for mac
Andre planlagde oppdateringar
- stavekontroll inn i MT-sida igjen (unhammer)
- grammatikkontroll inn i MT-sida (unhammer)
- grammatikkontroll inn i LO (Kevin sin oxt)
- grammatikkontroll inn i nettstavekontrollen
Reiser og konferansar
LREC - framtidsplaner
- maori-grammatikkontroll - zoom-møte?
- nasjonalbiblioteket og samiske tekstar - skrive til dei
- islandsk regelbasert grammatikkontroll
- Wikimedia-ting: https://lingualibre.org/wiki/LinguaLibre
- søramerikanerne var interessert i fst - evt ha et kurs for dem
Ymse
- Arbeidstid og kommunikasjon
- Ettermiddagskaffe
- Talesyntese
- Peter Juel Henrichsen kan koma til Tromsø 13.-15.2. for å prata om taleteknologi. Sjur høyrer om det passar seinare på vinteren/våren.
- IDIL - International Decade Of Indigenous Languages
- neste møte tysdag 24.1.2023, vanleg tid