Divvun-møte 9.3.2021
Til stades: Duommá, Børre, Linda, Tommi, Katri, Ritva, Sara, Siri, Sjur
Saker:
- Sidan sist
- Arbeid framover
- Ymse
Sidan sist
Duommá
- gram-chk yaml
- gram-chk testing o forbedring - word additions, disambiguahtor, bugzilla,
errorth forms
- GramDivvun-møte
Børre
- divvun-sdk-nodejs
- korpus
- normalisere til NFC (det er hva fst-ene venter)
- flytte docx til odt (docx-konverteringen produserer innviklet html, odt-konvertering gir en mye enklere versjon)
Kommentarar:
pandoc
kan vera eit alternativ for å konvertera docx-filer (ikkje
doc-filer).
- divvun-sdk-nodejs - diskuter med Brendan
Nettsideproblem:
- static-files - ok no, bortsett frå LO-5-pluggen (må byggjast på nytt?)
- Bugzilla - ikkje på plass enno
- divvun.no med andre lokale enn dei som allereie finst (berre for Safari på
Mac, ok for alle andre) - ikkje ok enno
- nettstavekontrollen - byta til api-giellalt.uit.no som server (REST-api)
- see-servar - framleis borte
Linda
- yaml-testar med Duommá (sammensettinger)
- GramDivvun med Ritva og Duommá
- diskuterer nye feiltyper med Ritva + yaml fil for å samle dem
- neurale nettverk med Tommi, Chiara og Mika
- evalueringskorpus med Børre
- fulgte med på disputas om flerspråklighet
Tommi
- jobb med gold korpus for evaluering i nevral artikkel
- fiksede bugger i divvun-normaliser
- –enable-tts er i alle språk nå
- mindre fikser til autogen.sh og configure også
- hadde medarbeidersamtale
--enable-tts
bør automatisk slå på --enable-phonetic
og
--enable-tokenisers
.
Inga
- TTS-møte & andre møte
- rettet på tekster som skal brukes i TTS
Jobba halv tid førre veka.
Katri
- tts-møte
- omorganiserad speech-smj-privat-mappen
- nya mapp (tts-texts) för smj-teksterna som blir spelas in
- ideen till workshop (Phonological diversity; 16.-19.9. Poznan:
http://wa.amu.edu.pl/plm/2020/Home)
- utvecklat och testat espeak tts vidare
- två+ siffriga grundtal fungerer nu, men ordningstal har några problemer
- prosessera speech-smj-minicorpus för att trena en enkel neural vocoder som
fungerar med 1 timmes taldata (Inga): behöver .txt + .wav par per setning
- har skrivit och testat Praat skripter för att konvertera och dela upp
långa ljudfiler till kortare delar
- python skript för att dela upp tekstfiler också
- added documentations!
Ritva
- Flammie hjalp til med svn-problemer
- GramDivvun filer
- 2x GramDivvun Workshop (Linda & Duommá)
GramDivvun: kan vera vanskeleg å sjå kor ein er i teksten, etter at ein har
klikka seg vidare. Innimellom viser til feil setning, både i MS Word og
GoogleDocs.
Sara Marja
Stor bokstav etter hermeteikn på mobiltastatur (iOS i alle fall) - skal ikkje
vera slik.
Sjur
- Medarbeidersamtaler
- Møte med ASTIN (observatørstatus for samisk og grønlandsk)
- Sametingets workshop (Joint Sámi flagship project (IDIL 2022-2032)=
- Forelesning, Helsinki uni
- tekstnormalisering (TTS) - første del er på plass
- møte med Antti Arppe
- tekstrydding i nordsamiske tts-ressursar
Göteborg
- Studenten som jobber med talesyntese viste fram en demo med bra lyd
- Divvun oneclick-installer. Enklere å installere: velg språk, installer verktøy
og oppdateringshåndterer. Windowsversjonen slippes ganske snart.
Når kjem det oppdateringar av mobiltastaturet? Dvs ordfullføring og
ordprediksjon. — Ingen klare planar enno.
Arbeid framover
Ymse
- Møtefrie dagar?
- neste møte tysdag 16.3.2021