Divvun-møte 07.09.2021
Til stades: Linda, Børre, Sjur, Katri, Inga, Flammie
Saker:
- Sidan sist
- Arbeid framover
- Ymse
Sidan sist
Duommá
- -ui, -ái paradigme for sannslynlige skrivefeil
- har gått gjennom mange tilfelle av kongruens og koordinasjon
- diskutert mykje med Biret Merete:
Mus lea oabba ja guokte vielja
Gonagasat fas dáhtto uhcidit girku fámu,
go sii oidne man ollu riggodagat ja ruhta dokko manai. -
=>
ollu riggodagat ja ruhta manai
mye rikdom.nom.pl og penger.nom.sg gikk.past.3Sg
viidni ja čáhči lea dáppe
vin.sg og vann.sg er.Sg3 her
Linda
- kongruensfeil grammatikkontrollregler - fiksa Duommá sine bugger (falske positiver)
- diskuterte spennande unntak i kongruensreglene med Duommá og Biret Merethe
- møte med Sjur om hermetegn, vi fant en løsning for å fikse feil tokenisering i rettinga (legge til informasjon om mellomrom)
- presentasjon til RANLP ilag med Flammie
- RANLP konferanse
Flammie
- RANLP-presentasjon og konferanse
- Lst-optimisering i tokeniserer (bruker ~50 % tid og ~10 % mindre plass)
Katri
- Jobbat med experimental Tacotron tts för smj
- trent 135K steps (sme modell har 600K steps)
- Whistling noise frequencies med Waveglow vocoder https://github.com/NVIDIA/waveglow/issues/249 som går inte bort med trening
- ser på andra vocoder (waveGAN, hifiGAN) som kanske fungerer bättre med low-resource setting
- jobbar med en presentation för PLM2021 (18.-19.9.) om tts för smj
- pilot experiment med Tacotron: genererer ca. 50 setningar och ser hur Tacotron lärer duration model och kvantitet från treningsdata, jämfört med original talmaterial
- planert detaljerna för inspelningarna
- text promting
- pause marking: väldig viktigt för prosodi!
- microphone setting: en “lavalier microphone” är kanske bäst
- tts-møte
Inga
- Retting av MT, Ávvir
- Abbr2text
- SMJ-abbrevations
- Error markup
- TTS-møte
- Pressetreff
- Julevsáme tjállemnjuolgadusá fra GG
- Foredrag til symposium 23.9.
Børre
- CorpusTools: korreksjoner som noder, ikke attributter. Gir muligheten for å presentere mer enn en korreksjon i errormarkup-xml. WIP.
- Retting av feiloppmerking i korpus
Sjur
- Tagge mellomrom i grammatikkontroll
- tastatur og stavekontroll
- Jobbe med å få publisert artikler fra sma-konferansen for et par år siden
- Oppdatert til Big Sur
- Tydeliggjøre feilmodellen for stavekontroller ved å fikse pythonskript
Arbeid framover
Ymse
- Ettermiddagskaffe - vi ser korleis det utviklar seg
- neste møte tysdag 6.9.2021