Grammatikkontrollmøte 13.10.2017
Til stades: Duommá, Kevin, Linda, Sjur
Saker:
- sidan sist
- variantar av GC
- integrering mot klientar / vertsprogram
- arbeid framover
- neste møte
Sidan sist
Duommá
- han samler falske positiver från stort korpus
Det er ein del falske alarmar, vi må vurdera å slå av dei mest problematiske reglane i fyrste versjon, og heller byggja ut grammatikkontrollen over tid.
Kevin
- cgspell
- les både arkiv og enkeltfiler (akseptor/analysator+feilmodell)
- stav berre ukjende som standard, valfritt òg kjende
- rett output av subreadings
- testar, travis
- endring i hfst-ospell-api for korrekt gjenkjenning av tagg vs lemma
- composed-chars-debugging
- autooppdatering av webdemo (inn i same system som jorgal: https://github.com/unhammer/gtweb-apy-conf )
- svn up skjer OnCalendar=02,08,12,14,16,18:42
Webtenesta blir starta om att midt på natta og kl 14. Endringar i koden blir ikkje synleg før slike omstartar.
Manuell omstart av tenesta på gtweb med:
sudo systemctl restart apy
Linda
- fiksa kasusfeilfinning i adposisjonsfraser
- feilfinningsregler
- semantiske tagger i disambigueringsregler
- flere disambigueringsregler for adposisjoner
- fiksa en del kommaregler
- litt feedback optimering i errors.xml
- flere feiltyper på instagram
Instagram: vi bør fylgja fleire, og på den måten kanskje få fleire til å fylgja oss.
Sjur
- har lagt til støtte for stavekontroll i bygginga
- manglar zip med stavekontroll
- har no lagt til rette for grammatikkontroll for alle språk
Variantar av GC
- ulike land (ulik ortograpfi, jf smj)
- ulike ortografiar
- ulike skriftsystem
Lemma og analyse er konstant, overflateform varierer. Dvs at variantane må handterast for:
- tokeniser
- forslagsgeneratoren
- stavekontrollfilene
- cg-reglar som viser til overflateform: vi viser ikkje til overflateform, berre til lemma + taggar
For geografi og skriftsystem: vi lagar ulike fst-ar og ulike zip-filer, cg-reglane er konstante. Når det gjeld ortografi så må vi venta og sjå kva det reelle behovet er.
Integrering mot klientar / vertsprogram
Vi ventar til vi har full støtte for stavekontroll i alle komponentar.
Framover
Duommá
- han fortsätter å samle falske positiver från stort korpus
Kevin
- cgspell
- støtte i divvun-checker/bibliotek, pipespec.xml og zip-format
- fiks bug med timeout (men hfst-ospell har same bug?)
- kommandolinjeval for å skru på preferansar (gøyma reglar) i divvun-checker
- evalueringssystem mot gullkorpus
- lag «debug modes» i divvun-gen-sh, så me slepp apertium-gen-modes
Linda
- testing og evaluering av adposisjonsregler
Sjur
- søknad til KMD om fast lingviststilling
- leggja til semantiske (og andre?) taggar i stavekontrollanalysatoren
- støtte for variantar slik det er diskutert over
Neste møte
Om ca 14 dagar. Sjur kallar inn.