Gramatikkontrollmøte 6.12.2017
Til stades: Duommá, Kevin, Linda, Sjur
Saker:
- sidan sist
- arbeid framover
- samarbeid med Hanna O?
Sidan sist
Duommá
- disambiguerer post- og preposisjoner
Problem:
sme $ echo “vuostái barge..“ | hfst-tokenise -g 'tools/grammarcheckers/tokeniser-gramcheck-gt-desc.pmhfst' | vislcg3 --trace -g 'tools/grammarcheckers/../../src/syntax/valency.cg3' | vislcg3 --trace -g 'tools/grammarcheckers/../tokenisers/mwe-dis.cg3' | cg-mwesplit | divvun-blanktag 'tools/grammarcheckers/blanktagger.hfst' | vislcg3 --trace -g 'tools/grammarcheckers/disambiguator.cg3' | vislcg3 --trace -g 'tools/grammarcheckers/grammarchecker.cg3'
"<“>"
"“" PUNCT LEFT <W:0.0000000000> &punct-aistton ADD:12802:punct-aistton ADD:12809:punct-aistton
"”" PUNCT <W:0.0000000000> RIGHT &SUGGEST ADD:12802:punct-aistton COPY:12804:punct-aistton
"<vuostái>"
"vuosti" N Sem/Wthr Sg Ill <W:0.0000000000> @ADVL> MAP:16947
"vuostá" N Sem/Food Sg Ill <W:0.0000000000> @ADVL> MAP:16947
"vuostái" Adv <W:0.0000000000> @ADVL> MAP:16947
* **"vuostái" Pr <W:0.0000000000> REMOVE:6141**: r1123
* **"vuostái" Po <W:0.0000000000> REMOVE:6230**: r1144
:
"<barge>"
Kevin
cg-spellfungerer i checker-cli/checker-lib, pipespec, zip-format, apy, webdemo- webdemo deler no opp lange tekster på passande punkt og sender ut litt og litt
- debugging av korfor -n gav feil topptreff i
hfst-ospell(hfst-push-weights) - litt rydding i
templates/grammarchecker.cg3 - (endeleg) implementert støtte for alternative rettingar på same lesing i
divvun-suggest, som diskutert for lenge sidan; pluss sletting av ord - støtte for å gøyma feiltaggar i checker-cli
divvun-gen-shbør no vera ei fullgod erstatning forapertium-gen-modes(treng ikkje lenger apertium for modes); det går òg an å kompileragen-shmed--disable-checkerno- ny modul
divvun-blanktagtil tagging av mellomrom-feil, avsnittsskifte; brukbar frå checker/lib/pipelines; lagt til i smegram og webdemo -
curl bash-skript for å enkelt installera/oppdatera på mac - la til val av «modes» (språk, pipevariant) i webdemo
- ymse rettingar og koderydding i webdemo og divvun-gramcheck
- begynte å undersøka LibreOffice-plugin
Problem:
- Linda: ikonet for å starta grammatikkontrollen har grøn strek, medan strekane i teksten er blåe. Bør vera same farge.
LibreOffice-plugg - ulike måtar å integrera på:
- LanguageTools: bruker Java
- C++ - lett å lenka til, men få som nyttar det
- LightProof bruker Python
- Voikko? Har gram.kontroll for finsk
Linda
- hjalp Duommá med disambigueringsregler
- fiksa kommaregler ved hjelp av Kevins nye tagger etter linjeskift
- snakka med Bigga om webdemotesting
Sjur
- blankteiknanalyse ut til alle språk
- undersøkte problem med “vuostái barge” - fungerer no for meg, ikkje for Duommá, jf lenger opp
Fleire forslag på same ord, overlapp, sletting
implementert i divvun-suggest; webdemoen må sannsynlegvis(?) oppdaterast til å handtera slikt òg. For å bruka det, må forslags-readingen (&SUGGEST) ha den relevante feiltaggen på seg.
$ cat test/suggest/input.delete-and-suggest.cg
"<dego>"
"dego" CS <W:0> @CNP ID:11
:
"<lávvomuorran>"
"lávvomuorra" N Sem/Dummytag Ess <W:0> @COMP-CS< &syn-not-dego R:DELETE1:11
"lávvomuorra" N Sem/Dummytag Sg Nom <W:0> @COMP-CS< &syn-dego-nom &SUGGEST
$ cat test/suggest/expected.delete-and-suggest.json |jq .
{
"errs": [
[
"dego lávvomuorran",
0,
17,
"syn-not-dego",
"not dego (dette er ei leseleg forklaring)",
[
"lávvomuorran"
]
],
[
"dego lávvomuorran",
0,
17,
"syn-dego-nom",
"dego nom (dette er ei leseleg forklaring)",
[
"dego lávvomuorra"
]
]
],
"text": "dego lávvomuorran"
}
Veldig bra! Akkurat det vi vil ha!
Samarbeid med Hanna O?
Utsett til etter Linda sin disputas.
Arbeid framover
Duommá
- held fram med å disambiguera pre- og postposisjonar
Kevin
- Alternative forslag inn i webdemo
- LibreOffice
- macOS
- Evalueringsprogram (men kva er spesifikasjonane?) - vent med det
Linda
- jobbar med avhandlinga
- hjelper Duommá
Sjur
- laga spesifikasjon for evalueringsprogram / testbenk