Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Grammatikkontrollmøte 6.9.2017

Til stades: Duommá, Kevin, Linda, Sjur

Saker:

Sidan sist

Kevin og Sjur har hatt møte i Helsingfors. Referat frå Helsingforsmøtet her.

Linda & Duommá

Nummer- og talprosesseringa må bli betre, med feiltaggar for feilaktige taluttrykk. Døme:

"<163 - 250>"
        "163 - 250" Num Arab Sg Acc <== Err/NumRange
        "163 - 250" Num Arab Sg Gen
        "163 - 250" Num Arab Sg Ill Attr
        "163 - 250" Num Arab Sg Loc Attr
        "163 - 250" Num Arab Sg Nom

Det skal vera:

163–250 (n-dash)

Men - kva med tvetydige lesingar:

Ikte ledje dušše 163 - 250 olbmo leat boahtán odne.
Igår var det bare 163 - 250 mennesker har kommet idag. =
Igår var det bare 163 ; 250 mennesker har kommet idag.

Det finst (iallfall) tre ulike moglege rettingar, avhengig av kontekst:

Matematisk bruk:

163 - 250 er -87

(men der skal det vel ikkje vera mellomrom?)

Integrering med stavekontroll

input:

"<ukjendord>"
        "ukjendord" ?

output:
"<ukjendord>"
        "ukjendord" ?
        "forslag" A Stavekontroll

LIST ukjend = ?;

input:

"<kjent>"
        "kjent" A

output, viss me stavar kjende ord òg:
"<kjent>"
        "kjent" A
        "forslag" A Stavekontroll

Vi vil prøva ut å setja inn stavekontrollen etter hfst-tokenise. rett etter mwe-split, men før disambigueringa, ved å bruka hfst-ospell-cg. Stavekontrollen vil gje forslag med analyse, slik at vi kan disambiguera vekk irrelevante forslag, samtidig som vi har betre data for resten av dsiambigueringa (faktiske, moglege analyser istf spørsmålsteikn).

Vi vinn:

Vi tapar:

LT-integrering?

LanguageTool er open kjeldekode for å integrera ein grammatikkontroll med LibreOffice, OpenOffice, Google Chrome og Firefox. Vi kan bruka integreringskoden deira for å få tilgang til vertsprogramma på ein enkel måte. Seinare kan vi kanskje bli ein alternativ backend til LT.

Fungerer ikkje interaktivt.

Testing og evaluering

Vi treng eit kommandolineverkty som kan nyttast til å testa og evalueringa grammatikkontrollen. Her er to døme på korleis evalueringsresultata blir vist i stavekontrolltestinga:

Andre ting

arbeid framover

Kevin

Linda

Neste møte

Onsdag 27.9. kl 10.30