The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Stavekontrollar for mobiltelefonar, møte 14., 15. og 18.1.2019
Saker:
Er dokumentert her.
Analysatorvektene blir spesifiserte i denne katalogen
tools/spellcheckers/fstbased/desktop/weighting/
av desse to filene:
Og vektene i feilmodellen ligg her:
tools/spellcheckers/fstbased/desktop/hfst/
, og er desse fem filene:
Endeleg vekt på forslag = analysatorvekt + vekt frå feilmodell
Byt ut desktop
med mobile
for vektinga for mobilkstavekontrollen!
$ echo Viellka | divvunspell -S -z smj-mobile.zhfst | head -n 15
Reading from stdin...
Input: Viellka [INCORRECT]
Viellja 11.609375
Giella 18.619987
Giellda 20.51159
Vielja 21.89746
Viellde 23.090923
Viellida 23.590923
Viellit 23.590923
Vielljaj 23.590923
Vielljan 23.590923
Vierkka 23.590923
Viehka 27.546875
Miella 29.163086
Vieleda 31.302734
Jiella 32.590923
vïelle -
vielle -
$ echo Vïellke | divvunspell -s -z tools/spellcheckers/fstbased/mobile/hfst/sma-mobile.zhfst | head
Reading from stdin...
Input: Vïellke [INCORRECT]
Vïelle 21.18164
Vïelline 21.371094
Vaellie 23.181967
Vellie 23.181967
Vïelje 23.181967
Vïelli 23.181967
Vïellide 23.181967
Vïellige 23.181967
Vïelleme 26.300001
$ echo Vielle | divvunspell -s -z tools/spellcheckers/fstbased/mobile/hfst/sma-mobile.zhfst | head
Reading from stdin...
Input: Vielle [INCORRECT]
Vielie 8.183745
Bielie 10.1075735
Vïelle 12.181641
Vuelie 12.585113
Voelpe 13.037261
Gielie 14.714215
Velle 15.181967
Vellie 15.181967
Vislie 16.010395
$ time echo dáhtttu | divvunspell -s -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head
Reading from stdin...
Input: dáhtttu [INCORRECT]
dáhtto 0.5107422
dáhttu 5.6054688
sáhttu 12.048828
fáhttu 14.301799
máhttu 15.249023
gáhttu 15.301799
dáhttut 16.82129
dáhtu 17.313477
dáhttui 18.386719
$ time echo muhtin | divvunspell -S -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head
Reading from stdin...
Input: muhtin [CORRECT]
johtin 5.9035645
mohtin 6.301799
muhtin 8.017578
mohton 8.301799
mohtun 8.301799
lohtin 8.419841
muhtun 9.350586
muhtton 14.301799
murdin 14.537883
$ time echo muhtun | divvunspell -S -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head
Reading from stdin...
Input: muhtun [CORRECT]
mohton -2.6982012
muhtton 3.3017988
mohttun 5.3018
mohtun 6.301799
muhtun 7.350586
muhto 7.4472656
mihton 8.301799
mohtin 8.301799
lohtun 8.419841
muhtin
muhtin muhtin+Pron+Indef+Attr 0,000000
muhtin muhtin+Pron+Indef+Sg+Nom 0,000000
muhtun
muhtun muhtun+Pron+Indef+Attr 0,000000
muhtun muhtun+Pron+Indef+Sg+Nom 0,000000
jag skriver “muhtin” venstre: “muhtin” mitten: “johtin” høgre: “mohtin”
jag skriver “muhtun” venstre: “mohttun” mitten: “mohton” høgre: muhtton
aha: jag skriver “dáhtttu” venstre: “sáhttu” mitten: “dáhtto” høgre: “dáhttu”
jag skriver “positiiválaččat” venstre: ““positiiválaččat”” (inom citationstecken) mitten: “positiivvalaččat”
echo positiiválaččat | divvunspell -S -z tools/spellcheckers/fstbased/mobile/hfst/se-mobile.zhfst | head
Reading from stdin...
Input: positiiválaččat [INCORRECT]
positiivvalaččat 4.286133
Det betyr: det til venstre (i hermeteikn) er det du skriv, og det i midten er det som stavekontrollen føreslår, dvs berre eitt forslag.
For å arbeida med forslaga:
devtools/test_ospell-office_suggestions.sh