The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Døme på korleis vi automatisk kan finna real-word-feil:
-it
-at -boahtán boahtan (bytte på a og á og analysere for å se om det fins et lemma)
Vi treng meir autentisk materiale - elevtekstar?
* valens i leksikon?
- ikkje i leksikon, men i CG?
- verb - subj human objektet - acc - tekst (čállit) <Ag_Nom_Hum__Th_Acc_Text>
- subj human advl - ill - human <Ag_Nom_Hum__Go_Ill_Hum>
čállit <Ag_Nom_Hum__Th_Acc_Text> <Ag_Nom_Hum__Go_Ill_Hum>
Per i dag i ei separat valensfil i xml-format, som ikkje er integrert med resten av infrastrukturen. Bør konverterast til eit format som kan integrerast med lexc / den leksikalske transduceren.
TODO:
Hallo! Sihtabet go ovttasbargat Divvun-teamain? Divvun-teama lea ráhkadišgoahtán grammatikkontrolla ja dárbbaha ollu feilkorpusa dan oktavuodas.
-Mii lea grammatikkontrolla? Dálá Divvun-prográmma lea dusse Speller, mii gávdná sániid, mat leat vearrut cállon. Dat ii huobmá jos lea atnán dugo vearrukásusa
Mii dárbbašit teavsttaid maid vuosttašgielat nuoraid- ja joatkkaskuvlaoahpit leat čállán. Maid dárbbašehpet bargat: Čoaggit teavsttaid, sáddet daid e-boastan midjiide. Jus ehpet háliit anonymiseret daid, de mii bargat dan.
Dušše min dutkit besset dáid teavsttaid geavahit.
Boađus: Friddja grammatikkontrolla mii lea vejolaš geavahit MS Office:s ja OpenOffice.org:s