Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Trond og Sjur, 7.5. 2013

Taggekonvensjonar.

Vi diskuterte denne saka, men skreiv ikkje referat, bortsett frå eitt punkt:

1908
"<sámi>" Hum Lang N Sg Gen  Hum N Sg Gen
	"sápmi" Hum N Sg Gen
	"sápmi" Hum Lang N Sg Gen <=== Duomma? T

(Lene har ordna dette).

Bugs

Bug 1663 - Dublettar i smi-propernouns.lexc

Sjur ser på det i namne-møte.

2000 nye homonym i sme (proper) - det burde ikkje ha hendt, kva har skjedd?

cat smi-propernouns.lexc|tail +13|sort|uniq -d|wc -l     (109)
cat smi-propernouns.lexc|tail +13|sed 's/% /%/g;'|cut -d" " -f1|sort|uniq
-c|sort -nr|grep -v ' 1 '|wc -l     (167)

Nokre døme på dette er :

Skogheim:Skog^heim9 HEIM-plc ;
Skogheim:Skog^heim9 HEIM-sur ;

Tanzania ACCRA-LOAN-plc ;
Tanzania ACCRA-plc ;

Joppe ACCRA-plc ;
Joppe BETFAGE-plc ;
Joppe ACCRA-sur ;

Bug 1653 - Fjerne Actio+Nom og Actio+Gen, og Der/NomAct+Sg+Nom fra paradigmene for passive verb?

Ja, fint.

Thomas gjer det.

Bug 1644 - Divvunprogrammet hopper ut av divvun-modus

Sjå på dette.

Bug 1633 - +Hom1 og +Hom2?

Nye namn på taggane

Buggar for manglande tekst i korpus

Sjur tar opp dette med Børre.

Bugg 1494 & 1542

Vart diskutert. Oppfylging i bugzilla.