Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

T&S-møte 11.4.2017

Saker:

OmegaT

Dokumentasjonen er no (litt) omorganisert.

Samansette ord i andre former enn sgnom, sggen, plgen

$ echo Guovdageainnieiddat-spábbačiekčanjovkui | hfst-lookup -q src/analyser-gramcheck-gt-desc.hfstol
Guovdageainnieiddat-spábbačiekčanjovkui	Guovdageainnieiddat-spábbačiekčanjovkui+?	inf

Med hfst-tokenise:

"<Guovdageainnieiddat>"
	"nieida" N Sem/Hum Pl Nom <W:10>
		"Guovdageaidnu" N Prop Err/Orth Sem/Dummytag Cmp <W:10>
	"nieida" N Sem/Hum Sg Acc PxSg2 <W:10>
		"Guovdageaidnu" N Prop Err/Orth Sem/Dummytag Cmp <W:10>
	"nieida" N Sem/Hum Sg Gen PxSg2 <W:10>
		"Guovdageaidnu" N Prop Err/Orth Sem/Dummytag Cmp <W:10>
"<->"
	"-" PUNCT <W:0>
"<spábbačiekčanjovkui>"
	"spábbačiekčanjoavku" N Sem/Group_Hum Sg Ill <W:0>
	"čiekčanjoavku" N Sem/Group_Hum Sg Ill <W:10>
		"spábba" N Sem/Obj-play Cmp/SgNom Cmp <W:10>
	"joavku" N Sem/Group_Hum_Plc Sg Ill <W:10>
		"spábbačiekčan" N Sem/Act Cmp/SgNom Cmp <W:10>

Guovdageainnieiddat-spábbačiekčanjovkui er eigentleg “Guovdageainnieiddat”-spábbačiekčanjovkui, jf. go-gážaldat.

Dvs.: frå leksikon K, gå ikkje berre til # men også til Nouns, med eigen tagg +Cmp/Cit. Evt.: analyser alle “a-b”-ord i korpuset og sjå kor mange som har noko anna enn N som førsteledd.

Mobiltastatur

Jf [http://www.firstvoices.com/en/apps]

Kontraktane på veg i boks.

smj-lingvist

Ingen søknader pr 10.4.

Påskeferie

Sjur borte onsdag 12.4., og halve/heile 18.4.

Russisk og vekter

Trond si kommandorekke fungerer.