The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Tilstede: Ciprian, Chiara, Trond, Lene
Viss vi har bestemt at vi skal ha xfst inn sjekkar vi missing list, taggar,
Samanlikning hfst - xfst er til
Samanligning xfst - førre xfst som regresjonstesting
Alle dei samiske språka. Andre språk er ikkje så relevant for Oulu.
Dette er ikkje berre pipelineproblem, jf. bz 1234.
For korpusprosessering til neste Korp: Semtaggane blir brukt i analysen, men ikkje sett inn i Korp. Ciprian fjernar dei med andre ord i steget frå analyse til Korp.
Err/Lex og Err/Orth – vi fjernar dei også i Korp.
NB! Nye taggar skal ikkje berre i root.lexc, men også i filterfilene.
I staden for å ha eit ekstrafelt for andre, har eg ein separator (unik) i eit eksisterande felt. For samansette ord kan vi ha /for ABC: C som lemma, deretter separator og info (BA). Dermed blir informasjonen ikkje kasta bort.
Viss vi søker på “skuvla” får vi opp ikkjesamansette ord med “skuvla” som sisteord.
MT i LIA; I og med at dei lenkjer til online-MT i grensesnittet, treng vi ikkje omsetje som del av pipeline.
Trond ser på dette neste veke.
Vi diskuterte šibitbussevuoddji og miessemánnofeasta
miessemánnofeasta
miessemánnu - mai
feasta - fest
-----------------
miessi - reinkalv
mánnu - måned
feasta - fest
Ciprian tar kontakt med IT om gtsvn (vi har ein plan)