The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Trond, Lene, Chiara
under arbeid, grensesnitt + innhold oppdatering
Chiara lager grep-corpus for samisk så snart Tronds endringer i sms er med
Seemantiske tagger skal ikke filtreres bort, men være med i Korp. Vi gjer forenklinga på Korp-sida.
cat src/fst/root.lexc |grep 'Sem/'|wc -l
282
cat src/fst/root.lexc |grep 'Sem/'|cut -d"_" -f1|sort|uniq|wc -l
153
Lene lager forslag til forenkling av semtagger, til i mårra
Ingen svar frå Noreg eller Finland enno.
Vurdering: Gå direkte til Sametinget
Trond diskuterer dette med Sjur og Børre
./configure --with-backend-format=openfst-tropical --enable-tokenisers
Dette er på lista over forbetring i Korp.
Lene skal skrive dokumentasjon om ordavledninger og linke fra NDS-artikler
Det er ønske Legge inn eksplisitt stjernesøk i selve xml-fila (dvs at søket ikke blir sendt til analysator), evt. som regexsøk. Dvs at regex-søket innledes med f.eks. % . Chiara ser på dette etter Korp-oppdateringa
Sette opp automatisk oppdatering av NDS på server. Chiara ser på dette når hun har tid.
Trond diskuterer med Orakelet.
Vi oppdaterer lista i dokumentasjonen.
Vi bør arrangere sommarjobbprosjekt for studentar, både samisk masterstudenter og IT-studenter
Trond sjekker økonomien, vi alle tenker på temaer
Trond og Chiara ser på dette.