The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Trond, Chiara, Lene
Ikke alt er fulgt opp.
Chiara har retta.
Grep-korpus: Chiara har oppdatert.
Spørsmålet er om smn hadde siste analysator for grep-korpuset. Problem: Dobbel POS-tag kom framleis gjennom i POS. Vi debugga dette i mars, det ser ut som om Chiara har siste versjon av smn-hfst på si maskin, men i grepkorpuset er det ein gammal versjon. Chiara analyserer på nytt.
Sem-taggar: Vi legg dei til for nordsamisk førebels. Lene ser på gruppering og sender forslag på epost.
msd får ikke brukervennlig oversetting (i Korp) Chiara fikser det
HFST-konfigurering for korpusanalyse: Trond diskuterer dette med Sjur og Børre
./configure --with-backend-format=openfst-tropical --enable-tokenisers
Ellers venter vi på at Sjur fikser slik at Use/MT tagget kode ikke kommer med, pluss at det er et numeralproblem i smj.
Chiara har testa, og det fungerer bra for sma og også for andre språk. Chiara oppdaterer sanit og baakoeh og inari slik at vi går over til HFST (og etterhvert de andre)
Lene har dette under arbeid, for å kunne lenke til ordboka
Trond har sett på dette men ikkje funne ut av det, skal sjå meir.
Trond går gjennom nob-orda i smenob og nobsme og sjekkar om dei manglar i nob.fst.
Lene orienterte om sme-smj MT og samarbeid med media
Vi bør få ut lister over ordpar som ikke er rørt, siden bidix blei generert, for å kunne sjekke dem. Lene skriver dokumentasjon for Chiara.
Vi diskuterte samarbeidet
Trond ser på økonomi.
Lene har skrive e-post til en ny person, vi får sjå.
Trond demonstrerte, vi diskuterte om hvor vi bør legge møtereferater om tagger osv. Viktig å være konsekvent med hva vi kaller ting, nå er det både North og Northern osv