The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
T&S-møte
Trond vil dobla det nordsamiske korpuset.
Innsammlingsarbeidet stoppar opp på ulike stader:
Børre var på runde i mai. Det var positivt, men treng oppfølgjing.
Plan: Kombinere stavekontrollinstalleringsrundreise med møte med forfattarar og forlag.
Andre kjelder: Nasjonalbibliotek, offentleg, andre. Utsett til neste møte.
Kva er status for automatisk korpushausting? Får vi med oss alt?
Ei lus knytta til feilmodellhandteringa: klarar ikkje å retta feil der ukjende teikn skal bli ståande: 9-1ágasj -> 9-lagasj funkar ikkje.
Rett forslag i topp-5 for stavekontrolltesting, feilkorpus=typoslista:
Polderland er betre, (mellom 80% og 90%), men skilnaden blir mindre.
Ting som står att før lansering:
Seinare.