Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

T&S-møte

Korpus

Trond vil dobla det nordsamiske korpuset.

Innsammlingsarbeidet stoppar opp på ulike stader:

Børre var på runde i mai. Det var positivt, men treng oppfølgjing.

Plan: Kombinere stavekontrollinstalleringsrundreise med møte med forfattarar og forlag.

Andre kjelder: Nasjonalbibliotek, offentleg, andre. Utsett til neste møte.

Kva er status for automatisk korpushausting? Får vi med oss alt?

stavekontrollstatus

hfst

Ei lus knytta til feilmodellhandteringa: klarar ikkje å retta feil der ukjende teikn skal bli ståande: 9-1ágasj -> 9-lagasj funkar ikkje.

sma/sme/smj

Rett forslag i topp-5 for stavekontrolltesting, feilkorpus=typoslista:

Polderland er betre, (mellom 80% og 90%), men skilnaden blir mindre.

Ting som står att før lansering:

Bugzilla

Seinare.