Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Giellateknomøte 3.11.21.

Saker

Korp

Chara laga eit nytt grepkorpus i dag tidleg for alle dei samiske, og lastar dei opp i dag.

Forfattarnamna er ikkje synleg i Korp. Chiara ser på følgjande løysing: Scramble setningar og leggje til forfattarnamn i metadata.

Innsjekking av konvertering

Hva er hensikten? Kan vi fikse i de innsjekka filene? f.eks. endre bokstaver som ikke lar seg konvertere i pipeline? Trond tar det opp med Børre og Sjur.

Ordbild

Teste med semtagger på en sjangerkorpus

Bibel

Kan vi få den norske bibelen for parallellisere til Korp? Trond tar opp med selskapet, og spør også om 1896-bibelen.

NDS

Mobil

sanj og alle andre ordbøker ventar på Korp-arbeidet.

Lenkje til attenemelding

Autocomplete Chiara

Rydd i spellerlaxfiler i src/orthography Trond

UD

Søknadshandsaminga går framover. Hugs agitprop.

Lemmatesting

Lene lagde forklaring på lemmatesting til Trond Ty. Prinsipp: Så mange lemma som mogleg skal med.