The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Chara laga eit nytt grepkorpus i dag tidleg for alle dei samiske, og lastar dei opp i dag.
Forfattarnamna er ikkje synleg i Korp. Chiara ser på følgjande løysing: Scramble setningar og leggje til forfattarnamn i metadata.
Hva er hensikten? Kan vi fikse i de innsjekka filene? f.eks. endre bokstaver som ikke lar seg konvertere i pipeline? Trond tar det opp med Børre og Sjur.
Teste med semtagger på en sjangerkorpus
Kan vi få den norske bibelen for parallellisere til Korp? Trond tar opp med selskapet, og spør også om 1896-bibelen.
sanj og alle andre ordbøker ventar på Korp-arbeidet.
Rydd i spellerlaxfiler i src/orthography Trond
Søknadshandsaminga går framover. Hugs agitprop.
Lene lagde forklaring på lemmatesting til Trond Ty. Prinsipp: Så mange lemma som mogleg skal med.