The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Tilstede: Chiara, Trond, Risten, Lene, Børre (under første sak)
Ny medarbeidar hit for å få opplæring. 6 mnd i 100%? lågare prosent? Lene har en mulig kandidat på handa, primært for å følgje opp forlaga.
Innholdet var sist oppdatert oktober 2018.
Oppdateringa bør forenkles, hvilke hindringer har vi?
TILTAK
/home/corpus/freecorpus/00_readme.txt på gtweb
)Dei treng ein eigen katalog under gtweb, parallelt med boundcorpus.
Ikkje i svn = *
orig/
converted/*
tmx/*
prestable/tmx/nob2sme
Arbeidsrutine:
Så skal dei tospråklege tekstane inn i Korp (dvs. inn i SIKOR).
Vi parallelliserer i tre delar:
Filene ligg i orig
Lene møblerer stable etter mal frå prestable. Vi må deretter få ei rutine for å unngå å parallellisere dei same filene på nytt. CorpusTools må sjekke om fila allereie eksisterer i stable før det parallelliserer nye filer til tmx. Deretter vil Chiara finne det ho treng i stable.
Framlegg: Kan vi legge negative data inn i parallellfila?
Lene legger til i bargovuohki om praktisk parallellseringsarbeid, grunnlagt på diskusjoner på møtet
Børre skriv til Sametinget og ber dei bruke epub i tillegg til dei formata dei har. Mange sametingsrepresentantar vil like det, og for oss vil det vere svært viktig.
Nordsamisk, parallellisering.
Viss den eine setninga inneheld meir tekst enn den andre ignorerer vi det.
Trond gjør ferdig smi-løsninga for abbriviation, og tester
Chiara og Trond orienterte.
Tar vi etter kvart (koordinering buss og togbilletter)
Kjem hit i morgon. Vi har møte med han på fredag, kanskje halv ni og framover?
Klimastreik kl. 9-10.