The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
S&T-møte 25.6.2019
Utlysing av programmerarstillingane: norsk tekst er sendt inn for lenge sidan, har vorte vidareformidla til nivå 1. Engelsk tekst vart sendt inn i dag.
SEE-oppsettet var ikkje på plass med tanke på omstartar. Sjur har retta det slik at SEE no kjem opp automatisk neste gong maskina blir starta på nytt.
Konferanse om sørsamisk grammatikk, med mål om å få fram ny kunnskap om grammatikken.
Framdrift for vitskaplege innlegg
Publisering i Nordlyd: Sjur jobbar med saka.
30.9.-2.10., ein dags overlapp med sørsamiskseminaret.
Det er fleire som planlegg innlegg, men alle kjende så langt er knytta til workshop den 30.9., slik at folk kan nå begge arrangementa.
I november. Usikkert kven som dreg, om nokon.
Dvs giellalt.
Infrastruktur
FST-
- kompilering
- testing
- ...
Applikasjonar
- proof
- mt
- gc
Servers
Sysadm
Sjur har sett på dette.
Her har vi ein perl-kode som føreset at ting ligg på bestemte plassar i høve til perl-fila. Vi må i staden ha eksplisitte stiar.
Det minst komplekse er (1), vi går for det. Kunsten er å referere til filer eksplisitt (definere referansane) og ikkje implisitt, som i dag.
Trond testar no splitting av sme-forkortingar i generelle og språkspesifikke filer:
LE Root
Abbreviations ;
LE Abbreviations
Abbreviation-sme ; ! til språkspesifikk
Abbreviation-smi ; ! til fellesfila
Mange språk har ikkje den nye preprosesseringa, t.d. nob. For parallellisering (t.d. sma-nob) må vi dermed nytta det gamle oppsettet med preprocess osb.
Trond tar dette vidare.
No kan det sjå ut som om parallelize.py bruker verken ny eller gamal, men derimot tca2 i parallellisering. I så tilfelle vil heile denne diskusjonen vere irrelevant for korpusparallellisering, i alle fall heilt til vi endrar parallelize.py.
Det er mogleg at det å bruke tca2 for parallellisering inneber at vi må bruke tca2 også for tokenisering. Dette må vi diskutere med Børre.
For desse endringane treng vi før- og etter-testar, for mange ulike språk.
Sjur svarar Sametinget, og melder seg som mogleg representant.