The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Giellateknomøte 21.11.2018
Til stades Chiara, Ciprian, Lene, Trond
Lene har vore her tidlegare, dei har det ein gang i året. No var Lene og Chiara der med artikkel og poster.
Presentasjonen av posteren gjekk fint, mange såg på Konteaksta.
Sjölve konferansen var interessant relevant feedback om retting av språk: Logg in på Googledoc og få viss type hjelp
Fokus var automatisk retting og karaktersetting av studentoppgåver.
Alle artiklane ligg på nett.
Workshop: Adriane Boyd, som skreiv ein del av koden på Konteaksta, som Chiara deretter kan kontakte.
Vi vil ha postarane (denne og tidlegare) på veggen.
Lene og Börre var der. Interessant møte.
Trond føredrag: Utfordrende bokstaver og språklyder
Vi oppsummerte.
Vi oppsummerte.
Oppdatere Korp-side for brukarar:
lenkje til [http://gtsvn.uit.no/freecorpus/orig]: dette er nå gjort
Det fungerte for versjon 5.
Det fungerte for versjon 5.
Ciprian kjem med ei ny liste som vi kan oppdatere.
Dette betyr ikkje “fråver av regex” eller “tolk bokstavleg.” Derimot betyr det “negasjonen av den regexen du har skrive” Grunnen til det har kanskje med negasjonsoperatoren for parallellkorpus å gjere?
Det er opent kva som er funksjonen til dette. Ciprian undersøker, og vi forbetrar dokumentasjonen eller fjernar.
Det har vi ikkje.
Dette er ikkje implementert.
Det skal han få (av Ciprian).
Dette er ikkje implementert, men det er krav om det. Dette kan vi evt. få hjelp med frå IT-avdelinga. Jf. også http vs. https.
Chiara tar http vs. https opp med IT-avdelinga.
Chiara og Ciprian gjer det.
Vi legg til attributta Wordcount
og Sentencecount
for å sjå kor mange ord og setningar ei fil har.
Dette for debugging.
Desse minimale filene kan ha problem med dependensrelasjonar. Det skal vi rydde opp i på grammatikksida.
Ciprian skriv ein rapport om erfaringar frå oppdateringa, og vi tar opp det. Dette gjeld ulike aspekt ved korpusprosesseringa.
Vi tar ein gjennomgang.
Vi har fått purringar om servar-flytting.
satni.org er oppdatert Dei andre servarane er nye.
Oahpa-versjonar i bruk:
[http://giellatekno.uit.no/ped/common/logextraction.html]
Vurdering av kva som er i bruk og ikkje (sjå Oahpa-punktet nedanfor)
[http://giellatekno.uit.no/ped/common/GtlabRestart.html]
Dette i løpet av november.
Vi satsar på Jaska sine dagar og inviterer Josh også. Viss Josh ikkje kan vurderer vi etter jul.
Vi bør lage tospråklige tmx-filer fra ordboksmaterialet, eksempelsetningene med oversettinger. Lage pipeline for dette: Ciprian.