Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Giellateknomøte 25.5.

Til stades: Chiara, Ciprian, Lene, Trond

Saksliste

Servarsaka

Problem med oahpa

Gammal django (var: 1.3, er no: 1.11)

Konteaksta

Oppdatert java, maven og apache-tomcat, men alt er ikkje oppdatert. For å oppdatere all kode tar det kanskje 2 mnd.

satni.org

Skal ha:

Serveroppgradering

Tiltak:

Ein plan for migrering

Det vi vil: Ha nye, gode e-læringssystem med oppdaterte støtteprogram

Vurdering for vegen dit:

Nokre system vil vi ha operative utan 2 mnd pause Andre system kan godt vente

Migreringsplan, overordna:

  1. Gamle servarar
    1. Steng ned applikasjonar vi har mistanke om ikkje er i bruk på dei gamle servarane
    2. La dei som er i bruk, være på server
  2. Nye servarar
    1. Installer ny støtteprogramvare
    2. Bygg oppdaterte versjonar av vår programvare på ny servar
    3. Flytt dei til ny servar etter kvart som vi har ny programvare

Tiltak:

  1. Chiara og Ciprian arbeider med dette
  2. Ciprian informerer IT-avdelinga

Samarbeid med Nord-Troms VGS

Chiara og Lene hadde kurs for samisklærere ved NT-VGS i Nordreisa 22. mai. Utprøving av Konteaksta resulterte i en todo-liste. Lærerne skal gi to typer tilbakemeldinger:

  1. underveis, med epost og FB-gruppe
  2. skjema for evaluering etter at de har prøvd ut programmene med elever (på høsten)

Konteaksta: Tilgang til loggdata. Chiara diskuterer med Heli.

Referat fra konferanse

Ciprian har vært på konfransen i Bukarest og har vært veldig skeptisk til noe pseudo-grammatisk eksempler til en phd om klitika og i en referanse-grammatikk for Rumensk. Han fikk tilbakemelding til kritikken sin og hadde svar på alle motargumenter fra redaktører av referanse-grammatikken.

Han var også i Spania med tema: Optional sandhi in Romanian clitic pronouns. Artikklen ble sendt til godkjenning.

Divvun-serveren

Vi må ordne påloggingsproblemet (Børre).

Korpus, Korp og sma:

sma-listene som Maja skal opprette (“klassisk” sma, etc.) Divvun må hjelpe henne med tilgang til selve originalfilene også i bound.

Løsning: Børre og Sjur skal ordne tilgangen til boundcorpus for Maja.

Divvun på ulike plattformar

Vi ser at Tekstproduksjon blir

Eventuelt

LIA

Ciprian skal lage pipeline slik at Lene kan forbedre analysene, og oppdatere fila. Ciprian skal fikse buggene som er ikke så relevante for outputten.

Max Plank har laga ein plugin for NLP-verkty i ELAN. Ciprian ser på om vi kan bruke infrastrukturen for det.

Bibelselskapet

Lene har sendt lister over missing og setninger med potensielt vanskelige NP-konstruksjoner, vi ventar på attendemelding.