Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Giellatekno-møte 18.8.

Til stades: Ciprian, Chiara, Lene, Trond

Saksliste

Saker

Velkomen og hei

Hei.

Oversikt over arbeidsområde

Grammatikk

Grammatiske modeller for mange språk, main/langs

Tekstsamlinger (tekstkorpora)

Tekst i fire kataloger:

.. med tre filtyper

Ordbokssamlingar

words/dicts/ inneholder 103 språkparkataloger, for ca. 110 språkpar, alle i xml-format

Ciprian har brukt xslt for å manipulere xml-kildefiler, slå sammen, …

Forrest + nettsider

Deling av techdoc: Trond og Ciprian, ta møte med Sjur og Børre om dette (orientere Chiara)

Logo som ein liten del av forrest.

Interaktive program på nettsidene (cgi-bin)

Dette er eit system som i prinsippet fungerer. Ciprian og delvis Trond har kontroll over dette.

Korp

Tekstkorpus + grammatisk analyse i http://gtweb.uit.no/korp

NDS

Chiara ser på det og blir med i diskusjoner i Edmonton.

Vi har en del åpne bugger, som Chiara kan ta utgangspunkt i.

Mindre ting

Forbedringer av NDS

Oahpa

Vi ser på dette etter hvert.

Konteaksta (Heli Uibo)

Konteaksta fungerer i prinsippet fint, men vi ville ha bedre innhold. Veien fram til lansering er kort.

Dokumentasjon av Konteaksta

Kursa (Wordpress)

Oppdateringer av Wordpress:

Ciprian og Lene ser på det, og diskuterer evt. med Bjørn.

MT (Jorgal)

(Til orientering)

Prinsipp for arbeidsdeling

  1. ICALL vs. lingvistar
  2. Frontend vs. backend

Elles ulikt fra sak til sak.