Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Giellateknomøte 14.10.2019

Tilstede: Trond, Chiara, Lene

Saker

Orientering

NODALIDA

Sørsamiske fagdager i Levanger

Over 40 deltaker, veldig god stemning. Seminaret traff ein tendens i tida.

Sametingenes felles språkseminar i Enare

Konferanse i Bergen

Trond vart invitert til å kommentere nynorsk- og bokmålsordboka. Det var interessant å sjå deira opplegg for vising av loggdata (som dei laga fordi dei så ofte fekk spørsmål frå journalistar).

Samisk som rettsspråk

Invitasjon til samarbeid om prosjekt om samisk som rettsspråk fra Juridisk fakultet, de har fått Fyrtårnsmidler. Møte i Tana 8. november 2019.

Åpen dag for VGS-elever 16.10 på UiT

Lene, Risten og Børre deltar med stand om samisk studietilbud og språkteknologi

Språkuka, arrangementer

HIF-kurs våren 2020

Kartlegging av servere

Chara og Børre og Trond har fått ei spørjeundersøking. IT-avdelinga vil kartlegge systema som er i drift. Chiara svarar på påminningsepost, deretter fyller Chiara og Børre ut skjema. Frist 25.10.

LIA materiale

Alt materialet er no prossesert og Lene legger filene ut på server for Tekstlabaratoriet.

Kursa wordpress

Wordpress-installasjonen er no flytta, det er fint. På lang sikt vil vi flytting til gtoahpa, i lag med kuvsje. Trond skriv og informerer om politikken.

Tokenisering og abbr-filer

Trond ser meir på HFST-tokenize si handsaming av nob, sme og sma. Dette er veldig viktig for parallelliseringsarbeidet.

SMARTool

Møte (Trond, Chiara) kl. 10.00 på torsdag om SMARTool (Strategic Mastery of Russian Tool) med CLEAR.

Nasjonalbiblioteket

Bergen er interessert i eit html-grensesnitt for Bokhylla. Vi vil ha dokumentasjon på dagens prosedyrer. Trond ser på det, og diskuterer med Språkbanken.

Korp oppdatering

nob2sme

nob2xme i biggies. Dei blir halde som ein eign bolk (2012) i Korp.

Bibeltekster

Vi køyrer ut dei tospråklege, parallellisere på versenummer. Trond ser på filene, format osv. og så vurderer vi når filene skal legges til i Korp. Vi bør se på missinglist også.

epub

Kva er formaliteten for å legge ut epub som er finansiert av Sametinget? Trond diskuterer med Børre.

Prosedyre

  1. orig + parallelisering > prestable
  2. vurdering, arbeid, reparallellisering
  3. manuell flytting til stable

Nedlastbare html-ordbøket

Vi må oppdatere de nedlastbare html-ordbøkene og sjekke at linkene på internett fungerer, i god tid før tentamen/eksamenstid

[http://dicts.uit.no/smedicts.sme.html]

Trond ser på det og diskuterer evt. med Chiara.

Paris: Language Technologies for All (LT4All) Conference

Lene og Trond diskuterer med Sjur og legg ein plan.

Reiser framover