Language Technology at UiT The Arctic University of Norway

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Giellateknomøte 23.12.

Tilstede: Trond, Chiara, Lene

Saker:

Oppsummering av hausten

Artiklar

Registrering i Cristin:

Andre ting

Stavekontrollanseringar

Enaresamisk

Mastersudentar

Migrering til python3

Korpusoppdateringa

Status:

Oversikt i korp_corpus.txt under admin i det private korpuset.

  1. u_korp = mhr 50, myv 9, mdf 9, mrj 5 mill ord.
  2. f_korp = fiv parallelltekst, fit, fao.
  3. korp = SIKOR, mykje ny parallelltekst

Vi ser på prioritering av f_korp og korp den 4.1.

Grensesnitt

Grafikk

Sikor mer synlig enn Korp

Markering av aktivt språk

Ønskjemål: klårare markering av kva apråk som er aktivt

Tospråklege tekstar

vi må ha ei rullegardin for all fleirspråkleg tekst

NDS

Her har det skjedd lite i det siste.

Automatisk oppdatering av innhald: Dette gjer vi etter migrering til git.

Våren

Planar for artiklar

MT

Apertium

smj, sma, …

NMT

Helsingfors har laga oppsett for NMT for samiske språk. Uleåborg vil ha MT-kurs, bruke både Hfors og oss.

Vi vil samarbeide med både Helsingfors og Uleåborg om dette.

CG

Trond diskutere med Eckhard om eitt språkpar og tilpassing til ny struktur i git.

Sosiolingvistikk

Vi bør samarbeide om phd-kurs

Fellesseminar der studentane blir kjent + der institusjonane presenterer seg sjølv og ressursane sine. Også

Undervisning

Språkhistorie

Trond Våren 2021.

Elles har vi ikkje undervisning.

Språkteknologi og korpuslingvistikk

Våren 2022

Digitalisering og Samisk arkiv

Vi bør invitere Arkivverket til eit møte om dette:

Trond følgjer opp dette.

Servarar

Automatisk status: https://github.com/divvun/registry

gtweb, gtoahpa, gtdict

oahpa.no

Det har ikkje vore oppdatering av oahpa-dokumantasjonssidene sidan juni 2019. No blir det ein del aktivitet framover.

Nasjonale minoritetsspråk

Trond diskutere dette med relavante kanalar.