Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Giellateknomøte 15.4.

Til stades: Anders, Brede, Lene, Trond

Saker:

Brede

Velkommen!

Trond går gjennom praktiske ting etter møtet. Brede er borte v. 27, 28, elles her.

Leksikografi

Ting å arbeide med:

  1. metaordbok (ordbok over ordbøker)
  2. korpus (innhald: dobling?; grensesnitt: oppdatering)
  3. grensesnitt for ordboksredigering
  4. Samarbeid med det svenske Sametinget

Metaordbok

Praktisk

Vi vil ha noko slikt:

https://usd.uib.no/perl/search/search.cgi?tabid=571&appid=7

Trond diskuterer med forlag.

Ein nøkkel frå

moderne samisk
 -> Bergsland-Ruong (kanskje ikkje så viktig)
 -> Konrad Nielsen (svært viktig)
 -> Friis
 -> Itkonen
 -> Leem
 -> norsk + dansk + svensk
 -> finsk
moderne norsk
 -> 1800-talsdansk, svensk, (1800-talssvensk?), finsk, tysk

samisk - norsk

Arbeid:

norsk - samisk

Start ut med nds-ordbøkene: nob-sme, nob-fin Alle ordbøker til samisk Einspråklege ordbøker på norsk, svensk, dansk

Kjeldekode

https://github.com/giellatekno/metadictionary.git

Vi vil ha python og javascript

Vi vurderer satni.org.

Tilgang

Viss metaordboka skal vere på Azure må vi finne ut av tilgangssystemet.

Ordbøker

https://giellalt.github.io/dicts/dicts.html

Korpus

Prioritet: Oppdateringar.