Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Onsdagsmøte 3.12.

Saksliste

Forrest-deling

  1. kopiere gtuit til gtuit2 (svn copy)
  2. dele gtuit og techdoc, på denne måten:
    – flytte techdoc-symlink frå gtuit/…/doc direkte til “sd-techdocen”
  3. la gtuit vere på nett, men endre alle namn i gtuit2 Dette må bli gjort:
    1. i nye fleirspråklege forrest vil alle filer av typen namn.xml vere einspråklege, vi må lage symlink med språkprefiks for å få fleir enn eitt namn
    2. språksuffiksa må vere en, fi, no, ru, se.
  4. svn mv gtuit2 gtuit

Fjerne/kopiere symlink frå $GTHOMExtdoc/gtuit/../xdocs/techdoc til $GTHOME/xtdoc/techdoc/..../xdocs/doc

$GTHOME/techdoc er i begge tilfelle den ekte katalogen

Vedtak:

Spørsmål:

  1. Generere språkval inn på dei ulike sidene vs manuelt lage språkheader: Kan automatiske flaggrekker (krysslenkjing) bli gjort i “gammal” forrest?
  2. Lokalisering av teksten på tab

Lenkjekontroll

Børre skal endre lenkesjekken til at det blir færre irrelevante alarmar Vi vil skilje mellom interne og eksterne lenkjer. Vi må sjekke at viktige lenkjer fungerer.

Framlegg:

Forrest-kontroll

Oppdatering på Oahpa, dict, cgi

Clarino

Cip: Vi skal vere alfatestar for Nasjonalbiblioteket / Mo i Rana. Problemet med TROLLing er at det er ein annan type repositorium

Framlegg til liste over ressursar å dele (Trond: Diskutere med Kone-prosjektet):

fst-ane: Bruke /opt/smi på gtweb som base? Nei, fordi du må ha kjelden i pid-repositoriet.

Dermed må vi lage eit script for oppdatering, t.d. årleg.

faofst Faroese transducer
finfst Finnish transducer
fkvfst Kven Finnish transducer
kalfst Kalaallisut transducer
kpvfst Komi-Zyrian transducer
livfst Livonian transducer
mdffst Moksha transducer
mhrfst Eastern Mari transducer
mrjfst Western Mari transducer
myvfst Erzya transducer
nobfst Norwegian Bokmål transducer
olofst Livvi transducer
rusfst Russian transducer
smafst Southern Sami transducer
smefst Northern Sami transducer
smjfst Lule Sami transducer
udmfst Udmurt transducer
vrofst Võro transducer
yrkfst Nenets transducer

finkpv Finnish Komi-Zyrian dictionary
finmdf Finnish Moksha dictionary
finmrj Finnish Western Mari dictionary
finmyv Finnish Erzya dictionary
finolo Finnish Livvi dictionary
finsme Finnish Northern Sami dictionary
finyrk Finnish Nenets dictionary
fkvnob Kven Finnish Norwegian Bokmål dictionary
lavfin Latvian Finnish dictionary
lavliv Latvian Liv dictionary
mdfmyv Moksha Erzya dictionary
myvest Erzya Estonian dictionary
myvmdf Erzya Moksha dictionary
nobfkv Norwegian Bokmål Kven Finnish dictionary
nobsma Norwegian Bokmål Southern Sami dictionary
nobsme Norwegian Bokmål Northern Sami dictionary
rupron Macedo-Romanian Romanian dictionary
rusolo Russian Livvi dictionary
smafin Southern Sami Finnish dictionary
smanob Southern Sami Norwegian Bokmål dictionary
smasme Southern Sami Northern Sami dictionary
smaswe Southern Sami Swedish dictionary
smeeng Northern Sami English dictionary
smefin Northern Sami Finnish dictionary
smenob Northern Sami Norwegian Bokmål dictionary
swesma Swedish Southern Sami dictionary

sma open corpus
sme open corpus
smj open corpus
smn open corpus

giellatekno/divvun infrastructure

sma open annotated corpus
sme open annotated corpus
smj open annotated corpus

Ordbøkene smenob/nobsme og fad2

Avtaler med forlaga Nasjonalbiblioteket

Konklusjon for xml-namn i nds:

xml_src:

Tekniske problem:

Teikn i strengen som lemma gav problem med å kompilere Geo.

Så kom Jaska med eit anna problem: Sortering.

Det er ikkje mogleg å sortere hans alfabet

Loggar: Har vi logg frå Apertium?

NDS ei veke = satni.org 7 mnd

Diskusjon om stor forbokstav i NDS: Trond skriv svar i disk

Neste möte

17.12.