Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Møte 2.2.2017

Tilstede Trond, Lene, Ciprian

Saker

NDS lokalisering sme-nob

Det store problemet med lokaliseringa er løst, men vi arbeidet med å få en bra forklaring på standard vs. tolerant versjon.

Tiltak:

Status for MT arbeid

Vi lanserte smenob i går, men arbeidet fortsetter med nattlige oppdateringer (Lene, Kevin, Trond). Vi har for øyeblikket problemer med oppdatering fra sme på GT-sida, pga av at nightly-skriptet stopper ved endringer i giella-shared som krever oppdatering og kompiliering der. Sjur kommuniserer med Tino om dette.

Fra bidix til NDS

Vi vil lage sme-sma/sma-sme og sme-smj/smj-sme

Lene skriver epost til Sandra om dette.

Automatisk dict-generering:

  1. Fleire enn ei omsetjing: kvar skal ha si mg, og
  2. Tom omsetjing: Konverter samtidig med dei andre, men til ei eiga fil.
  3. Ikkje ta med regex, ikkje ta med ABBR eller ACR
  4. LR: berre i sme-sma og RL: berre i sma-sme
  5. np (proper nouns): Berre viss sme =/= sma
  6. legg inn i dict/smesma/src/x_smesma.xml, osb. for smasme, smjsma, smjsma

Tilsvarande for smj.

smj skal inn i sanit, sma skal inn i sanit og baakoeh, i første omgang under en TEST-label.

Arbeid med NDS:

Legge til i conf.py osb, ordne spellrelax.

Framdriftsplan

smX-smX med sme som nav

Dette blir neste steg. Vi ser på dette om et par uker.

TM (Translation memory)

På denne sida [/tools/Paratekst.sme.html] ta alle parallelle sme-smn-filer (i apertium/nursery/apertium-sme-smn/tmx_data og i apertium/nursery/apertium-sme-smn/fi.samediggi/ og legg dei her:

[http://divvun.no/static_files/nob2sme-tmx.zip]

Tiltak: