Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Parallelliseringsmøte 7.2.2012

Berit Merete, Børre, Sjur, Ciprian, Trond

Saksliste

Status for gullkorpus

BM: korleis blir typos-lista brukt? Korleis skal data som ligg i fila sjå ut? Kan ein bruka regulære uttrykk i oppføringane? Svar: nei + kort historikk for typos-fila.

Status: 528 feil (7 færre feil enn førre bestenotering med same data, 95,82 % rett most tidlegare 95,74 %)

TILTAK

/-"«»‹›“”‘’)(][}{=

Status for parallellføringa

Gullstandardtalet i dag er 95,82.

Status for ordparallellisering

Enno ikkje dokumentert, men vi har fått ei lenke

TILTAK

Status for fase 1

Fase 1: Setningsparallellisere

  1. forbetre parallelliseringa (Børre) - kontinuerleg
  2. leggje til nye tekstar (Børre) - kontinuerleg (og automatisk)
  3. teste tmx i Autshumato (Sjur) - gjort, ser bra ut, krev rein tmx
  4. setje strek og ordparallellisere - dato: 10.2.

Skal vere ferdig på fredag.

Arbeid framover

Neste møte

Mandag 13.2.2012 kl 10