Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Parallelliseringsmøte 13.2.2012

Berit Merete, Børre, Sjur, Ciprian, Trond

Saksliste

Status for gullkorpus

Status: Siste test fredag 10.2, 424 feil (96,65 %).

Problemområde som står att:

Status for parallellføringa

Ord:

Kommandoar:

ccat -a -l sme -r $GTFREE/prestable/converted/sme/ | wc -w
ccat -a -l nob -r $GTFREE/prestable/converted/nob/ | wc -w

TILTAK

tail -50 depts/other_files/*x see

Status for fase 1

Fase 1: Setningsparallellisere

  1. forbetre parallelliseringa (Børre)
  2. leggje til nye tekstar (Børre)
  3. teste tmx i Autshumato (Sjur)
  4. setje strek og ordparallellisere - dato: 10.2.

Alt er gjort.

Status for ordparallellisering - fase 2

Dokumentert, bortsett frå ein kommando.

TILTAK

Fase 2b:

Kva blir brukt ute i verda? UD:

http://www.multicorpora.com/en/products/

Siri Broch Johansen:

TILTAK

Arbeid framover

Neste møte

Fredag 17.2. kl 8:30

Vinterferier: