The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Berit Merete, Børre, Sjur, Trond
cat fad_gull_diff_test-res.txt |tr '\n' '™'|sed 's/The diff for /€/g;'|sed 's/The tmx diff /€/g;' | tr '€' '\n' |grep 'nob '|tr '™' '\n'|l
Dette gjev output av typen:
@@ -74 +77,2 @@
-Lámispenš. 16–66 jagi – pr. 1000 ássi(1999 )
+Lámispenš .
+16–66 jagi – pr. 1000 ássi(1999 )
Den andre typen av feil er:
Setningspar:
testing prestable/tmx/goldstandard/nob2sme/laws/other_files/finnmarksloven.pdf.tmx …
The tmx diff is
Alle innbyggerne i den enkelte kommune har rett til utnyttelse av visse naturressurser innenfor kommunens grenser , blant annet egg- og dunsanking og begrenset hogst . Buot gieldda ássiin galgá leat vuoigatvuohta ávkkástallat dihto luondduvalljodagain gieldda rájáid siskkobealde , earret eará mannet , uvjet ja murret dihto mearrái .
-Buot gieldda ássiin galgá leat vuoigatvuohta ávkkástallat dihto luondduvalljodagain gieldda rájáid siskkobealde , earret eará mannet , uvjet ja murret dihto mearrái .
+Buot gieldda ássiin galgá leat vuoigatvuohta ávkkástallat dihto luondduvalljodagain gieldda rájáid siskkobealde , earret eará mannet , uvjet ja murret dihto
+mearrái .
Anker:
ocean / hav, sjø / meara, mearr / meri, mere / meara, X / saelht saalht*
Den abstrakte tydinga er vanlegare enn den konkrete, så vi må få begrenset, grad inn på norsk.
TILTAK
asdf.
vs. asdf.
frå gull/konvertert-fil-para (Børre)Vi har no to runder
TILTAK
4/345 341/345
3/345 342/345
25% 75% 0,0x%
Spm. er strategi for forbetring:
Bruk gullkorpuset som referanse, og sjå om det er mogleg å få betre resultat ved hjelp av andre parameterverdiar i tca2.
Jf. dokumentasjon. Vi bruker i dag standardverdiar, som er laga for norsk-engelsk.
TILTAK
Det føreset nye gullfiler (eller å berre lese gjennom resultat)
TILTAK Berit Merete og Trond held fram.
pdf: Fjerne topp- og bunntekst.
Når har vi eit bra nok resultat til å bedrive ordparallellisering?
TILTAK
20.12. kl. 10.00.
(nb! Nye resultat til neste møte)