Language Technology at UiT The Arctic University of Norway

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Trond- og Sjur-møte 9.5.2017

Saker:

Tastaturarbeid

Datamaskin-tastatur

Testspråk: Võro-tastatur

Mac

Fungerer ut av boksen, dobbeltklikk og installer

Windows

[W win:292] ´b -> b́ is invalid for Windows deadkeys; skipping.
[W win:292] ´B -> B́ is invalid for Windows deadkeys; skipping.
[W win:292] ´d -> d́ is invalid for Windows deadkeys; skipping.
[W win:292] ´D -> D́ is invalid for Windows deadkeys; skipping.
[W win:292] ´f -> f́ is invalid for Windows deadkeys; skipping.
[W win:292] ´F -> F́ is invalid for Windows deadkeys; skipping.
[W win:292] ´h -> h́ is invalid for Windows deadkeys; skipping.
[W win:292] ´H -> H́ is invalid for Windows deadkeys; skipping.
[W win:292] ´t -> t́ is invalid for Windows deadkeys; skipping.
[W win:292] ´T -> T́ is invalid for Windows deadkeys; skipping.
[W win:292] ´v -> v́ is invalid for Windows deadkeys; skipping.
[W win:292] ´V -> V́ is invalid for Windows deadkeys; skipping.

Andre språk

Tilsvarande for alle språk. Problemet er at Windows ikkje godtek daudtastar der resultatet ikkje er prekomponerte bokstavar.

Dette bør vi teste ut for sjd!

Mobiltastatur:

Betyr:

Russisk og hfst-tokenise

Uliana skreiv script for vekter, la inn, såg at output ikkje stemte med dei vektene ho la inn. Gjekk attende til irc, laga feilmelding i Hfst-feilmeldingsdatabasen. Dette har ført til oppdaging av fleire ting som ikje stemmer. Dette har ført til to ting:

  1. Ho har ein vekta fst som ikkje fungerer (det er ikkje systematisk output). Dette kan forseinke arbeidet.
  2. Hfst-gjengen veit no om feilen, som er på fleire stader, og dei arbeider no med å få retta den, til glede for både henne og alle andre.

Vektene bør i hfst-tokenize blir ganga med 1000 og runda av, i og med at vislcg3 godtar berre heiltal. Tino vurderer å endre vislcg3 på dette punktet.

Feilane skjer i compose-intersect og fleire andre stader.

Feilane er rapporterte her.

smn-prosjekt (Finland)

FST i direkte bruk i 4 program:

Dei fire kan

  1. teste modellen
  2. vere grunnen til å lage den