Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Trond og sjur, 13-19.11. 2013

Saksliste

Oppsummering etter Göteborg - del 2 (Tommi-presentasjon)

.oxt og LO-stavekontroll

Hinderet for å få ein portabel .oxt er problemet med å bygge hfst-ospell på Windows

Problemet er slik:

  1. hfst er uråd å kompilera på Windows pga alle dependensane til libxml++
  2. ingen Windows før hfst funkar der
  3. ingen hfst default på før Windows funkar

Vi held pusten.

Grammatikkontroll

Alfaversjon

Alfaversjon fungerer for Francis, no er det Sjur sin tur. Det vil gå ein del tid til det.

Tokenisering

For å ha grammatikkontroll trengst tokenisering. Fran bruker den for finsk. Det går sjølvsagt ikkje, men kva skal vi ha?

  1. lt-proc / hfst-proc?
    Problem her: Mykje er hardkoda.
  2. Ny versjon:
    1. hfst-proc utan komma og punktum (berre med mellomrom)
    2. CG-analyse av input med eigne boundary symbols <.> <?> <:>

TILTAK: Arbeid med tok.txt og tilsvarande fst-preprosessering

MS-lobby for små språk og korrekturverkty

tjada.

møte med sjur og lene om nyinfra

Tysdag. Gjennomført.

korpus, FAD i framtida

Har fått meir pengar for vidare arbeid. No er det sma og smj som gjeld. Vi har moglege kandidatar (personar) for sma og smj. Det som trengst: Fleire tekstar.

karp/korp-arbeid no i november

To personar 2.-4.12.

Eng

T&S jobba med grunnlagsdokument. Held fram: Sjur skriv utkast til Eng-lista.

EU-søknad om MT

Laura?