Trond og sjur, 13-19.11. 2013
Saksliste
- Oppsummering etter Göteborg - del 2 (Tommi-presentasjon)
- .oxt og LO-stavekontroll
- Grammatikkontroll
- MS-lobby for små språk og korrekturverkty
- møte med sjur og lene om nyinfra
- korpus, FAD i framtida
- karp/korp-arbeid no i november
- Eng
- EU-søknad om MT
Oppsummering etter Göteborg - del 2 (Tommi-presentasjon)
- NUUG
- kjelde til finansiering / dugnadsarbeid -> pakking og distribusjon
- Hunspell->fst
- viktig for å auka språkdekningsgraden for Voikko-stavekontrollane
- Tommi har skript, men dei er gamle
- frå forskingsbord til ferdig produkt - kven og kor(leis)?
- Klingon som brekkstong for betre språkteknologi i Linux:
- vi dumpar inn eit leksikon
- vi inviterer andre til å gjera morfologien (og dermed stavekontrollen) ferdig
- kan gje større motivasjon for
å gjera ferdig Voikko-integreringa så mange stader som mogleg
.oxt og LO-stavekontroll
Hinderet for å få ein portabel .oxt er
problemet med å bygge hfst-ospell på Windows
Problemet er slik:
- hfst er uråd å kompilera på Windows pga alle dependensane til libxml++
- ingen Windows før hfst funkar der
- ingen hfst default på før Windows funkar
- Svar: byt ut libxml++ med noko liknande utan dependensar
- Aksjon: få Tommi til å gjera det. Sjur har gjort det (i går)
Vi held pusten.
Grammatikkontroll
Alfaversjon
Alfaversjon fungerer for Francis, no er det Sjur sin tur. Det vil gå ein del
tid til det.
Tokenisering
For å ha grammatikkontroll trengst tokenisering. Fran bruker den for finsk.
Det går sjølvsagt ikkje, men kva skal vi ha?
- lt-proc / hfst-proc?
Problem her: Mykje er hardkoda.
- Ny versjon:
- hfst-proc utan komma og punktum (berre med mellomrom)
- CG-analyse av input med eigne boundary symbols <.> <?> <:>
TILTAK: Arbeid med tok.txt og tilsvarande fst-preprosessering
MS-lobby for små språk og korrekturverkty
tjada.
møte med sjur og lene om nyinfra
Tysdag. Gjennomført.
korpus, FAD i framtida
Har fått meir pengar for vidare arbeid. No er det sma og smj som gjeld.
Vi har moglege kandidatar (personar) for sma og smj. Det som trengst:
Fleire tekstar.
karp/korp-arbeid no i november
To personar 2.-4.12.
Eng
T&S jobba med grunnlagsdokument.
Held fram: Sjur skriv utkast til Eng-lista.
EU-søknad om MT
Laura?