Meeting setup
- Date: 14.03.2011
- Time: 09.30 Norw. time
- Place: Internet
- Tools: SubEthaEdit, iChat
Agenda
Opening, agenda review, participants
- Opened at 09:45
- Present: Berit Merete, Biret-Anne, Børre, Ciprian, Lene, Sjur, Thomas, Tomi
- Absent: Maja, Trond
Project review
- kort oppsummering frå kvart prosjekt, der ein legg fram:
- status (kva er ferdig, kva ligg etter skjema, kva kjem no)
- særlege punkt som treng meir merksemd -> separat møte (men punkta bør nemnast for alle, slik at vi kan sjå avhengigheiter som elles blir oversedde)
Det blir altså ein litt annan struktur enn tidlegare - meir prosjektorientert. Vi prøver det ut, og ser korleis det funkar.
Prosjekta er (rapportør i parentes):
*Divvun 2.1:
- installerarane (Børre)
- buggar (Tomi)
- smekorpus (Børre)
- smakorpus (Børre)
- VD-ÅD-lansering Mac/Win/iPxd (Ciprian)
- Forvaltningsordbok (Berit Merete)
- nu-oahpa (Biret Ánne)
- dis-abstract til Riga (Lene)
- Infrastruktur (Sjur)
- sma-oahpa (Lene)
Andre prosjekt, ikkje med på møtet:
- Divvun-omorganisering (Sjur)
- Kunnskapsforlaget – sme-ordbok (Trond)
- MT-170 (Trond)
- TTS (Biret Ánne)
- smenob (Berit Merete)
- smefin (Gt+Kotus)
- smanob
- Testbenkprosjektet (Sjur)
- Barentsprosjektet (Trond)
- korpusgrensesnitt
Dis-abstract til Riga (Lene)
Ferdig, vart sendt inn på fredag. Vi laga få cg-reglar, men dei får likevel til mykje.
Berre 106 reglar, men bra lemmatisering, sjølv med nesten 9 % missing.
Sma-korpus dårleg:
- dårleg språkgjenkjenning
- bibelen låg to gonger der (no fjerna)
- bibelen dårleg formattert
- berre 10 korrekte dokumentpar for parallellkorpuset
smekorpus (Børre)
Eng. bibel kræsjar konverteringa fordi dei er så store (kræsjar XML::Twig). Fann
nokre andre filer som skapar problem, laga testar og fiksa konverteringa for
desse.
smakorpus (Børre)
Språkgjenkjenning: truleg er språkmodellen for sma for dårleg, vart laga lenge før vi byrja arbeidet med sma.
TODO:
- laga betre LM for sma (Børre)
Forvaltningsordbok (Berit Merete)
- begynte i forrige uke
- stor feil i materialet med stor forbokstav for samansette ord som førte til at
same ordet gjekk igjen på ulike plassar -> omarbeid
- har gått gjennom ca 4000 liner
- kunnskapsoverføring til resten av gruppa -> vi må læra av dette nye prosjektet
- bør ha møte om omsetjinga av ord som har MWE på samisk
- se på mulighet for terskel for automatisk fjerning av irrelevante linjer
TODO:
- møte for å gå gjennom omsetjingsproblem - avtale tidspunkt etter Komi-møtet - kl 11 (Lene har undervisning fra kl 12.)
(Berit Merete, Ciprian, Lene, Trond)
- (NB! vi har Komi-møte 9.30 (og Trond er i anna møte 8.45-9.30)
nu-oahpa (Biret Ánne)
- legger til lærestoff på Fronter og lenking til lesestoff på nettet
- grammatikken på nettet er kanskje for liten -> legge til fra Fronter?
Vi må bestemme oss for hvor omfattende grammatikkene skal være -> diskusjon
om helskapen
- Aajege har fått tilgang til Fronter -> sørsamisk versjon etterhvert??
Infrastruktur (Sjur)
Kurs i Ungarn, begynt å teste hfst
hfst3 snart klar til å bli “released”, med støtte for xfst og twolc
- hfst3
- testing (HfstTester.py) - [http://www.bbqsrc.net/#hfsttester]
sma-oahpa (Lene)
Denne veka skal adjektiva på plass. Dette krev at alle sma-oahpa-adjektiva ligg
i fst-en og har fungerande paradigme, f.eks. ikke overgenering av Comp/Superl. Trond har generert tabellar over adjektiva og leksikona deira, og dei formene som blir generert. Ta ein titt!
“rev” er med endringer i fst, fst-endringene er foreløpig ikke sjekka inn:
Kan de sjå på det, og kommentere, evt. samanlikne med status quo:
Divvun 2.1:
installerarane (Børre)
Kort møte på fredag, 3 av 4 tilbakemeldingar var positive, den fjerde skal vi
sjekka.
Lene har testa på Mac med gamal Office (Office 2008). Alt ok.
buggar (Tomi)
Dei fleste buggane fjerna i fredagsversjonen. Ny versjon til i morgon med dei siste halvstore feila retta.
VD-ÅD-lansering Mac/Win/iPxd (Ciprian)
Sma er generert på nytt, og vil bli generert ein gong til. Meir testing.
Cip ønsker forklaringer til grammatikkord => neste versjon
Merknader frå Lene:
- vi treng fleire testarar
- skrivefeil-liste i Bugzilla
- 2-3 tvetydige eksempler
- endringar i miniparadigma (jf e-post)
- måedtie i fst:
måedtie måedtie+Pron+Indef+Pl+Nom <===== bort?? moadda
moadda moadda+Num+Sg+Nom
moadda moadda+Num+Sg+Acc
Pl kan gott tas bort
moadda tt (ackusativ = nominativ) många,
åtskilliga; flera, några, ett par; moatte bále många gånger; moadda jage åtskilliga år, i åratal; måttijt jagijt under åtskilliga, många år; moattet guovlos från flera hål greitt - jeg fikser det :-)
måedtie måedtie+Pron+Indef+Sg+Nom
Lanseringskoordingering
Lanseringa blir onsdag ca kl. 12.
- laga e-postliste (Sjur)
- skriva Divvun-tekst (Sjur)
- skriva ordbokstekst (Lene)
- samla Divvun og ordbokstekstane (Sjur)
- oppdatera heimesidene & lenkene (Børre)
- omsetjingar til andre språk (Biret Á, Thomas, Maja, Tomi, Ciprian)
- språk: sme, smj, sma, sv, fi, en, ty
- oppdater bileta (Sjur)
- send passande oppslagsord til Sjur + lenke til biletsida (Lene)