Meeting setup
- Date: 21.03.2011
- Time: 09.30 Norw. time
- Place: Internet
- Tools: SubEthaEdit, iChat
Agenda
Opening, agenda review, participants
- Opened at
- Present: Biret-Anne, Børre, Ciprian, Lene, Maja, Sjur, Thomas, Tomi, Trond
- Absent: Berit
Projects & topics
- Admin routines (Sjur)
- Speller (Sjur)
- Barents (Trond)
- Sørsamisk (Trond, Maja)
- Infra (Sjur (& Ciprian?))
- spring planning - year of cleanup? (Sjur (& Ciprian?))
- Ordbøker (Lene, Ciprian)
- Korpus (Børre)
- Depworkshop (Trond)
Admin routines (Sjur)
Dersom folk er borte frå måndagsmøtet, så må ein sjølv passa på å lesa det så fort ein får høve til det.
Sjekk inn referat – og les dei, ev $GTHOME/techdoc/admin/weekly/2011/xxx
Speller (Sjur)
2.1. vart lagt ut på fredag, men pressemeldinga har ikkje gått ut.
Vi oppdaterte berre sma, ikkje sme, smj. Hunspell for smj, sma er no
brukbar: Både copula og nektingsverb er inne.
TODO
- Runde på teksten, for dei som omsette pressemeldinga sist veke
Barents (Trond)
Komi
Arbeidet går vidare, Marina har arbeidd med budsjettet. NFR er utilgjengeleg.
Kildin
Det skjer ingen ting enno, Trond og Sjur må fylgja opp.
Sørsamisk (Trond, Maja)
I eit møte for 14 dagar sidan bestemde vi å gå frå +Pred
til +Sg+Nom
. No
er det gjort, litt forseinka pga ordboks- og stavekontrollslepp.
Maja vil gjerne gå gjennom alle adjektiva, ikkje berre dict og Oahpa-adj.
Svært nyttig med tabellane med alle viktige former. Vil gjerne prioritera arbeidet.
TODO
- Adjektiv: (Sjå ordbokspunktet)
- Dekning: Arbeide med missing lister (i dag 9,5% uanalysert) (Maja)
Ordbøker (Lene, Ciprian)
sme-dict er ikkje revidert
sma-dict: Stor del av de 113 lemmaene som ikke ble generert,
er nå fiksa - noen stedsnavn fremdeles hos Thomas. Vi ventar
på adjektiva. Trond har rydda i te og re-elementa. Anna kodeopprydding.
Det burde no vera svært få ord som ikkje blir generert neste gong.
Vi treng fleire som testar ordbøkene, også av dei som ikkje kan
språka - dei har andre augo enn dei språkkyndige.
No genererast: Attr - Sg Nom - Comp Sg Nom - Superl Sg Nom. Vi legg til: Ill Sg
Føreløypig lanseringsfrist: 28. mars 2011
TODO
- Generere nye paradigmer med Ill Sg i tillegg. (Trond)
- sjekk lus [http://giellatekno.uit.no/bugzilla/show_bug.cgi?id=967] (Maja)
- møte på onsdag moron kl 9 (Lene, Maja, Thomas, Trond)
- oppsummering neste måndag, deretter bestemmer vi lanseringsdato
Korpus (Børre)
Har retta opp resten av feila i bound (mange feil i xsl-metadata og feilkoding
av title og person feltene i Word document).
Før han starta var det meir enn 1800 feil, no er vi nede i 107 feil.
Retta ein feil i ccat
, kompilert og installert på Victorio, snart på XServe.
Trond: /home/apache_corpus/ 19,2 mill ord. /home/trond 5,8 mill ord.
TODO
- Børre og Trond pratar i lag for å sjå på diffen mellom Trond og apache_corpus.
Depworkshop (Trond)
GT har invitert P Sammallahti til Tromsø for å diskutera
dependensanalyse av samisk, 14-15.4. CG som tema er aktuelt
for fleire av oss.
Praktisk om innkalling osb.: Lene, Trond.
Infra (Sjur (& Ciprian?))
Sjur: Prosjektstopp.
- Nei til nye ting:
- Gjennomføre det vil har inne
- Ikkje søkje om nytt
Uklåre:
- TTS: Skal fullførast.
- Mo i Rana Linuxboks:
- Seie ja takk til boksen men varsle at vi arbeider sakte.
- Forvaltningsordbok II (sma, smj)
- MT: Vent.
- NU - smeOahpa: DeepDict, Teksta (pedagogisk tekstanalyse)
- NU er i gang, og vi held fram med det.
- smadis.rle + felles smisyn.rle
- Til Riga, og vi held fram med det.
- Autshumato og TM
- Brukergrensesnitt til tospråklige korpora
- Trond: Eg har liten lyst til å leggje dette på is
- nobsme og nobsma ordbøker
- smjnob fra Kintel-liste
Ny infra før Barents. Momentliste:
- gå over til autotools (seinare kanskje CMake for betre Windows-støtte)
- større modularitet i kjeldekoden -> Omorfi
- flytta ut script/ frå gt/
- … og flytta alle språk til gt/
- “JavaDoc” - dokumentasjonen i koden
- Unit Testing - meir bevisstheit omkring testingh
-> børre og korpuskonverteringa
- code review
- full støtte for hfst
- taggsamkøyring
- lexc-kodeopprydding
spring planning - year of cleanup? (Sjur (& Ciprian?))
TODO:
- autotools-oppsett/-infra (Børre, Ciprian, Sjur)
- “JavaDoc”-infrastruktur (Børre)
- Unit-test-rammeverk (Børre?)
- LexC-opprydding (Maja, Thomas, Trond)