gt-møte 25.2. 2015
Til stades: Ciprian, Lene, Marja-Liisa, Trond
Saksliste
- NRK
- Korpus
- Strukturering av arbeidet
- Ordbøker
NRK
Kommer folk fra NRK Sápmi kl 10. De har snakka med Sjur.
De ønsker et bredt bilde av hva vi holder på med, men formatet er uklart.
- grammatikkontrollen
- satni.org hører sammen med Divvun-programmet (normering)
- NDS (inneholder mer språkteknologi, både morfologi og lenker til korpus)
- 2000 oppslag pr dag smenob-nobsme, ca 300 finsme-smefin
Korpus
Innsamlingsarbeid
- hvem sitt arbeid å legge inn filer i korpus?
- Oss alle + innleigd hjelp
- lage inc-mapper i bound og free for nye filer
- iflg kontrakter er det ikke lov til å laste ned bound på egen maskin noe som gjør det vanskelig å arbeide - hva kan gjøres med dette?
- lage liste på internett over hva som finnes i korpus (hvem??)
- rutiner for
- analyse
- hvilke analyserte versjoner som skal tas vare på og hvor lenge
- grep-korpus på Divvun
- legge inn i Korp
Enkeltfiler
- Lovfilene er forbetra, manuelt parallellisert (Ciprians sak)
- Samiske tall forteller: manuelt delt opp i enkeltdokumenter (sendes til Trond)
- SDA-2006: ny versjon kommet fra Jussi fordi den opprinnelige versjonen ikke var konverterbar (sendes til Trond)
- Trond forklarer Jaska biggies
Lagring av filer på divvun-serveren
- månedsvise referanseversjonar som grepkorpus i analyzed
- tre dagar
- Sjekkerutine: bit-mengde skal vere omtrent like stor,
aldri slett filer viss nye filer er drastisk mindre enn eldre
- Det skal aldri vere slik at repositorium er tomt
Ciprian gjer dette.
Strukturering av arbeidet
Ordbøker
Lene har lagt geo inn i NDS smenob. Dette er et foreløpig arbeid fordi det er bare gjort for sme og definerer alle språk sme2x som sme2nob.
Ciprian snur fila til nobsme. Dette gjelder bare denne fila: smenob/src/N_Propgeo_smenob.xml. Den inneholder bare navn som ikke er med i N_Prop_smenob.xml.
smenob/src/N_Propgeo_smenob.xml snues til nobsme/src/N_Propgeo_nobsme.xml.