Saker:
- nytt frå Sjur - situasjonsorientering
- statusrapport frå alle
- arbeid framover
nytt frå Sjur
Situasjonsorientering
statusrapport frå alle
Børre
- korpuskonvertering
- kodekonvertering
Det meste er under kontroll, dei aller fleste dokumenta er korrekte no. Ulike
problem med titlar, forfattarfelt og dokumenttekst.
Usynlege orddelingsteikn og andre teikn deler orda i det konverterte materialet.
Merk: Orddeling bør konverterast til
Har ikkje sett på termwikien enno. Må prioriterast framover, frå neste veke.
Inga
Har jobba med missing-lista, 16 020 ord. Grupper med ord (lista etter frekvens):
- typos
- namn
- samansette ord (av typen “førsteklassing”, o.a. talord)
- nordsamiske(?) låneord skrivne med smj-ortografi (frå tekstar frå svensk side)
- norske ord
- ulikestava låneord - mykje uklårt i systemet vårt
Vanlege typos bør leggjast inn i leksikonet med +Err/Sub.
Maja
Tilbakemeldingar frå brukarane:
- saknar ord frå godkjente lister - Maja har lagt inn (òg i digibaakoe)
Har arbeidd med:
- saknar MT-delen, dvs Apertium - vil leggja inn ordpar der
- vil arbeida med resiproke pronomen, jf med nordsamisk
- må arbeida med twol, treng hjelp -> Børre, Sjur
- det trengst arbeid med ord som går til R (direkte eller indirekte)
- added loan-lemma
-
-
properpronouns
- kan man sette Attr Lexicon til R-lexicon?
når det gjelder firstcomp. er jeg litt usikker/ambivalent på om det bare er å paste inn fra Bergsland, fordi systemet “spriker”. Samtidig er det dette som er normen…drøfte dette.
Sjur
Har arbeidd mykje med hfst-stavekontrollar og bygginga av slike i det siste,
- oxt for LibreOffice / OpenOffice.
Framover:
- Hunspell, PLX inn i ny infra
Tomi
- jobba med feil på sátni.org - funkar ikkje på maskina til Tomi
- ordboklista doesn’t come up when clicking button
- Sjur prøver på eiga maskin
- det har kome nokre feilmeldingar, frå SD og NN
- skript for å importera frå termwikien
- funkar, men ikkje sikker på om alt er med
Neste: skriv dokumentasjon for sátni.org-koden og korleis han kan testast.
Arbeid framover
Hovudprosjekt utover våren:
- oppdaterte og nye stavekontrollar
- missing for alle språk
- plx og hunspell inn i ny infra
- testa og utvikla hfst-stavekontrollane
- forslaga frå hfst-stavekontrollane
- termwikien (børre)
- ENG og CLDR/mobiltastatur m.m.
- grammatikkontroll
- tekst-til-tale
- stavekontrolltesting -> slutt
- sátni.org
- gielese.no
Neste møte
Måndag 17.3. kl 9.30