Divvun-møte 11.10.2018
Til stades: Børre, Elena, Linda, Maja, Sjur
Sjuk: Duommá
Saker:
- sidan sist
- Eckhard til Tromsø (CG-workshop)
- gramkontrollarbeid framover (alle språk + smn)
- medarbeidarsamtaler
- ymse
- arbeid framover
sidan sist
Børre:
- sátni.org
- lage visning av paradigmer for sme, sma, smj, smn (ikke publisert)
- sørge for konvertering fra termwiki-dump til eXist-format
- sortere output fra termwiki-dump, for å se de virkelige endringene
- Jobbe sammen med Giellagáldu om termer og sátni.org
- Korpus
- korpusanalyse
- Endre CorpusTools slik at den bruker fst-er og slikt fra make install i
langs/XXX
- feedback for grammatikkontroll
- Lage et lite skript for å hente semantiske tagger fra nordsamisk lexc til
lule-, sør- og enaresamisk
Maja fann feil i satni.org i går: om du skriv inn eit ord som ikkje finst og
klikkar på det, så går nettsida heilt bing (blir tom). Maja skreiv inn
«aehtjie», «tjidtjie».
Børre har støtt på samme type feil med «unngå», skal fikse.
Språkkodar, ordklasser må visast som noko meir forståeleg - forvirrande for
vanlege brukarar.
Maja: skulle vera bra med lenke frå ordbokssidene våre til Álgu-basen
(etymologisk ordbok over samiske og andre uralske språk -
[http://kaino.kotus.fi/algu])
Elena:
- missing
- hjemmeside
- laget lister i samarbeid med Trond (fokus på unix/kommandoer)
- prata med Nils Olof Sortelius
Maja:
- Jobbet med Ciprian (+ Trond) om missinglist
- få et system på alle missinglist
- 1) få lister med Contlex til fst
- 2) til dictformat - både for smanob og nobsma
- Har sett på vedtak fra GG
- forbereder OULU-presentasjon
- dict (nobsma)
Linda:
- Computel-3 artikkeloppsett og -skriving i lag med Kevin og Sjur
- organisere CG workshop med Eckhard + alt det praktiske
- teste setningsgrenser (vs. forkortninger og talluttrykk)
- teste sammensettingsfeil ilag med Duommá (kom tilbake Duommá!)
- jobba med feedback for grammatikkontroll i lag med Børre og Kasia
- instagram: 251 følgjarar!
Maja: burde vi skaffa koppar eller noko anna som vi kan gje som gåve til
gjester, og med trykk som på ein humoristisk måte koplar til det vi driv på med.
Sjur:
- admin i samband med innkjøpet
- gramkontrollartikkel i lag med Linda og Kevin
- jobba mykje med å få korpusanalyse med hfst til å fungera rett
- MT-workshop i Helsingfors
- planla kurs i lag med Jaska og Francis
- abbr-tagging med hfst-tokenise (gjera transitiviteten eksplisitt)
- forbetra testinga av morfologisk og annan analyse, jamføringa mellom gamal og
ny analyse
- retta feil i bygginga som Børre fann
Eckhard til Tromsø (CG-workshop)
- Når: 21.-26.11.
- Forberedning: 20.11.
- Innhold:
- for nybegynnere:
- innføring i formalismen (Maja & Elena & Sjur)
- begynne å lage en sørsamisk og lulesamisk disambigueringsgrammatikk med et
lite sett med regler for spellcheckerforslag (Maja & Sjur & Linda)
- for viderekomne:
- nye vislcg3 features og praktisk bruk (Lene & Ŧrond & Linda)
- bruk av relasjoner i grammatikkontroll
- prinsipper i forhold til rydding av den enaresamiske disambiguatoren
- MT
Vi bør invitera Marja-Liisa.
Laga og integrera fst av bidix & ordbøker, slik at Eckhard veit kva setningane
handlar om. Eit slikt oppsett kan òg nyttast som utgangspunkt for integrert
synonymordbok og “forsamiskmodul”.
IWCLUL 2019 (5. Intern. WS on Computational Linguistics of Uralic Languages)
- 7.-8.1.2019 Tartu
- 12th November 2018: Paper submission deadline
- To maximise the impact of work in the field of computational linguistics for
the Uralic languages we are open to the possibility of double submission, or
submission of work which has been partially published elsewhere.
- https://sisu.ut.ee/iwclul2019
Gramkontrollarbeid framover (alle språk + smn)
- taggoverføring (fyrste versjon i dag)
- lesa korrektur på taggane
- overføra fleire taggar (via ordbøker der det finst)
- versjon 1:
- fjerna irrelevante forslag
- feil i blankteikn og teiknsetjing
Medarbeidarsamtaler
Ved neste samling, om vi får det til å fungera (det er knapt med tid).
Ymse
Inga fekk ei dotter for litt sidan. Vi må senda ei helsing! Elena finn noko og
tek med helsinga frå oss.