Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Sjur- & Trond-møte 14.5.

Saksliste

Norsk Standard

Sjur er no registrert i ISO TC37 m.m. av Håvar Hjulstad:

ISO TC37 er irrelevant for Divvun og Giellatekno. Vi har tidlegare vore med i teiknsettstandardisering, der det er ei sak som står att: ENG (det finst berre ein glyff for ŋ, men to glyffar for Ŋ, der den eine blir brukt i Afrika og den andre blir brukt i Norden). Løysinga på dette problemet er å gjere som for đĐ, dvs. inkludere begge Ŋ-glyffane som kvart sitt teikn, og ha to ŋ-teikn (med same glyff), ein til kvar Ŋ.

Dette er ei sak for Giellagáldu, Sametinget og KMD, evt. Språkrådet. Vi tek det opp med dei, deretter med Håvard Hjulstad, Michael Everson dersom vi har eit felles forslag å koma med.

Programmerarstillingane

Saka vart diskutert, og fyrste utkast er no ferdig. Trond sender saka vidare.

Gïelese

Berge koden:

Mesteparten av koden ligg på Github. Visse delar (omsetjing) har vi ikkje kontroll over enno. Ryan har desse filene på ein nettbasert omsetjarteneste. Sjur skriv ny e-post med kopi til Trond

Halde fram med Gïelese?

Dette er eit ope spørsmål. Det er tryggleikshol i koden, som vi må fikse for å kunne ha Gïelese der. Sjur tek dette opp med Aajege.

Avtale med SD om opphavsrett og eigarskap til kjeldekoden

Sjur har laga utkast. Vi diskuterer det her internt først, og sender deretter vidare. Trond ser på dette. (e-post 10.1.2019: «Avtale mellom SD og UiT - samisk kjeldekode»)

felles numeralar - møte?

Ja, onsdag kl 9.

felles acro i smi?

Møte onsdag kl 11.

e-post frå Jaska om ordbøker frå Pekka

Stad: i infrastrukturen vår. Publisering på [http://satni.org].

kritkk frå Antti, jf neste

Sjur presenterte kritikk frå Antti når det gjeld infrastrukturen vår. Mange gode poeng kom fram.

infra-omlegging

Moment til arbeidet.

Sjur arbeider med ein plan for endring av infrastruktur.

MT frå Eckhard

Stiar og oppsett for CG-MT. Dette er ein propp, og må prioriterast. Sjur ser på dette.

sma-twol-problem

Verbgruppe 2 og 5 i visse former i dualis og pluralis har veksling mellom lang og kort form i ind og imp. For den lange forma (men ikkje den korte) skal du ha stammevokalendring e -> i. Det er ein regel som burde ha fiksa dette, men som ikkje gjer det. Kva skjer ?!.

Vi kjem attende til dette.

Spansk fst

Frå apertium-languages/spa til external-langs/spa.

Sjur gjer dette.

Korpusarbeid

Avtaler, innsamling, m.m. Her har vi etterslep på mange felt, t.d. Sametinget sine protokollar (jf. neste sak).

Omsetjingsminne og terminologi

Vi har fåt spørsmål om filer til bruk i Trados. Her er lenkje til filer til bruk i omsetjingsminne.

Trond kan evt. sjå på innhaldet i tm for sme-nob, som ikkje er ei fil, men mange.