The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Møte 13.12.2017
Vi presenterer først eit par moment til diskusjon, og har eit oversyn til slutt
Det er ulike typar ICALL, som vi her kallar opne/lukka (evt. studentstyrte vs. systemstyrte ):
Positivt med systemstyrte:
Negativt med systemstyrte:
Positivt med studentstyrte system
Negativt med studentstyrte system
Moglege samarbeidspartnarar
Prinsipp: Vi vil prioritere den siste finishen på ting vi har nesten ferdig
Plan for å arbeide med Konteaksta:
Innspill til mer pedagogikk i NDS
Eksempel frå sme-nob over i sme-fin?
Nye FST-ar
Vi vil trenge spansk, evt. også svensk FST. Vi vil vere i stand til å legge til ord i desse FST-ane.
TILTAK
Liste over nye ting (skal inn i NDS-dokumentasjonen)
Opne saker for NDS:
Kontinuerleg arbeid
Kontinuerleg arbeid
Vi kjem til å ta i bruk TTS for ordbok og ICALL.
Vi har for små virtuelle servarar!
Trond diskuterer med R og evt. E. Ciprian tar det vidare.
Vi trenger en server til for samarbeidsparter i hele verden, hvor samarbeidspartnere skal ha root-rettigheter for å installere sine egne verktøy, sette opp web-applikatjoner, etc.
Underlagsmateriale til diskusjon om plan for Giellatekno, onsdagsmøtet 13.12.2017
Tidlegare plandokument er mellom anna:
Desse momenta er i seg sjølv ikkje ein plan, men det inneheld ein del faktorar vi bør ha i mente når vi drøftar prioriteringar.
Poenget er sjølvsagt ikkje å svare på desse spørsmåla kvar for seg (dei heng saman, og dei har ulike svar når dei blir kombinert på ulike måtar), men å vurdere dei som parameter i planarbeidet.
NFR evaluerte humaniora i Noreg, m.a. UiT, der UiT presenterte CASTL-Fish, Giellatekno og
s. 62.
“Measurable societal impact is mainly achieved by Giellatekno and LAIDUA. With its enormous production of language technology applications for the Sámi languages in particular, but also for many other languages spoken in the circumpolar region in general, Giellatekno has measurably revitalised the Sámi languages, and its importance cannot be overemphasised.” (…) Research is of a very high level in all areas, and the work done by CASTL-Fish in theoretical linguistics and by Giellatekno can be especially singled out.
Avsnitt 4.7 handlar om Giellatekno.
Giellatekno fekk nettopp endra status frå nivå 3 til nivå 2, der grunngjevingane var at vi er meir utviklings- enn forskingsorientert, noko som vart reflektert i at ikkje alle gruppemedlemmene var forskarar, og at i samband med to NFR-prosjekt vart “mye arbeid (…) viet til utvidelsen av det samiske språkkorpuset og i mindre grad til forskning på dette materialet”.
Evalueringa av oss er stort sett dekkande (sjølv om ikkje alle framlegga til endring av praksis er like gode). Vi bør med andre ord halde fast på og gjennomføre eitt av dei sentrale måla vi har og har hatt, nemleg å publisere om det arbeidet vi gjer. Vi bør legge til rette for at Lene og Ciprian blir ferdig med avhandlingane sine, og vi bør på ein målretta måte vurdere arbeidet vårt med tanke på publikasjonar, både kvar for seg og i lag. Vi er flinke til å halde føredrag (jf. art-mappa), men ikkje like flinke til å publisere.
Dette er den viktigaste delen av diskusjonen vi har framfor oss. Konklusjonane her er dels avhengig av kva vi vil satse på av vitskapleg interesse, dels av kva område vi kan få interesserte samarbeidspartnarar, dels av behova ute i samfunnet, og dels av korleis vi vurderer kva vi kan prioritere innad i gruppa.
Grunnressursar er tekstressursar (korpora), leksikalske ressursar (ordlister, leksika) og analyseprogram
Arbeidet med grunnressursar må sjølvsagt halde fram. Moglege prioriteringar:
Dette vil sjølvsagt vere avhengig av dei overordna prioriteringane, poenget er at utviklinga av grunnressursar går sakte, og ein mogleg strategi er å ta ei spesifikk undergruppe, og så verkeleg prioritere det.
Det viktigaste med plandiskusjonen her og no er å få ein plan for korleis vi skal arbeide i lag den næraste tida, det næraste halvåret, og dei næraste tre åra. Vi må utnytte det at vi har Chiara på ein god måte.
(liten x = arbeid, stor X = prioritet?)
Tema | Namn | 2018 vår | 2018 høst | 2019 vår | 2019 høst | 2020 vår | 2020 høst | |
---|---|---|---|---|---|---|---|---|
ICALL | Chiara, Lene | Konteaksta, \ mot Oahpa2 | Oahpa2 | Oahpa2 | Oahpa2 | |||
ICALL art | Chiara, Lene | Konteaksta \ som fenomen | Konteaksta \ i bruk | |||||
NDS - frontend | Chiara, Lene | x | ||||||
NDS - innhold | Lene, Trond, Cip | smn-fin, sme-spa | ||||||
NDS evaluering art | alle | x | ||||||
MT sme-nob | Lene, Trond | x | x | x | x | |||
MT sme-nob art | Lene, Trond | .. | x | |||||
MT sme-smX, smX-sme | Lene, Trond | .. | x | |||||
Korp | Cip | .. | x | |||||
Korpusarbeid | div | |||||||
Korpus art | Cip, Trond | x | x | |||||
PhD-arbeid | Lene, | x | ||||||
PhD-arbeid | Ciprian | x | x | x | x | x | x | |
Lingv skuffe | Trond | x | x | x | x | |||
smn-FST | Lene, Trond | x | x | |||||
smn-artikkel | Lene, Trond | .. | x | |||||
sme-smn artikkel | Lene, Trond | .. | x | |||||
dependensanalysator | Lene, Trond, Cip | |||||||
tekstkompl art | Cip, Lene, Trond | |||||||
Canada | Lene, Trond | .. | x | |||||
Russland | Trond | x | x | |||||
Norden | Lene, Trond, Cip | x | x | |||||
Undervisning | Lene | |||||||
Konf, workshops | Samsymp | |||||||
Foredrag | Lene | |||||||
Grafisk form | Chiara | x | x | |||||
REST | Cip, Chiara | x | x | x | ||||
samarb institusjoner | .. | |||||||
NAV (og andre) | Trond |
Namn | 2018-I | 2018-II | 2018-III | 2018-IV |
---|---|---|---|---|
Chiara | konteaksta \ NDS \ REST \ Grafisk form | oahpa2 \ REST \ art \ Grafisk form | oahpa2 \ REST | oahpa2 |
Ciprian | Korp\ phd-arbeid\ artikkel til Santiago \ Korp oppdatering\ phd-artikkel\ REST \ undervising phd-seminar i Santiago (?) | phd, korpusart \ undervising phd-seminar i Santiago (?) \ meänkieli \ smn2fin-dict\korpusartikkel | phd\ Korp \ smn2fin-dict | phd\ Korp |
Lene | phd \ Konteaksta \ Oahpa2 \ (MT) | Oahpa2 \ undervisning \ MT, NDS | Oahpa2 \Samsymp \ MT \Konteaksta | Oahpa2 \ MT |
Trond | smn-fst, lingart \ admin, phd, korpus, samarb | MT, NDS, korpusart \ admin, phd, korpus, samarb | ? \ admin, phd, korpus, samarb | ? \ admin, phd, korpus, samarb |
Andre ting
Ting i kalendaren
Konkrete mål
Korpusarbeid
Pengar vil vi ha!