Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Møte 13.12.2017

Overordna planlegging framover

Vi presenterer først eit par moment til diskusjon, og har eit oversyn til slutt

ICALL

Det er ulike typar ICALL, som vi her kallar opne/lukka (evt. studentstyrte vs. systemstyrte ):

Positivt med systemstyrte:

Negativt med systemstyrte:

Positivt med studentstyrte system

Negativt med studentstyrte system

Samarbeid

Moglege samarbeidspartnarar

Arbeid før oppstart av Oahpa 2.0

Målgrupper

Konteaksta

Prinsipp: Vi vil prioritere den siste finishen på ting vi har nesten ferdig

Plan for å arbeide med Konteaksta:

NDS

Innspill til mer pedagogikk i NDS

Eksempel frå sme-nob over i sme-fin?

Nye FST-ar

Vi vil trenge spansk, evt. også svensk FST. Vi vil vere i stand til å legge til ord i desse FST-ane.

TILTAK

Liste over nye ting (skal inn i NDS-dokumentasjonen)

Opne saker for NDS:

Søknad om pengar

MT

Analysatorer

Kontinuerleg arbeid

Leksikografi

Kontinuerleg arbeid

Lyd

Vi kjem til å ta i bruk TTS for ordbok og ICALL.

Språk

korpus og Korp

Infrastruktur

Vi har for små virtuelle servarar!

Trond diskuterer med R og evt. E. Ciprian tar det vidare.

Vi trenger en server til for samarbeidsparter i hele verden, hvor samarbeidspartnere skal ha root-rettigheter for å installere sine egne verktøy, sette opp web-applikatjoner, etc.

Artiklar

Bakgrunnsdokument

Underlagsmateriale til diskusjon om plan for Giellatekno, onsdagsmøtet 13.12.2017

Tidlegare plandokument er mellom anna:

Parameter å planlegge etter

Desse momenta er i seg sjølv ikkje ein plan, men det inneheld ein del faktorar vi bør ha i mente når vi drøftar prioriteringar.

Poenget er sjølvsagt ikkje å svare på desse spørsmåla kvar for seg (dei heng saman, og dei har ulike svar når dei blir kombinert på ulike måtar), men å vurdere dei som parameter i planarbeidet.

Evaluering av oss

Humeval

NFR evaluerte humaniora i Noreg, m.a. UiT, der UiT presenterte CASTL-Fish, Giellatekno og

s. 62.

“Measurable societal impact is mainly achieved by Giellatekno and LAIDUA. With its enormous production of language technology applications for the Sámi languages in particular, but also for many other languages spoken in the circumpolar region in general, Giellatekno has measurably revitalised the Sámi languages, and its importance cannot be overemphasised.” (…) Research is of a very high level in all areas, and the work done by CASTL-Fish in theoretical linguistics and by Giellatekno can be especially singled out.

Avsnitt 4.7 handlar om Giellatekno.

Fakultetet

Giellatekno fekk nettopp endra status frå nivå 3 til nivå 2, der grunngjevingane var at vi er meir utviklings- enn forskingsorientert, noko som vart reflektert i at ikkje alle gruppemedlemmene var forskarar, og at i samband med to NFR-prosjekt vart “mye arbeid (…) viet til utvidelsen av det samiske språkkorpuset og i mindre grad til forskning på dette materialet”.

Første tankar

Evalueringa av oss er stort sett dekkande (sjølv om ikkje alle framlegga til endring av praksis er like gode). Vi bør med andre ord halde fast på og gjennomføre eitt av dei sentrale måla vi har og har hatt, nemleg å publisere om det arbeidet vi gjer. Vi bør legge til rette for at Lene og Ciprian blir ferdig med avhandlingane sine, og vi bør på ein målretta måte vurdere arbeidet vårt med tanke på publikasjonar, både kvar for seg og i lag. Vi er flinke til å halde føredrag (jf. art-mappa), men ikkje like flinke til å publisere.

Overordna tematiske prioriteringar

Dette er den viktigaste delen av diskusjonen vi har framfor oss. Konklusjonane her er dels avhengig av kva vi vil satse på av vitskapleg interesse, dels av kva område vi kan få interesserte samarbeidspartnarar, dels av behova ute i samfunnet, og dels av korleis vi vurderer kva vi kan prioritere innad i gruppa.

Grunnressursar

Grunnressursar er tekstressursar (korpora), leksikalske ressursar (ordlister, leksika) og analyseprogram

Arbeidet med grunnressursar må sjølvsagt halde fram. Moglege prioriteringar:

Dette vil sjølvsagt vere avhengig av dei overordna prioriteringane, poenget er at utviklinga av grunnressursar går sakte, og ein mogleg strategi er å ta ei spesifikk undergruppe, og så verkeleg prioritere det.

Til diskusjonen

Det viktigaste med plandiskusjonen her og no er å få ein plan for korleis vi skal arbeide i lag den næraste tida, det næraste halvåret, og dei næraste tre åra. Vi må utnytte det at vi har Chiara på ein god måte.

Årshjul

(liten x = arbeid, stor X = prioritet?)

Tema Namn 2018 vår 2018 høst 2019 vår 2019 høst 2020 vår 2020 høst  
ICALL Chiara, Lene Konteaksta, \ mot Oahpa2 Oahpa2 Oahpa2 Oahpa2      
ICALL art Chiara, Lene Konteaksta \ som fenomen Konteaksta \ i bruk              
NDS - frontend Chiara, Lene x              
NDS - innhold Lene, Trond, Cip smn-fin, sme-spa              
NDS evaluering art alle x                
MT sme-nob Lene, Trond   x     x  x   x       
MT sme-nob art Lene, Trond ..     x          
MT sme-smX, smX-sme Lene, Trond ..     x          
Korp Cip ..   x          
Korpusarbeid div                  
Korpus art Cip, Trond   x   x          
PhD-arbeid Lene,   x              
PhD-arbeid Ciprian   x   x x   x   x   x  
Lingv skuffe Trond   x   x     x   x        
smn-FST Lene, Trond   x     x          
smn-artikkel Lene, Trond ..     x          
sme-smn artikkel Lene, Trond ..     x          
dependensanalysator Lene, Trond, Cip                  
tekstkompl art Cip, Lene, Trond                   
Canada Lene, Trond ..     x          
Russland Trond   x     x          
Norden Lene, Trond, Cip   x     x          
Undervisning Lene                
Konf, workshops       Samsymp          
Foredrag Lene                
Grafisk form Chiara   x     x          
REST Cip, Chiara   x     x   x        
samarb institusjoner ..                
NAV (og andre) Trond                

 

Namn 2018-I 2018-II 2018-III 2018-IV
Chiara konteaksta \ NDS \ REST \ Grafisk form oahpa2 \ REST \ art \ Grafisk form oahpa2 \ REST  oahpa2
Ciprian Korp\ phd-arbeid\ artikkel til Santiago \ Korp oppdatering\ phd-artikkel\ REST \ undervising phd-seminar i Santiago (?) phd, korpusart \ undervising phd-seminar i Santiago (?) \ meänkieli \ smn2fin-dict\korpusartikkel phd\ Korp \ smn2fin-dict phd\ Korp 
Lene phd \ Konteaksta \ Oahpa2 \ (MT) Oahpa2 \ undervisning \ MT, NDS Oahpa2 \Samsymp \ MT \Konteaksta Oahpa2 \ MT
Trond smn-fst, lingart \ admin, phd, korpus, samarb MT, NDS, korpusart \ admin, phd, korpus, samarb ? \ admin, phd, korpus, samarb ? \ admin, phd, korpus, samarb 

Andre ting

Ting i kalendaren

Konkrete mål

Korpusarbeid

Pengar vil vi ha!