Giellateknomøte 26.01.2021
Tilstede: Trond, Lene, Chiara
Saker:
- oppfølgjing frå sist
- Korp
- MT
- Sosling-gruppa
- Digitaliseringstiltak på UiT
- Neste møte
Oppfølgjing frå sist
- Giellalt bµgger (Børre har sett på det), også for dei språkspesifikke sidene, t.d. [https://giellalt.uit.no/lang/fkv/KvenDocumentation.html]
- Migrering av python2 til python3, Dette er framleis på oppdateringslista.
- Digitalisering og Samisk arkiv. Trond har gjort framlegg om OCR-lesing av gamle tekstar. Det er mogleg vi får som svar at det berre gjeld fotografering av Riksarkivet og Samisk Arkiv. Vi får høyre.
- Nasjonale minoritetsspråk. Trond har skrive brev til KD.
- ssh og nøklar. Vi bør bestemme kva vi vil gjere, Chiara må svare. Hvis alle bruker ssh-nøkkel, kan man stenge for passordinnlogging. Trond og Lene følger opp i dag.
- sms og +Comp til +Der/Comp. Trond har skrive til Jack, skal følgje opp.
- UArctic Digitalisering og sirkumpolare språk. Trond har kontakt med Svein på SA om dette
- ICALL-prosjekt for nasjonale minoritetspråk i Sverige – dette blir det ikkje noko av i denne omgang.
- HIF-10zz i regulære uttrykk og bruk av språkteknologi. Trond held eit samlingsbasert kurs til hausten.
- SAM.30zz Språkteknologi og korpuslingvistikk. Haust eller vår? Lene og Trond ser på dette.
Korp
Buggane i u_korp
Her har Chiara fiksa fleire: Omsetjingar av attributt og pop-up for taggar. På lista: Årstalsboksen. Deretter [https://github.com/giellatekno/korp-frontend/issues/5]
Ting å gjere med SIKOR
Comp i sms
Vi vl ha Der/Comp i den nye versjonen.
Evt. arbeid med smn
Sjå på missing list
Grepkorpus
Lene har gode rutiner:
- Strengar med feil taggar (dobbel POS, …)
- Missing list (sjekk at det ikkje er nye ord på toppen)
Bibelen
Få med bibelen parallellisert, også nob
Framdrift
- Tekniske ting og Bibel og lingvistisk arbeid
- f_korp
- SIKOR
MT
NMT-møte
Vi bør ha et oppsett på Giellatekno, vi ser på git-sidene med relevante pipelines, når vi får tid til det.
fin-sme
Trond og Lene har sett på dette, framleis litt att. Deretter er det snakk om betre dis-fil og tilpassing av syntaktiske taggar til vårt system. Det å få med funksjonstaggar krev val av fil (gjort) og tilpassing av syntaggar (må bli gjort).
sme-smn
Trond har ikkje sett på dette. Lene ser på taggar i sme-smn, ser på regresjonstesting etter taggmøtet vi hadde.
MT for smj
Vi treng ikkje få godkjenning for innsamling av materiale hos NSDs fordi vi ikkje lagrar persondata.
Sosling
Møte neste veke. Lene kallar inn.
Digitaliseringstiltak på UiT
[https://uit.no/tavla/artikkel/715700/midler_til_digitalisering?p_document_id=715700]
Søknadsfrist er 19/2 2021.
Digitaliseringsrådet forvalter et budsjett på 5 MNOK. Disse skal fordeles på digitaliseringstiltak som bidrar til at UiT når sine strategiske mål knyttet til utdanning, forskning og formidling.
- Eksperimentell utprøving av løsninger for bedre undervisning eller forskning i små pilotprosjekt. Disse prosjektene vil ha som formål å finne ut om et verktøy eller en arbeidsmåte bidrar til mer læring eller bedre forskning.
- Oppskalering av løsninger som har vært prøvd ut én eller flere steder i organisasjonen og som har gitt gode resultater.
- Tilrettelegging for digital forskning og utdanning generelt, rettet mot vitenskapelig ansatte. Dette kan være samarbeidsarenaer, kurs, webinarer, organisering av informasjon eller tilrettelegging for deling av digitale læringsobjekter.
Moglege ting å søke på
- Utvide programmeringsressursar
- Samle inn korpus
- Handsame data frå Samisk arkiv
- Jf. også jusprosjektet, evt. sykepleieterminologi
- Argumentere for programmerar med ekstern ad hoc-finansiering for instituttet
Oppsummering
- Småting i boks
- Prioritering av og plan for Korp-arbeid
- Strategisk satsing for å styrke programmering og teksthandsaming (Lene, Trond)
Neste møte
Vi tar møte etter at vi har fått ein korpusversjon til på plass. Chiara gir beskjed.