Giellateknomøte 23.12.
Tilstede: Trond, Chiara, Lene
Saker:
- Oppsummering av hausten
- Korpusoppdateringa
- NDS
- Våren
- Servarar
- oahpa.no
- Nasjonale minoritetsspråk
Oppsummering av hausten
Artiklar
- To artiklar i Sámi logut muitalit, publisert (Trond, Lene)
- Artikkel om MT i UiO antologi (Trond, Lene)
- Artikkel om leksikalisering, publisert (Linda, Tommi, Chiara, Trond)
- LIA-artikkel for LIA-antologi (Lene)
- Px i avisspråk, for SDÁ, publiseres 2020 (Lene, Laura)
Registrering i Cristin:
- Trond registrerer /sjekkar Sámi logut muitalit
Andre ting
Stavekontrollanseringar
- fao lansert, fit og cor i betaversjon
Enaresamisk
Mastersudentar
Migrering til python3
- python2 til python3
Chiara har arbeidd med dette. NDS er i Python 2,
Brendan vil hjelpe til
Korpusoppdateringa
Status:
- u_korp: corpus oppdatert og Korp fra v2 til v6 (Chiara)
- grep_corpus for de samiske + u_korp
- Todo
u_korp: legge til tidsinterval
f_korp: både corpus og Korp oppdatering fra v2 til v6
korp: corpus oppdatering og eventuelt Korp fra v6 til v9
ny grep_corpus for de samiske
- Chiara har lasta kode opp til github, [https://github.com/giellatekno]
Oversikt i korp_corpus.txt under admin i det private korpuset.
- u_korp = mhr 50, myv 9, mdf 9, mrj 5 mill ord.
- f_korp = fiv parallelltekst, fit, fao.
- korp = SIKOR, mykje ny parallelltekst
Vi ser på prioritering av f_korp og korp den 4.1.
Grensesnitt
Grafikk
Sikor mer synlig enn Korp
Markering av aktivt språk
Ønskjemål: klårare markering av kva apråk som er aktivt
Tospråklege tekstar
vi må ha ei rullegardin for all fleirspråkleg tekst
NDS
Her har det skjedd lite i det siste.
- Trond har hatt to seminar med leksikografar
- Chiara og Trond har arbeidd med spa-sme.
Automatisk oppdatering av innhald: Dette gjer vi etter migrering til git.
Våren
Planar for artiklar
- MT av Ávvir til smj, Lene følger opp, samarbeid med Inga
MT
Apertium
smj, sma, …
NMT
Helsingfors har laga oppsett for NMT for samiske språk.
Uleåborg vil ha MT-kurs, bruke både Hfors og oss.
Vi vil samarbeide med både Helsingfors og Uleåborg om dette.
CG
Trond diskutere med Eckhard om eitt språkpar og tilpassing til ny struktur i git.
Sosiolingvistikk
- Kasia blir phd-student hausten 2021,
- SA har 4 phd-stipendiatar frå 2021
Vi bør samarbeide om phd-kurs
Fellesseminar der studentane blir kjent + der institusjonane presenterer seg sjølv og ressursane sine.
Også
Undervisning
Språkhistorie
Trond Våren 2021.
Elles har vi ikkje undervisning.
Språkteknologi og korpuslingvistikk
Våren 2022
Digitalisering og Samisk arkiv
Vi bør invitere Arkivverket til eit møte om dette:
- kva skal tekstar skal/kan digitaliserast, og til kva slags grensesnitt?
- Kva rolle vil språkteknologien spele i dette? Blir tekstene digitalisert slik at de blir brukbare etterpå for analyse, samisk søk osv.
Trond følgjer opp dette.
Servarar
Automatisk status:
https://github.com/divvun/registry
gtweb, gtoahpa, gtdict
oahpa.no
Det har ikkje vore oppdatering av oahpa-dokumantasjonssidene sidan juni 2019. No blir det ein del aktivitet framover.
Nasjonale minoritetsspråk
Trond diskutere dette med relavante kanalar.