Giellateknomøte
- Tid: 21.04.2026
- Til stades: Anders, Brede, Lene, Trond, Trond
Saksliste
- Kva skjer?
- Korp
- Metadict
- fin-sme, sme-fin
- Hasselbrink
- NDS
- giellatekno.uit.no
- Paradigmegenerering
Kva skjer
LIA
Vi har no ferdig formalitetane på UiT og Trond har sendt til UiO.
Konrad Nielsen
Trond har spurt Niko Partanen, vorte sendt vidare til Juha Kuokkala. Prøver også å få kontakt med Klaas Ruppel.
Kildinsamisk
Trond Ty og Elisabeth har lagt inn fleire avleiingar og retta og lagt til mykje i anlysatoren
SámiCAT-prosjektet, afasitesting for nordsamisk
Lene, Berit-Anne. Det blir 28 testar for samisk, pengar frå NFR. Lene prøver å få i gang innsamling av munnleg samisk. Delstillingar for innsamling er utlyst, fra Divvuns Jietnašiella prosjekt.
Dei har kopiert mykje frå det finske “doner røysta di”. Lene og B-A har framlegg til forbetringar.
Framlegg til nytt materiale, podcastar.
Det har komme nye versjonar av ASR (vår, HuggingFace, Aalto). Huggingface er betre enn tidlegare.
Vi må seie noko om kor frekvent orda er. Korpuset vårt er ikkje så ideelt fordi det er skeivt. ficti-korpuset gjev eit betre bilete av språket enn heile korpuset, men det er for lite.
Anders har laga eit oppsett for distraktorar.
Framleggsmekanismeoversyn
… har vorte debugga og blir no oppdatert betre enn för.
giellalt.github.io/proof/spelling/SpellerOverview.html
Korp
Teknisk
Analyse til og med dependency går fint. Deretter skal korp-mono gjere om dep-analysen til ein tabell. I dette steget blir korpus plutseleg halvert. Anders ser på dette.
Leksikon
Lene har lagt til ord frå missing i sme. Dette bør vi sjå på også for andre språk. Lene ser på sme, smj. Trond sender rundt til dei som arbeider med andre språk.
Innsamling
- Ulike pdf-ar (masteroppgåver, phd, slike ting)
- Bibelen
Vi lagar ein plan for dette, Trond diskuterer med Sjur og så ser vi.
Metadict
Innloggingsproblem
Innlogginga er ikkje påliteleg. I teorien skal servaren startast om kvar 8. time, men det er mogleg å logge inn berre no og då (akkurat no går det bra, førre veke gjekk det ikkje).
Framdrift
Brede har sett på lingtools og paradigmene.
Innlogging
Vi vil ha det så strengt som mogleg: Dei som arbeider treng språk x skal få det.
Hasselbrink
Itkonen
Det er no verre etter siste endringar!
fin-sme og sme-fin
JÁV har sendt oss også final versjon av sme-fin, ca 44.000 lemmaer. Vi har no både dict-fin-sme-x-vest og `dict-sme-fin-x-vest.
Vi vil ha dei in toto på satni.org.
Framover
- Når dei to x-vest er på satni.org bør vi lage ei pressemelding
- Legg inn i NDS dei lemma-artiklane som manglar i dei to NDS-bøkene
- Manuelt sjå på dei lemmaa som finst både i NDS og Vest sine ordbøker
NDS
smn
“fin -> smn, klikk smn-ord, og ordboka vel ikkje statisk paradigme. Trond Ty ser på det.”
Vi hadde det same problemet med sme tidlegare
v1, v2.
Vi vil innføre den same måten som for ordbøkene.no (høgskole, høyskole). Det vi treng er:
- løyse opp v1, v2 i lexc. Vi bruker v1, v2 berre for ulike bøyingsparadigme
- Opne opp for to lemma.
Lemma-artikkelen har etter ei slik omlegging to ID-ar. Dette treng ei NDS-analyse.
Taggar
Vi bør ha eit møte om dette. Anders lagar lister og diskuterer med Trond Tr først og evt. med andre etterpå.
Info om logging
Vi bør oppgje om at vi loggar bruken til forskingsformål.
giellatekno.uit.no
Ikkje noko nytt å melde, Anders ventar på harddisk.
Paradigmegenerering
Ny url
https://gtweb.uit.no/lingtools/
stiproblem
Denne lenkja fungerer ikkje (!)
- Denne fungerer ikkje: [https://gtweb.uit.no/lingtools/sme/paradigm]
- Denne fungerer: [https://gtweb.uit.no/lingtools/sme]
paradigmene sjølv
er no json. Det er mogleg å sjå paradigmene via ei makefil.
Det er framleis småting, t.d. problem med å lenkje frå NDS. Problemet kan vere ekstratag før/etter POS. Vi lenkjer framleis til dei gamle paradigmene. Vi får ein 502-feil, engine X får ikkje kontakt med tenesten. Vi veit ikkje kva det er, men kvar det er, og er optimistar.h
Støvet har enno ikkje lagt seg, så utviding av paradigmestruktur til andre språk må framleis vente.
Info om loggar
Vi bør seie i frå om at vi loggar bruken: “Loggføring til …”
Borealium har denne teksten under Om personvern:
Privacy The Borealium.org portal does not store any personally identifiable information, and uses only minimal analytics to be able to report site usage. Page analytics is done using Plausible, and is fully GDPR compliant.
Vi må følgje opp dette.