Giellateknomøte
- Tid: 4.6.2026
- Til stades: Brede, Lene, Thomas, Trond, Anders
Saker
- Korpoppdatering
- NDS
- Metaordboka
- Ordbokredigeringsgrensesnitt
- Giellateknosidene
- Horizon 2030
- Server
Korpoppdatering
Ulike typar feilmeldingar
FAILED: /Users/ttr000/git/giellalt/corpus-olo/analysed/wikipedia/olowiki.txt.xml
'Arab Sg Nom "<1865>_∞_@SUBJ>'
FAILED: /Users/ttr000/git/giellalt/corpus-olo/analysed/wikipedia/olowiki.txt.xml
'Arab Sg Nom "<1865>_∞_@SUBJ>'
FAILED: /Users/ttr000/git/giellalt/corpus-fkv/analysed/facta/kainun_institutti/paulaharju_pyssyjovesta.doc.xml
'OBJ'
word_form='300'
rest_cohort='\t"+Use/Circ300" Num Arab Sg Gen @<OBJ #6->6'
original_analysis='+Arab Sg Gen @<OBJ #6->6'
Ting å gjere:
- Legge ut korp-mono-rs på github, så den kommandoen kan kjøres av alle.
Debugging av fst-ane:
- Anders oppdaterer dokumentasjonen
- Trond, Lene, … ser på analysatoroutput
- Anders konverterer på nytt og ser på resultatet
Feil i kvensk (og meänkieli) analysator må rettes opp:
kväänipuku kvääni+N+Sg+Nom+Cmp#puku+N+Sg+Nom 0.000000
`Sg+Nom` -> `Cmp/SgNom`
Lene fikser
Analysed-filene ligg på gtweb (og er no gammalt).
NDS
Fleire lemma i lemmafeltet
Lene har endra i fst-en slik at det er eit par tusen ord som ikkje viser til “tvillingane” sine.
La oss gå inn for ei mellomløysing:
- ta Lene si liste over tapte ord
- analyser dei i den gamle fst-en i varianter-mappa og generer referanselemma
- for kvart lemma i liste, kopier ordboksartikkel for referanselemma
- legg lemma frå liste + ordboksartikkel for referanselemma i ei eiga fil templemma.xml
ls dict-sme-nob/inc/varianter/
analyser-gt-norm.hfstol analyser-gt-norm.hfst
kaffeord.txt variantadverbs.txt variantverbs.txt
variantadj.txt variantnouns.txt
Brede ser på dette.
Anders ser på dobbeltlemmaløysinga (som er det vi eigentleg vil ha), men først etter at Korp er i boks.
Korte overskrifter or merkelege ++ i paradigmene
Det står no: ++nominativ og +essiv.
To ting har skjedd: 1. dei brukarvenlege taggane er borte (f.eks. SG skulle være ENT. og PL skulle være FLT.) 2. deretter er taggane sg og pl forsvunne, og vi står att med ++illativ og +essiv
Dette kan ha skjedd i samband med NDS-oppryddinga no i mai (men kven veit).
neahttadigisanit/neahtta/neahtta/configs/language_specific_rules/tagsets/sme.tagset
These need to only be “raw” tags (before user-friendly relabels)
neahttadigisanit/neahtta/neahtta/configs/language_specific_rules/user_friendly_tags/sme_sma_to_nob.relabel Anders ser på dette.
Metaordboka
Påloggingsbuggen er no fiksa.
Det er ein anna feil, med kontainarar:
Når servaren restartar er det mogleg at det startar slik at databasen og api ikkje klarer å kommunisere.
Brede ser på det.
Itkonen
Jobbes med å manuelt transkribere lemmaliste. Vi kan bare bruke vårt transkriberingsscript, legge det inn i metadict, og oppdatere når det manuelle arbeidet blir ferdig.
Hasselbrink
OCR teksten er ganske bra, vi trenger lemmaliste. Mulig å legge inn litt manuelt arbeid. Lemmaliste gjør at vi kan fortsette å forbedre konverteringa.
Ordboksredigeringsgrensesnitt
Grensesnittet
Brede har sett på dette. Filosofi: - Hent xml-fila frå git, endre på nettsida, og committe.
Ei fil per lemma?
- git-historikk
- mindre å laste inn
- eit enklare liv for grensesnittet
Brede ser meir på dette. Eit godt søkegrensesnitt kan vere viktig. Eit anna spørsmål er om det er mogleg å gå over til å arbeide med neste artikkel utan å s committe den første.
Giellateknosidene
Anders har registrert “giellatekno” bruker på Cloudflare for skyhosting av nye GT sider og dict grensesnitt.
Horizon 2030
Trond orienterte.
Server
Det står framleis 503 og ikkje too many requests. Når folk er på same institusjon og deler IP (t.d. same skole) får vi problem. Vi bør ssv. setje opp minimumsgrensa for spm til cgi-bin.
Endre statuskode til 429, og legg til ei egen feilmeldingsside for den koden.
Leksikografi
Helsingfors
- Workshop (påmelding innen 10. september)
- Seminarium (e-post, programmet er klårt, påmelding åpner i august)
Workshop: Tvåspråkiga ordböcker i en föränderlig värld
Vilka tvåspråkiga ordböcker görs i dag i de nordiska länderna? Vem ger ut dem, och vilka är de tänkta målgrupperna? Vilka förändringar har skett under 2000-talet, och hur ser framtiden ut?
Vi bjuder in till en workshop den 12 november 2026 för att tillsammans göra en lägeskoll och diskutera framtiden. Workshoppen är ett samarbete mellan Svenska litteratursällskapet i Finland och Institutet för de inhemska språken (Språkinstitutet).
Vid Språkinstitutet produceras idag den tvåspråkiga ordboken Stora finsk-svenska ordboken samt en ordlista mellan svenska och kurmanji. Sedan tidigare finns ordböcker mellan finska och estniska, somaliska, kurmanji och sorani. (https://kotus.fi/sanakirjaportaali/)
Om du arbetar med, eller forskar om, tvåspråkiga ordböcker är du välkommen att delta i workshoppen med en presentation (15 minuter). Presentationerna hålls på något av de skandinaviska språken eller engelska. Det går också att delta i workshoppen utan presentation.
Workshoppen hålls på Svenska litteratursällskapet i Finland, Snellmansgatan13 i Helsingfors. Vi inleder med en gemensam lunch kl. 12 och avslutar med en gemensam middag. Anmäl dig till workshoppen senast den 10 september via blanketten: https://www.lyyti.fi/reg/workshop_121126_lexikografi
Eventuella frågor om workshoppen kan riktas till SolveigArle, solveig.arle@sprakinstitutet.fi.
Den 13 november, dagen efter workshoppen, ordnar Svenska litteratursällskapet i Finland seminariet Tvåspråkiga ordböcker i en föränderlig värld. Seminariet är öppet för allmänheten, och anmälan sker senare via en separat blankett.
Nordisk leksikografi på Island 17.-21.5 2027
Konferansen Nordisk leksikografi
Trond skal dit, kanskje andre.