Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Møte om innpassing av samiske namn

Deltagere: Lene, Maja, Trond, Helena, Flammie, Børre

Dato: 17.10.2025

Det har vore to møte om dette tidlegare, 26.9 og 8.12. 2023.

Problem: Namn i samiske område blir brukt i andre samiske språk.

Overordna problemstillingar

Det er ulike problem å ta stilling til:

Lingvistisk

Prinsipp: smj-navn i sme-løpende tekst skal ha rød strek - sitat skal være sitat - smj skal være feil i sme, og omvendt. Kvart samiske språk må få dei egennavna dei treng: - i sme-text, skal det være mulig å snakke om Tysfjord, dermed må det heitle -vuotna, ikkje -vuodna, for at det skal kunne bli böygd i ulike kasus.

Uendra lån til andre samiske språk (-vuodna, -jávvrie) vil øydelegge språka, det er dermed utelukka.

Å endre berre sisteleddet vil gje oss lulesamisk Iešjávvre, også med å endre berre den siste av to š-ar: Niitošjogaš => Niitošjågåsj men det kan vi (ssv?) leve med.

Å endre begge ledd (Nijttosjjågåsj???) er eit anna alternativ (viss det blir gjort riktig!)

Praktisk

a. overføre namn ein gong

Fordel:

Ulempe:

Dette må bli gjort halvmanuelt, med skripting og tilpassing ( grep streng sme | tilpass | >> smj , osb.

b. overføre dynamisk

Det inneber at sm?-propernoun.lexc-filene i lang-sm? må bli tilpassa:

Fordel:

Ulempe:

Drøfting

Lene tar kontakt med Sametinget om hvordan de/har tanker om hvordan man tilpasser ulike samiske språks egennavn i ulike samiske språks løpende text.

Mulige løsninger:

Linda og Flammie: dependens-analyser går ikke opp p.g.a at nordsamiske egennavn ikke får analyse i sørsamisk løpende tekst, sme-egennavn får ikke analyse i sma-analysator - må vite hvordan bøye disse:

Eksempel fra Helena:

Lenes poeng: Vi ødelegger morfologien til hverandres språk

Generere av ordformer

Begge scripta nedanfor sjekkar: source_file=src/fst/morphology/generated_files/smi-sma-propernouns.lexc

stå i lang-xxx og skriv sh devtools/generate-prop-wordforms.sh

Du kan også opne skriptet og regulere kor mange ord du vil ha for kvart contlex, og kor mange contlex du vil ha. Hugs å slette html-fila etterpå, git liker ikkje at html-filer ligg og sleng i lang-xxx.

Generere alle former for eitt namn

sh devtools/prop_minip.sh Stuorrajohkagohppi

Konklusjon

Vi kjem attende til denne saka i eit nytt møte.

Sitemap