The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Saker:
Av namn, helst fornamn. Produktivt for samiske namn, men mest brukt i tale.
Vi legg inn dim-avleing for samiske namn, i små steg og gradvis. Test for kvar stammetype, legg inn yaml-testar for kvar stammetype og bøyingsklasse.
Merk uvanlege possessivar frå stavekontrollen med +Use/-Spell. På lengre sikt ville det vera bra å merka skrivefeil-som-possessiv som +Err/xxx.
tjåhkanibmes tjåhkanit+V+IV+Der/NomAct+N+Sg+Nom+PxSg3 <== bør få raud strek
tjåhkanimes tjåhkanit+V+IV+Actio+Ela
tjåhkanimes tjåhkanibme+N+Sg+Ela
Heilt bort:
barggám barggat+V+TV+Der/NomAg+N+Sg+Acc+PxSg1
barggám barggat+V+TV+Der/NomAg+N+Sg+Gen+PxSg1
barggám barggat+V+TV+Der/NomAg+N+Sg+Nom+PxSg1
Possessivar som ikkje lett kan vera skrivefeil kan stå, medan slike som ofte opptrer som ekteordsfeil bør fjernast frå stavekontrollen.
-es -asse: er ` -asse` i sma egentlig en bøyningsstamme? dette er ikke konskevent behandlet i Bergsland. sammenlign med smj og sme.
Døme:
ööhpehts
aelhkemes - +A+Sup+Sg+Nom
aelhkiemassem - +A+Sup+Sg+Acc
boejhkehts +N+Sg+Nom (veiledningshefte)
boejhkehtasse - bøyingssstamme?
Jmf samansette ord:
boejhkehts-plaaretje vs boejhkehhtasse-plaaretje
Den fyrste er rett, den andre er vanleg men feil.
I Bersland&LMM:
boejhkehtasse, boejhkehts = forklaring, lærdom
med både -asse og -ehts som SgNom
I smj: