The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Til stades: Inga, Maja, Sjur, Thomas
Saker:
kva slags reglar gjeld? Døme: mánnágárdde, mánájgárdde. Korleis lagar ein YAML-testar for slike ord?
Alt blir regulert i R*-leksikona.
For dei fleste orda blir alle dei tre fylgjande kasus-numerus-kombinasjonane aksepterte av analysatoren (dvs. deskriptivt):
Men i normative samanhengar (som t.d. stavekontrollen) avgrensar vi samansetjingane med taggar på formen +CmpN/*
:
Default for nord- og lulesamisk er +CmpN/SgN, for sørsamisk er default +CmpN/SgN og +CmpN/SgG.
Døme på korleis normativ samansetjing blir koda i LexC:
advokáhtta+CmpN/SgN+CmpN/SgG+CmpN/PlG:advok ADVOKAT ; ! lager compounds i SgNom, SgGen, PlGen: advokáhttavirgge advokáhtajuolgge advokáhtajsiebrre
adværbba:adv ADVERB ; !lager bara i SgNom: adværbbahábme *adverbahábme *adverbajhábme
$ usmj
advokáhttavirgge
advokáhttavirgge advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom
$ dsmj
advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom
advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom advokáhttavirgge
advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom advokatvirgge
ies (attr) og vokal (pred)? se bug 1463
Dersom det er få adjektiv, blir kanskje twolc for mykje kanon for sporvane. Er det fleire adjektiv, blir det meir relevant å sjå på tonivåreglane.
Oppgåve:
Dvs: tabellar med alle lemma + nøkkelformer og nokre derivasjonar.
Oppgåve:
Sámásta s276
premije? men då blir trycket på -“ije”?
bakteri (Sámásta)
Jf med Sámásta 2, side 83 og frametter.