Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Lingvistmøte

Til stades: Inga, Maja, Sjur, Thomas

Saker:

samansette ord

kva slags reglar gjeld? Døme: mánnágárdde, mánájgárdde. Korleis lagar ein YAML-testar for slike ord?

kva kan laga samansetjingar med kva?

Alt blir regulert i R*-leksikona.

normativitet: heilt fritt vs meir avgrensa

For dei fleste orda blir alle dei tre fylgjande kasus-numerus-kombinasjonane aksepterte av analysatoren (dvs. deskriptivt):

Men i normative samanhengar (som t.d. stavekontrollen) avgrensar vi samansetjingane med taggar på formen +CmpN/*:

Default for nord- og lulesamisk er +CmpN/SgN, for sørsamisk er default +CmpN/SgN og +CmpN/SgG.

Døme på korleis normativ samansetjing blir koda i LexC:

advokáhtta+CmpN/SgN+CmpN/SgG+CmpN/PlG:advok ADVOKAT ; ! lager compounds i SgNom, SgGen, PlGen: advokáhttavirgge advokáhtajuolgge advokáhtajsiebrre

adværbba:adv ADVERB ; !lager bara i SgNom: adværbbahábme  *adverbahábme  *adverbajhábme

kva slags taggar blir brukt for samansette ord?

$ usmj
advokáhttavirgge
advokáhttavirgge	advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom

$ dsmj
advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom
advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom	advokáhttavirgge
advokáhtta+N+SgNomCmp+Cmp#virgge+N+Sg+Nom	advokatvirgge

twolregler for adjektiver

ies (attr) og vokal (pred)? se bug 1463

Dersom det er få adjektiv, blir kanskje twolc for mykje kanon for sporvane. Er det fleire adjektiv, blir det meir relevant å sjå på tonivåreglane.

Oppgåve:

liste over verb, substantiv og adjektiv

Dvs: tabellar med alle lemma + nøkkelformer og nokre derivasjonar.

Oppgåve:

låneord på -e i SMJ

Sámásta s276

premije? men då blir trycket på -“ije”?

bakteri (Sámásta)

Jf med Sámásta 2, side 83 og frametter.