The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
Til stades: Inga, Maja, Sjur, Thomas
Saker:
Det er lite rusk der no mot tidlegare, og vi slår på lemmatesting for alle propernouns no (tidlegare har vi berre testa dei SMJ-spesifikke namna). 14 feil i lemma-testen for SMJ, som Inga ser på.
Desse to orda får ulik analyse, sjølv om dei er av same type:
motorjuogos
motorjuogos motåvrrå+N+SgNomCmp+Cmp#juogos+N+Sg+Nom
motorjuogos motåvrrå+N+SgNomCmp+Cmp#juohko+N+Pl+Nom+PxSg3
motorjuogos motåvrrå+N+SgNomCmp+Cmp#juohko+N+Sg+Ela
motorjuogos motåvrrå+N+SgNomCmp+Cmp#juohko+N+Sg+Acc+PxSg3
motorjuogos motåvrrå+N+SgNomCmp+Cmp#juohko+N+Sg+Gen+PxSg3
bassengjuogos
bassengjuogos basseng+N+Cmp#juogos+N+Sg+Nom
bassengjuogos basseng+N+Cmp#juohko+N+Pl+Nom+PxSg3
bassengjuogos basseng+N+Cmp#juohko+N+Sg+Ela
bassengjuogos basseng+N+Cmp#juohko+N+Sg+Acc+PxSg3
bassengjuogos basseng+N+Cmp#juohko+N+Sg+Gen+PxSg3
motorjuogos er ikkje ein nominativsamansetjing, og bassengjuogos manglar tagg for samansetjingstype.
Spørsmål: kva slags tag vil vi ha for denne typen samansetjing med stammeformen av låneord? +ShCmp
er ikkje bra, fordi denne taggen blir brukt for samiske kortformer brukt i samansetjingar, og dekkjer eit anna fenomen. Kva med +CitCmp
, dvs ei samansetjing der ein bruker sitatformen av eit låneord?
SMI-lista inneheld 29 000 ord, medan heile SMA-lista er på 27 000 oppføringar, og mange av desse er sjølvsagt SMA-spesifikke. Det er altså ein god grunn til å ta i bruk SMI-lista for SMA.
VEDTAK: vi tek i bruk SMI-lista for SMA.
GJERELISTE:
SGL/SGM er lagt ned frå 31.12.2011, funksjonane blir teke over av eit nordisk samisk språksenter som startar 1.1.2013.
Det er kring 38 leksikon som dekkjer adjektiv med omlyd. Dei er no koda slik at omlyden blir behandla direkte i LexC-koden, med eitt leksikon pr ord. Dette er ikkje den beste måten å organisera koden på: omlyd bør behandlast for seg (med tonivåreglar), i alle fall når det gjeld såpass mange ord. Deretter kan adjektiva dei gjeld behandlast som alle andre adjektiv når det gjeld bøying.
GJERELISTE: