The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Til stades: Duommá, Lene, Maja, Sjur
Saker:
1) jeg går igjennom alle PLURAL_lemmaene og setter +CmpN/PlG+Sem/Dummytag på disse akkurat nå
Spørsmål:
juovllat heajat - headjakoarta
juovlaskeaŋka headjaskeaŋka
måvhkah - pl
måvhkan-roejte +CmpN/SgG+Sem/Dummytag = mmåvhka sammensetning av entallssubstantivet måvhka = buksebeinet
Denne måvhkah+CmpN/PlG+Sem/Dummytag:måvhk MÅVHKAH ; => bare sammensetning med flertall? -
I MÅVHKAH-lekiskonet +N+Cmp/SgNom:a R ; +N+Cmp/PlGen:a%>j R ;
jåvle-iehkede julaften (Berglsand)
jåvlh-iehkede (
gæjkedh-biejjie klar dag; dag da man kan høre på lang avstand gæjkedh-vearelde, gæjkeds-vearelde skinnende klarvær; slikt vær at man kan høre på lang avstand
nåejsie - nåajsoeh - nåajsan
sliegrie sleagroeh - sleagran
voerese - gamal voeres - attr
voeres baernie voeresgåetie – voeresigåetieh – voeresgåetie
voerese = adjektiv voeres = attributt både syntaktisk og morfologisk
finst det substantiv som oppfører seg på same måten? dvs med -s som “attributtform” i samansetjingar slik som voerese i dømet over
adj - sub
Ang tagging: disse adjektivene inngår i sammensetninger med en annen form enn attributtformen, hvordan bør sammensetninga tagges? söökes+A+Sem/Dummytag+Cmp/Attr:såakoe R ;! Söökes= attr. - suekebe såakoegåetie söökes+A+Cmp/Attr+Cmp#gåetie+N+Sg+Nom - suekie - suekebe- söökemes
=> såakoegåetie söökes+A+Cmp#gåetie+N+Sg+Nom
sammenlikne med sme: goikesuohkut goikkis+A+Cmp#suohkku+N+Pl+Nom
### se: goike
### ATTR som brukes KUN ved sammensetninge, Burde få denne tagg: +N+Cmp/SgNom ?
snjædtjah+A+Sem/Dummytag+Cmp/Attr:snjædtja R ;! snjædtjoeh
sleajpe:sleajp e_E_EVEN ;
gåpmoeh+A+Sem/Dummytag+Cmp/Attr+Err/Orth:gapmoe R ; ! gåpmoeh attr, gåpman
gåpmoeh+A+Sem/Dummytag+Cmp/Attr:gåpmoe R ; ! gåpmoeh attr, gåpman
sleagroeh:slïegre
slaabroeh+A+Sem/Dummytag+Cmp/Attr:slaabre R ;
gaahpoeh+A+Sem/Dummytag+Cmp/Attr:gaahpoe R ; ! gaahpoeh = attr, gaahpoe=cmp, gaahpan = adv. => Attr og R adj fungerer som cmp.
snjålloeh+A+Sem/Dummytag+Cmp/Attr:snjalle R ;! snjålloeh og snjalle adj fungerer som cmp
slaaptjoeh+A+Sem/Dummytag+Cmp/Attr:slaaptje R ;
gaajvoeh+A+Sem/Dummytag+Cmp/Attr:gaajva R ;
tjåarhtjah:tjåarhtja ATTR_H ;
tjåarhtjah+A+Sem/Dummytag+Cmp/Attr:tjåarhtja R ;
snjadtsoeh+A+Sem/Dummytag+Cmp/Attr:snjadtsoe R ;
radtsoeh+A+Sem/Dummytag+Cmp/Attr:radtsoe R ;
åhtsoes+A+Sem/Dummytag+Cmp/Attr:åhtsoe R ;! åhtsoes
gavhtoeh+A+Sem/Dummytag+Cmp/Attr:gavhtoe R ;! gavhtoeh og gavhtoe adj fungerer som cmp
bæjngoeh+CmpN/SgN+CmpNP/Pref+A+Sem/Dummytag+Cmp/Attr:bæjngoe R ;
Sub_adj -cmp
sub-shortsub= cmp
Hvordan tagge i samansetjingar:
åålmh- +N+Cmp/NAttr <==
faala - faelies +N+Cmp/NAttr <==
baalka -baelkies +N+Cmp/NAttr <==
faala -faelies (Cmp+)
faelies
fális - Fálisnuorri - fállábiergu (kontrakt substantiv: fális fállá)
bálggis - bálgá - Bálgágieddi, Bálggesvárri (kontrakt substantiv: bálggis - bálgá)
Baelkies-vaajja, Baelkies-vuemie, Baelkies-györte (i stedsnavn får vi ingen Cmp tagg)
baalka - baelkies (Cmp+)
baalka baalka+Cmp/Attr+N+Sg+Nom <=== +Cmp/Attr er ikke riktig her -
baelkiesgåetie baalka+N+Cmp/Attr+Cmp#gåetie+N+Sg+Nom
LMM:
mealhkijes, mealhkijs attr. melkerik mealkijs laante område der
simlene gir mye melk
Samansetjingar med baelkies:
baalkije -> baelkije
Samansetjingar med baalka:
hujnie-håjnoe-hajnas
mielki => mielkái, mielkás
mielkásgussa
mielhkie - mealhkijes
mealhkijes govse
göölije =
gualije =
gualijes/ gööles
gööles jaevrie = fiskerikt vann
sme:
guolli
guollái (attr: guollás)
smj:
guolle
guol'lá (attr guol'lás)
beanatgullan = N attr + N = en mil cirka (så langt som ein høyrer ein hund)
(nominativ flertall: beatnagat)
Andre attributtformer i samansetjing:
duohko ---> duohkot-diehke = hit og dit (sme)
dohkh-diekie (sma)
duohku diehki (smj)
baartege baarth-
GAAJSEGE
steeblegh-
LEXICON GAAJSEGE !Sg+Nom=gaajsege/gaajsh Sg+Cmp=gaajsh- redirect to LEEJJEGE, but adds in addtion -eh for Sg+Nom and Cmp
LEEJJEGE ; !Check. Bare åårkeh-, ikke åårkege- ?
### :eh%^DISIMP NOM-CMP ; !
+N+Sg+Nom+Use/NG: FINAL1 ; ! ( LEEJJEGE gives -eh for Cmp, so this should be enough)
LEXICON AAREGE !Sg+Nom=Aarege/Aareh Sg+Cmp=Aarege-/Aareh- Redirects go GAAJSEGE, but adds also -ege and -h for Cmp
GAAJSEGE ;
+N+Cmp/SgNom+Use/NG:ege%^DISIMP R ; ! Saemiej åålmegebiejjie ! Når -ege?
+N+Cmp/XForm+Use/NG:h%^DISIMP R ; ! Saemiej åålmhbiejjie når -eh?
+N+Cmp/Sh
+N+Cmp/ShH
+N+Cmp/Enersji
+N+Cmp/Vigour
+N+Cmp/Vim (Vim=energi, kläm, kraft)
+N+Cmp/Juice
+N+Cmp/Drive
+N+Cmp/Allegro (goađe goahti+N+Sg+Gen+Allegro)
+N+Cmp/fly-by-night
+N+Cmp/precipitatious
+A+Cmp/Attr
+N+Cmp/XForm <== dette blir taggen inntil vidare.
LEGG INN DENNE I LECX-KODEN - for å
+N+Cmp/XForm <== dette blir taggen inntil vidare.
N+Cmp/XForm = Legg faelies, baelkies , jf LEXICON AAREGE over.
+
Bergsland sier- eh,-eg, -egen-
$ echo åålmege+N+Pl+Nom | hfst-lookup -q -p src/generator-gt-desc.hfstol
åålmege+N+Pl+Nom åålmegh 0,000000
åålmegh ≠ åålmh
LEXICON BAARTEGE !Sg+Nom=baartege/baarth Sg+Cmp=baartege-/baarth- Cmp: -h, -ege, -egen, -egi
LEXICON LEEJJEGE !Sg+Nom=leejjege Sg+Cmp=leejjeh- Cmp: -eh -egen -egi
jåvle+CmpN/SgN+CmpN/SgG+CmpN/PlG+Sem/Dummytag:jåvl NIEJTE "jul" ;
jåvlebiejjie
jåvlelaavloe
voeksenassh bare flt. oppkast, spy voeksenes- cmp.
båatsoe-almetje, båatsoej-almetje en som arbeider i reinskogen, reineier; reingjeter
båatsoe-bïenje, båatsoej-bïenje reinhund
båatsoe-jieleme, båatsoej-jieleme reindrift, det å leve av rein
båatsoe-saemie, båatsoej-saemie reindriftssame, reineier
båatsoej-aajroe vei opptrampet av rein
smj:
rájddotjiektjama rájddotjiektjam+N+Pl+Nom
rájddotjiektjama rájddotjiektjam+N+Sg+Gen
rájddotjiektjama rájddotjiektjama+N+Pl+Nom
rájddotjiektjama rájddotjiektjama+N+Pl+Nom
rájddotjiektjama rájddotjiektjama+N+Sg+Gen <=== er denne riktig med rájddotjiektjama som lemma?
Tysdag 22.11. kl 13.00