Hva er målet med ordboksarbeidet?
Sitat fra møte 23.8.11:
- ordbøkene er nyttige for folk flest
- vise kombinasjonen leksikografi/morfologi
- vi kan samarbeide med de leksikografiske miljøene
- vi trenger transferleksikon for MT
Genererte ordformsorbøker (VD) vs. online-analyse-ordbøker (NDS) vs. Apertium-ordbøker (webdict)
- Apertium-ordbøkene (webdict) inneholder bare grunnform og er smX-nob/fin og motsatt veg
- VD inneholder genererte ordformer og er smX-nob. De kan lastes ned, og fungerer offline, men er avhengige av et ordboksprogram, f.eks. Macdict eller Stardict.
- NDS analyseres online med analyser-dict-gt-desc.xsft, og genereres med generator-dict-gt-norm.xsft
Leksikonfiler
Entryene er delt inn i filer etter POS. For sme er det ei fil other_smenob.xml med flere ordklasser.
Flerordsuttrykk
- Man kan legge til ord som bare er ord nr 2 i faste uttrykk, f.eks. hiluid háluid, med hele uttrykket som eksempel.
- Flerordsuttrykk som har annen mening enn hvert enkeltord har, bør man legge ordet i mwe-fila. Hvis uttrykkene skal bøyes, kan det lages statiske paradigmer.
Entryenes struktur
nivå i xml
De som er med i dictionary er merket med usage=”vd” for sme og usage=”dict” for sma. Enkelte entryer er også merket med kildehenvisning, f.eks. src=”nj” (fra Jernsletten), src=”sk” (Statens Kartverk), src=”gt” (Giellatekno), src=”fad” (Fra forvaltningsordbokprosjektet). Default er src=”gt”.
Meningsgrupper i xml
Man skiller mellom synonymer og meningsgrupper. Synonymer har samme
<e src="nj" usage="vd">
<lg>
<l pos="N">sudja</l>
<lc>sujat</lc>
</lg>
<mg>
<tg>
<t pos="N">årsak</t>
<t pos="N">grunn</t>
</tg>
</mg>
<mg>
<tg>
<t pos="N">skyld</t>
</tg>
</mg>
</e>
Oversettelsesgrupper i xml
Elementet