Hva er målet med ordboksarbeidet?
Sitat fra møte 23.8.11:
- ordbøkene er nyttige for folk flest
- vise kombinasjonen leksikografi/morfologi
- vi kan samarbeide med de leksikografiske miljøene
- vi trenger transferleksikon for MT
- Apertium-ordbøkene (webdict) inneholder bare grunnform og er smX-nob/fin og
motsatt veg
- VD inneholder genererte ordformer og er smX-nob. De kan lastes ned, og
fungerer offline, men er avhengige av et ordboksprogram, f.eks. Macdict eller
Stardict.
- NDS analyseres online med analyser-dict-gt-desc.xsft, og genereres med
generator-dict-gt-norm.xsft
Leksikonfiler
Entryene er delt inn i filer etter POS. For sme er det ei fil other_smenob.xml med flere ordklasser.
Flerordsuttrykk
- Man kan legge til ord som bare er ord nr 2 i faste uttrykk, f.eks.
hiluid háluid, med hele uttrykket som eksempel.
- Flerordsuttrykk som har annen mening enn hvert enkeltord har, bør man legge
ordet i mwe-fila. Hvis uttrykkene skal bøyes, kan det lages statiske
paradigmer.
Entryenes struktur
nivå i xml
De som er med i dictionary er merket med usage=”vd” for sme og usage=”dict” for sma. Enkelte entryer er også merket med kildehenvisning, f.eks. src=”nj” (fra Jernsletten), src=”sk” (Statens Kartverk), src=”gt” (Giellatekno), src=”fad” (Fra forvaltningsordbokprosjektet). Default er src=”gt”.
Meningsgrupper i xml
Man skiller mellom synonymer og meningsgrupper. Synonymer har samme (meaning group / meningsgruppe) og samme (translation group / oversettelsesgruppe). Hvis en entry har flere betydninger, så skilles disse som forskjellige .
<e src="nj" usage="vd">
<lg>
<l pos="N">sudja</l>
<lc>sujat</lc>
</lg>
<mg>
<tg>
<t pos="N">årsak</t>
<t pos="N">grunn</t>
</tg>
</mg>
<mg>
<tg>
<t pos="N">skyld</t>
</tg>
</mg>
</e>
Oversettelsesgrupper i xml
Elementet inneholder en eller flere (oversettelsesgruppe eller translation group) som igjen kan inneholde:
- et ord
```
ristoabbá
gudsøster
```
- en frase
```
áššu
glødende vedstykke
```
- en forklaring. En forklaring er en setning som forklarer betydningen av et ord, men som ikke kan brukes i for eksempel en oversettelse. Denne brukes KUN hvis ikke kan brukes.
```
boaššobealle
den side som vender mot boaššu, det vil si den innerste delen av telt, gamme eller hus
```
## Bruk av (restriksjon) i xml
* gir restriksjon for oversettelsen. Oversettelsen *vest* har
restriksjonen *om klesplagg*, dvs at oversettelsen gjelder klesplagg, og
ikke himmelretning.
```
om klesplagg
vest
```
* kan også brukes for å markere kasusbetydning, f.ek.s *bevegelse til*.
* for stedsnavn angir den kommune eller fylke
## Bruk av