Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Hva er målet med ordboksarbeidet?

Sitat fra møte 23.8.11:

Genererte ordformsorbøker (VD) vs. online-analyse-ordbøker (NDS) vs. Apertium-ordbøker (webdict)

Leksikonfiler

Entryene er delt inn i filer etter POS. For sme er det ei fil other_smenob.xml med flere ordklasser.

Flerordsuttrykk

Entryenes struktur

nivå i xml

De som er med i dictionary er merket med usage=”vd” for sme og usage=”dict” for sma. Enkelte entryer er også merket med kildehenvisning, f.eks. src=”nj” (fra Jernsletten), src=”sk” (Statens Kartverk), src=”gt” (Giellatekno), src=”fad” (Fra forvaltningsordbokprosjektet). Default er src=”gt”.

Meningsgrupper i xml

Man skiller mellom synonymer og meningsgrupper. Synonymer har samme (meaning group / meningsgruppe) og samme (translation group / oversettelsesgruppe). Hvis en entry har flere betydninger, så skilles disse som forskjellige .

<e src="nj" usage="vd">
   <lg>
      <l pos="N">sudja</l>
      <lc>sujat</lc>
   </lg>
   <mg>
      <tg>
         <t pos="N">årsak</t>
         <t pos="N">grunn</t>
      </tg>
   </mg>
   <mg>
      <tg>
         <t pos="N">skyld</t>
      </tg>
   </mg>
</e>

Oversettelsesgrupper i xml

Elementet inneholder en eller flere (oversettelsesgruppe eller translation group) som igjen kan inneholde:

- et ord ``` ristoabbá gudsøster ``` - en frase ``` áššu glødende vedstykke ``` - en forklaring. En forklaring er en setning som forklarer betydningen av et ord, men som ikke kan brukes i for eksempel en oversettelse. Denne brukes KUN hvis ikke kan brukes. ``` boaššobealle den side som vender mot boaššu, det vil si den innerste delen av telt, gamme eller hus ``` ## Bruk av (restriksjon) i xml * gir restriksjon for oversettelsen. Oversettelsen *vest* har restriksjonen *om klesplagg*, dvs at oversettelsen gjelder klesplagg, og ikke himmelretning. ``` om klesplagg vest ``` * kan også brukes for å markere kasusbetydning, f.ek.s *bevegelse til*. * for stedsnavn angir den kommune eller fylke ## Bruk av