Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

S&T-møte 12.4.2022

Saker:

Alberta

Det ser ut til at det blir møtedatoar 6.-8.6. Med reise osb. kanskje 2.6.-9.6.?

Trond, Lene i Alberta? Sjur på distanse.

Infra-arbeid fram til Alberta

Eigen katalog for byggjeresultat?

Luleå

Møte med Lene i dag 14.15 finsk tid.

Windowsmaskina til Trond

Fysisk møte tysdag 19.4. på formiddagen? For å løysa datamaskinproblem, og ev. diskutera med Antti om Alberta-planane.

Programmerarstillinga

Diskuter kjapt med Lene i dag 14.15, bestem vidare gange.

Umesamisk tastatur

Vi kan ikkje laga norsk umesamisk utan å laga svensk umesamisk.

  mac:
    default: |
      § 1 2 3 4 5 6 7 8 9 0 + ´
        á w e r t ü u i o p å ŋ
        a s d f g h j k l ö ä đ
      < z x c v b n m , . -

Feilen var ei overvintra fil en.yaml i kjeldekodekatalogen. No er fila fjerna, vi kryssar fingrane og ser kva som skjer i Divvun Manager.

— Bygginga gjekk bra, no kan tastaturet installerast med Divvun Manager.

Statssekretær - noko nytt?

Ingen ting nytt.

Freecorpus

Børre flyttar alle korpusa til GitHub. Har jobba mykje med det i det siste.

Ukraina

Trond har prata med Laura og Tore.

gtweb.no

Ingen nyttar dette domenet lenger, kan kastast. Trond seier i frå.

Bindestrek

Bindestrek i generator-dict-gt-norm - kvifor?

I dag har bindestreken ei vekt på 10. Løysinga er dermed å berre generere former med best vekt.

hfst-lookukp har eit paramenter for dette:

  -b, --beam=B                     Output only analyses whose weight is within B from
                                   the best analysis

Det vi må gjere er med andre ord å leggje inn dette parametret i fila som genererer paradigme (conf.pl).