Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Status for infra - møte 30.8.2023

Folk: Anders, Børre, Flammie, Sjur, Trond

Saker:

Kommentert opprit frå førre møtet

  • kløyva giella-shared
    • definera filformat for dependensar (Flammie, Sjur)
    • i lag med andre .gut-filer? toml?
    • kløyva no, men la giella-shared stå til alt fungerer (Flammie, Sjur?)

Gjort! Ser ut til å fungera ok. I den grad det er problem er det (a) fordi innhaldet i filer i dei ulike delane kunne ha vore betre strukturert og (b) fordi det ikkje alltid er integrert i ulike lang-X på ein optimal måte. Men sjølve delinga er

Ugjort.

  • omorganisera testkatalogane

Ugjort.

  • flytta fleire repo frå svn til git(hub)

Punktvis:

  • words/ dicts + lists + terms
    • ordbøker har truleg rettlinja historie => enkle å konvertera til git
    • terminologi er for det meste berre ein spegel av termwikien
    • listene er genererte frekvenslister, kan/bør genererast frå korpus

Lister:

Terminologi:

Ordbøker:

Som det står over - ferdig!

  • oahpa
    • oahpa ligg i ped-katalogen, som også inneheld andre ting enn oahpa. Vi må (bør?) skilje dei frå kvarandre.

Vi ventar.

  • tools
    • Her er det mange ulike ting, også irrelevante. Vi kan rydde eller flytte alt.
  • korpus
    • rettlinja historie
    • to repoar pr språk, eitt ope og eitt lukka

Ferdig!

Sjå òg https://github.com/orgs/giellalt/projects/1.

Azure og IT-folka