Language Technology at UiT The Arctic University of Norway

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Status for infra - møte 30.8.2023

Folk: Anders, Børre, Flammie, Sjur, Trond

Saker:

Kommentert opprit frå førre møtet

 • kløyva giella-shared
  • definera filformat for dependensar (Flammie, Sjur)
  • i lag med andre .gut-filer? toml?
  • kløyva no, men la giella-shared stå til alt fungerer (Flammie, Sjur?)

Gjort! Ser ut til å fungera ok. I den grad det er problem er det (a) fordi innhaldet i filer i dei ulike delane kunne ha vore betre strukturert og (b) fordi det ikkje alltid er integrert i ulike lang-X på ein optimal måte. Men sjølve delinga er

Ugjort.

 • omorganisera testkatalogane

Ugjort.

 • flytta fleire repo frå svn til git(hub)

Punktvis:

 • words/ dicts + lists + terms
  • ordbøker har truleg rettlinja historie => enkle å konvertera til git
  • terminologi er for det meste berre ein spegel av termwikien
  • listene er genererte frekvenslister, kan/bør genererast frå korpus

Lister:

Terminologi:

Ordbøker:

Som det står over - ferdig!

 • oahpa
  • oahpa ligg i ped-katalogen, som også inneheld andre ting enn oahpa. Vi må (bør?) skilje dei frå kvarandre.

Vi ventar.

 • tools
  • Her er det mange ulike ting, også irrelevante. Vi kan rydde eller flytte alt.
 • korpus
  • rettlinja historie
  • to repoar pr språk, eitt ope og eitt lukka

Ferdig!

Sjå òg https://github.com/orgs/giellalt/projects/1.

Azure og IT-folka