The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages
View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no
Folk: Anders, Børre, Flammie, Sjur, Trond
Saker:
- kløyva giella-shared
- definera filformat for dependensar (Flammie, Sjur)
- i lag med andre
.gut
-filer?toml
?- kløyva no, men la giella-shared stå til alt fungerer (Flammie, Sjur?)
Gjort! Ser ut til å fungera ok. I den grad det er problem er det (a) fordi innhaldet i filer i dei ulike delane kunne ha vore betre strukturert og (b) fordi det ikkje alltid er integrert i ulike lang-X på ein optimal måte. Men sjølve delinga er
- omorganisera fst-bygginga
Ugjort.
- omorganisera testkatalogane
Ugjort.
- flytta fleire repo frå svn til git(hub)
Punktvis:
- words/ dicts + lists + terms
- ordbøker har truleg rettlinja historie => enkle å konvertera til git
- terminologi er for det meste berre ein spegel av termwikien
- listene er genererte frekvenslister, kan/bør genererast frå korpus
Lister:
Terminologi:
Ordbøker:
lang-
katalogane, prefiks dict-
giella-core
dict-
L1 -
L2; L2<1 => L2 = mul
dict-sma-nob
, dict-myv-mul
- nds - Børre konverter og lastar opp
- https://github.com/giellatekno/neahttadigisanit - ferdig!
- Trond Tynnøl sjekkar at alt er i orden og fjernar NDS frå svn
Som det står over - ferdig!
- oahpa
- oahpa ligg i ped-katalogen, som også inneheld andre ting enn oahpa. Vi må (bør?) skilje dei frå kvarandre.
Vi ventar.
- tools
- Her er det mange ulike ting, også irrelevante. Vi kan rydde eller flytte alt.
- korpus
- rettlinja historie
- to repoar pr språk, eitt ope og eitt lukka
Ferdig!
- Definerte oppgaver på github
*.uit.no
, e.g. som i dag: gtweb, gtdict, …, men kan vi få nye?
f.eks korp.uit.no
?)