Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Giellateknomøte 13.9.2017

Saker:

Prioritering av arbeid for Giellatekno

nob-sma-sme ordlister:

main/words/dicts/nobsma/inc/candidates/00_readme.txt

Korpus

crawling:

Konvertering

Konvertering av pdf-filer er problematisk (avhengig av opphav). se møteref 6.9.17

Det er to bz på pdf-konverteringa (fleirkolonnedokument)

Spørsmål: Kan vi konvertere pdf betre enn no (jf. referat frå korpusmøte)? Viss ikkje må vi få originalfilene. To nye kjelder Sámis áigečála (gratis) og Sámi Magasiidna (abonnementsblad).

Vi må følgje opp desse tinga, med møte, etter at ting har skjedd.

NDS

Møte med Ryan

Det var møte med Ryan i går. Møtet var nyttig

Terminologi på NDS: Ord med mange tagger, hva betyr taggene?

Lenker til parallellkorpus

Lenkene er på plass, men:

Ciprian må sjå på dette på Korp-sida. Chiara tar kontakt.

Url i dag:

[http://gtweb.uit.no/korp/?mode=parallel#?parallel_corpora=nob&search=cqp%7C%5B(word%20%3D%20%22dag%22)%5D&cqp_nob=%5B%5D&corpus=fad_corpus_sme,nob2sma_sma_20170828&lang=en]

spansk FST?

Vi venter med det.

MT, status

Lene les dagens avis, som før.

Andre saker?

Kvensk

Aili har vore her, arbeidd med Lene om syntaks og morfologi

Enaresamisk

TTS (Text-to-speech)

er i bruk ved eksamen (UDIR)
Vi må ha TTS på våre sider, se epost fra Lene. Trond følger opp dette med Sjur.

Oppgradering av rommet

Trond følger det opp. Tar kontakt med Sjur for å få sendt tegningene hit.