Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Divvun-møte 12.4.2022

Til stades: Katri, Børre, Sjur, Flammie

Duommá sjukmeldt ut april.

Saker:

Sidan sist

Linda

Avspaserer

Flammie

Treng meir info frå analysatoren, t.d. surface-form, har no berre lemma/lemmatisert form. - midtape form kan brukes…

framover:

Katri

NEW Prediction:

[‘ja de bosui davvebiegga nu garrosiid go sáhii muhto mađii eanes son bosui dađii čávga deappo vánddardeadji gieasaid jáhka eižas birra’, ‘de beaivváš báitiigođii hui liekkasiid nu lieggasiid ahte vánddar dadji ovttat mános nuolaid jáhka’, ‘ja nie šattai davvebiegga mieđit ahte beaivváš lei sutnos ge hievrrate’]

OLD Prediction:

[‘ja de bohsui davvebiegga nu garrosiidgo sáhtii muhto mađii eanes son bossui dađii čavgade appo vánddardeaddji giesai jáhkaidas birrara’, ‘de beaivváš baitigođii hui jiekkasid nu liegasit ahte vándardeaddji ovtdameanášnuolai jáhka’, ‘ja nie šattai davvebiegga mieđit ja de beaivváš lei sudnosge hievrrat’,

Reference:

[‘Ja de bosui davvebiegga nu garrasit go sáhtii, muhto mađi eanet son bosui, dađi čavgadeappot vánddardeaddji giesai jáhka iežas birra.’, ‘De beaivváš báitigođii hui lieggasit, nu lieggasit ahte vánddardeaddji ovttatmanos nuolai jáhka.’, ‘Ja nie šattai davvebiegga mieđihit ahte beaivváš lei sudnos gievrrat.’]

Framover:

Børre

freecorpus-sme ser ut til å være for stor for github

✦ ❯ git push --set-upstream origin master
Enumerating objects: 263707, done.
Counting objects: 100% (263707/263707), done.
Delta compression using up to 12 threads
Compressing objects: 100% (40031/40031), done.
remote: fatal: pack exceeds maximum allowed size (2.00 GiB)
error: remote unpack failed: index-pack abnormal exit
To github.com:giellalt/corpus-sme
 ! [remote rejected]       master -> master (failed)
error: failed to push some refs to 'github.com:giellalt/corpus-sme'

boundcorpus-smj har en pdf-fil som er for stor (ca 70 MB, selv etter å ha fjernet bilder fra den)

Eige møte i morgon kl 9 norsk tid for å diskutera smj- og sme-problema.

Framover:

Inga

Borte

Framover:

Sjur

Framover:

Infra-arbeid framover (Børre, Flammie, Sjur):

Kan dela arbeidsrom via VSCode (med innebygd lydchat). Har ei felles arbeidsøykt etter påske.

Gøteborg

Framover:

Giellatekno

Canada/Alberta

Ymse