Language Technology at UiT

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Møte Sjur og Trond

Saker:

Virtuelle servarar

Fysiske servarar:

Ting som skal gjerast:

Tidsplan:

Hunspell/InDesign-status

Status: Beta sist fredag.

TTS

Utlysing

Josef på Sametinget arbeider med det formelle ved utlysinga. Sjur står for det tekniske. Utlysing denne eller neste veke.

Tekst-til-IPA

Vi (Sjur) ber Tino om berre å sjå på input-sida, dvs implmentera ein Xerox-kohort-lesingsmodus. Utsida ser vi på seinare (vi må eksperimentera sjølve).

Nye språk og ny infra

Bugzilla-bugar

Spesifikke lingvistikk-bugar

1284 og 1328 som spesifiser nedanfor.

Dei andre lingvistikk-bugane er rangert med P, som vist nedanfor. Sjur og Thomas ser på absolutt prioritering og kjem attende med framlegg om tidsfrister etc.

1284

1328

1063 nor P3 downcase-derived-proper.xfst doesn’t allow initial upper case letter

Close?

1214 nor P3 Tagproblematikk rundt ConNeg, sme versus sma

  1. Thomas endre lexc
  2. Lene endre dis
  3. Thomas etc. endre gramchk

Dette tar vi etter at 1284 er gjennomført.

1254 nor P2 Innføre svak bøyning av dat + substantiv?

Neste veke?

1292 maj P2 Manglende Pr og Po i vårt leksikon, noen må omdefineres fra Adv

P4

1275 nor P4 Noereh! generer også noereh!

Marginal men ergeleg.

1271 nor P4 Lowercase Sami words accepted as uppercase for Prop and ACR

Her er det også ein prinsipiell diskusjon om lemmatisering, jf. punktet om lemmatisering nedanfor. Vi diskuterer 1271 i samband med det.

P5

1216 min P5 Mulig overgererering av gerundium- og imperativ-former

1308 enh P5 Noen deriverte verb viser ikke derivasjon i fst

1326 nor P5 Indef pronomener - mangler og mulige feilanalyser

1296 enh P5 guovttos

lexc-lemmatisering

dearvvašvuođabirassihkarvuohta
dearvvašvuođabirassihkkarvuohta

dearvvašvuođadirektoráhta
dearvvašvuođadirektoráhtta

dievdosihkkel
dievdosyhkkel
dievdosykkel

doavttergrádakandidáhta
doavttergrádakandidáhtta

biepmoráhkadangursa
biepmoráhkadankursa

bievlavuodjenčoahkkin
bievlavuodjinčoahkkin

biibbaldeaksta vs. biibbalteaksta

biilamekanihkar
biilamekanihkkár

dearvvasvuođaminister
dearvvasvuođaministtar

Generelt

Bugzilla-rutinane er framleis ikkje så innarbeidde som dei burde vera.

Fad-ordbok

Saka står:

  1. Ordparallellisering, Ciprian.
  2. Annonsera tekstkorpuset som tilgjengeleg
  3. Lage grensesnitt (Trond)
  4. dookumentasjon for Autshumato og omsetjingsminne

Tidsplan

  1. Individuelt arbeid fram til neste møte
  2. Neste møte i midten av neste veke - 9. mai (evt. 8?)

App/dings for fad

Trond har laga heimeside for prosjektet og funne fram til dokumentasjon, inkludert rett fil.