Language Technology at UiT The Arctic University of Norway

The Divvun and Giellatekno teams build language technology aimed at minority and indigenous languages

View GiellaLT on GitHub divvungiellatekno/giellalt.uit.no

Page Content

Ny infra - opplæring del 2

Mål for dagen: byggja ut Oahpa-kompileringa med ein ny transducer

Vi gjer dette for berre eitt språk, slik at vi trener lokale tilpassingar.

fst-namn obligatoriske valgfrie
dict-norm-sme NomAg, G3, v1, v2, v3, v4, v5, Use/NGminip, Allegro G7, sem-tagger, IV, TV
dict-norm-sma Hom1, Hom2, v1, v2, v3, v4, v5, Use/NGminip IV, TV
sme-norm - NomAg, G3, G7, v1, v2, v3, v4, v5, Use/NGminip, Allegro, sem-tagger, IV, TV
sma-norm - Hom1, Hom2, IV, TV, v1, v2, v3, v4, v5, Use/NGminip
oahpa-norm-sme NomAg, G3 v1, v2, v3, v4, v5, Use/NGminip, Allegro, G7, sem-tagger, IV, TV
isme-GG.restr.fst = oahpa-norm-sme, men Use/NG og Dial/-GG skal ikke være med i kompileringa -
isme-KJ.restr.fst = oahpa-norm-sme, men Use/NG og Dial/-KJ skal ikke være med i kompileringa -
oahpa-norm-sma Hom1, Hom2 IV, TV, v1, v2, v3, v4, v5, Use/NGminip
isma-SH.restr.fst = oahpa-norm-sma, men Use/NG og Dial/-SH skal ikke være med i kompileringa -
isma-L.restr.fst = oahpa-norm-sma, men Use/NG og Dial/-L skal ikke være med i kompileringa -

Her er eit oversyn over fst-ane som skal bli kompilerte og eigenskapane deira

Nord:

FST obligatoriske valgfrie
analyser-dict-gt-norm NomAg, G3, v1, v2, v3, v4, v5, Use/NGminip, Allegro G7, sem-tagger, IV, TV
analyser-gt-norm   - NomAg, G3, G7, v1, v2, v3, v4, v5, Use/NGminip, Allegro, sem-tagger, IV, TV
analyser-oahpa-gt-norm NomAg, G3 v1, v2, v3, v4, v5, Use/NGminip, Allegro, G7, sem-tagger, IV, TV
generator-SH.restr-gt-norm = analyser-oahpa-gt-norm, men \ Use/NG og Dial/-SH skal ikke med i kompileringa -
generator-L.restr-gt-norm = analyser-oahpa-gt-norm, men \ Use/NG og Dial/-L skal ikke med i kompileringa -

Sør:

FST obligatoriske valgfrie
analyser-dict-gt-norm Hom1, Hom2, v1, v2, v3, v4, v5, Use/NGminip IV, TV
analyser-gt-norm - Hom1, Hom2, IV, TV, v1, v2, v3, v4, v5,Use/NGminip
analyser-oahpa-gt-norm Hom1, Hom2 IV, TV, v1, v2, v3, v4, v5, Use/NGminip
generator-SH.restr-gt-norm = analyser-oahpa-gt-norm, men \ Use/NG og Dial/-SH skal ikke med i kompileringa
generator-L.restr-gt-norm = analyser-oahpa-gt-norm, men \ Use/NG og Dial/-L skal ikke med i kompileringa

Vi treng nye, språkspesifikke filter:

Filnamnkonvensjon for regex-filter:

Så langt har vi to verb:

T.d.: