Giellateknomøte 5.6.2023
Til stades: Lene, Trosterud, Tynnøl, Anders
git/divvungiellatekno/giellalt.uit.no/admin/ git/divvungiellatekno/giellalt.uit.no/admin/giellatekno
Saksliste
- Sidan sist
- NDS
- Korp
- Konteaksta
- Korpus
- Giellatekno-nettsidene (cgi)
- Server i sky
- MT
- Terminologi
- smesmj dict (realiserse den)
- paradigmer (cgi)
Sidan sist
- Anders: Göteborg,
- Lene: Arbeid med MT, oppdatering av smesmj og smenob, pluss bygge opp som rekursiv modell. I samarbeid med Nord Universitet: UiT samisk master skal tilpasses lule- og sørsamiske studenter, sannsynlig oppstart høsten 2024.
- Trosterud: Færøyane, grammatikkontroll, mansisk
- Tynnøl har vore student
(ut over det som elles er på sakslista?)
NDS
Oppsummere førre referat:
Frå førre referat:
- Tilleggsformer i paradigme (sma): Vi har fått innspel (Lene)
-
Gå attende (trykke TILBAKE i nettlesar): Dette var ikkje problem før.
-
Anders: Det ser ut til at dette er eit semantisk problem, sida bruker POST og ikkje GET og vil derfor ikkje sende oss attende. Det får vi til.
-
Løysing: Bruk funksjonen
geti søket: ikkjelookup = postmenlookup = get
-
-
Lista over tekniske forbetringar:
Webdict
Den er til bruk ved eksamen (og er no oppdatert).
- lage mobilapp av webdict? (den bruker ikke FST). Trosterud diskutere med Sjur. (Offlineapp?)
Korp
Anders har vore i Göteborg. Alle tekstane er i løpet av denne veka lagt over i Korp9.0 Påfølgende har det blitt mye arbeid med CorpusTools, og tilhørende verktøy som vi bruker for Korp grupperinger av språk: samiske (smi), ikke-samiske uralske (“nsu”), Andre ting framover:
- Ordbild
- Datobug
- regex . – Anders fiksar (gjort). Det må gjøres generelle forbedringer av søkeuttrykk
- generering av cmp og der/ for korp (dette blei ikke gjort ved siste oppdatering)
Konteaksta
Anders og Trond Tynnøl har sett på dette. Vi må ev. vurdere ekstern hjelp.
- Her er kjeldefilene
- Her er originalkoden
- Her er ein presentasjon av WERTi frå 2010
- Dei problematiske filene ligg her
Problemet var at vi ikkje kunne bruke log4j. Vi endra i koden, m.a. slik:
- er gammal og + er ny versjon:
public class Resources {
private static final Logger log =
- Logger.getLogger(Resources.class);
+ LogManager.GetLogger(Resources.class);
(...)
if (log.isDebugEnabled()) {
- log.debug("Retrieving from " + mPath.getPath());
+ log.debug("Retrieving from {}", mPath.getPath());
Vi har to alternativ
- Reparere (krev Java-kompetanse, truleg ekstern)
- Skrive på nytt (vil ta ein del tid, men kan vera enklare å vedlikehalde og utvikle)
Trond Trosterud tek kontakt med Dittmar i Tübingen og høyrer om det t.d. finst andre som også brukar WERTI/VIEW, som vi kunne lært av.
Korpus
Sommarplanar
Vi burde hatt ein person som gjer det og berre det. (Sámi Arkiiva?) Trondtr diskuterer med Sjur.
Lage grepkorpus i passe tid før fornying av Korp.
Juli: Samle tekstar, konvertere og legge til metadata, ev. parallellisere i august.
Giellatekno-nettsidene (cgi)
Status:
- Anders kan køyre ein pipeline som fungerer og gjev teksten som han kjem frå analysatoren.
- Paradigmetabellane er bortimot ferdig.
-
Byggesystemet: Utfordringa var å bygge automatar.
-
bygge automatar sjølv for dette
-
ta automatar via nightly
-
ta automatar frå servarane våre
-
- På giellatekno-sida: Der fungerer det via ei innpakka løysing
Server i sky
Anders har sendt e-post. Trosterud skal ta initiativ til møte.
MT
Trosterud og Lene arbeider med å bygge om smesmj og smenob til rekursive versjoner
smesmj
- Vi vil lansere sme-smj (versjonsmessig)
- Ta opp att samarbeidet med Ávvir
smenob
Brønnøysundregisteret vil ha møte – no i juni. Vi må svare på det. (Lene, Trosterud)
Terminologi
Framlegg til app. –> Divvun (?)
- smesmj NDS (realiserse den), lansering på høsten
Vi diskuterer dette med Inga. (Trosterud, Lene)
div
(Trosterud) sender møtereferater til Tynnøl for å legge på github