Giellatekno-møte 14.1.
Saksliste
- Workshop
- Denne veka
- Giellatekno
- Korpus
- Kursplan for SAM-3000
- Kamera
- Neste møte
Workshop
Programmet og hjemmesida må redigeres
(Trond gjør dette)
- Romnr inn på selve programmet
- Info om parallel session
- Link til programmet helt øverst
- Heile sida opp-ned
Sende epost til alle IS ansatte om dette idag
(Lene gjør dette)
Denne veka
Kimmo på torsdag?
TWOL som morfologisk teori
Giellatekno
Orienteringar.
Korpus
Tospråklige tekster:
Samiske tall foreller, 1-7.
Lene sender epost til Ciprian med info om sekretariatet for evt å få wordfiler derfra.
Hente terminologi frå vitskaplege tekstar
Tagge termer når man legger dem inn i lexc? Eller legge til kommmentar? !TERM
- Ny lingvistisk term frå lingvistisk oppgåve = +Term/Ling
- Men kva med lingvistiske termar som er i lexc i dag?
- Kva med tvetydige termar?
- Dobbeltoppföring?
- Dobbeltagg +Term/Geo_Ling
- Kven vil ha dette?
- satni.org + Autshomato verda rundt
Vi merkar terminformasjon som kommentar i lexc.
Kursplan for SAM-3000
Forslag til kursplan for samisk språkteknologi på 3000-nivå (masternivå):
SAM-30.. 10 stp: Samisk språkteknologi
(Innføring i språkteknologien som Giellatekno- og Divvun-gruppene arbeider med)
Kunnskaper og forståelse:
Studentene skal:
- kjenne til tekstkorpus som finnes for samiske språk
- kjenne til forskjellen mellom statistiske metoder og regelbasert/dyp lingvistisk modellering av språk
- kjenne til hvordan man modellerer morfologi ved hjelp Final State Transducers
- kjenne til hvordan man disambiguerer ambiguitet og legger til syntaktisk analyse ved hjelp av Constraint Grammar
- kjenne til hvordan morfologisk analyse/generering og syntaktisk analyse kan brukes i sluttbrukerprogrammer
- kunne plassere Tromsø-modellen i en større sammenheng
Ferdigheter:
Studentene skal kunne:
- lage morfologiske modeller som kan implementeres som automater
- på grunnlag av et tekstkorpus kunne utlede syntaktiske regler som kan implementeres som constraint grammar
- kunne bruke grammatiske analysatorer
- kunne gjøre avanserte korpussøk (grunnleggende regulære uttrykk) i brukergrensesnittet Korp
- vurdere feil i analysen
Arbeidskrav:
I løpet av kurset skal studentene levere inn 2 obligatoriske skriftlige øvinger. Øvingene må leveres inn til fastsatte tider, og må være godkjent senest to uker før eksamen.
Vurderingsform:
Eksamensform er en 6-timers skoleeksamen på samisk. Emnet evalueres med bokstavkarakterer (A-F).
SAM-3090 10 stp: Spesialemne i samisk språkvitenskap
(generelt emne som finnes allerede) - her kan studenten velge å fordype seg i noe, f.eks. FST, CG, korpuslingvistikk
HIF-3012 Språkteknologi (FST kurs)
(finnes allerede)
Kamera m. mikrofon
Trond tar opp saka på nytt.
Neste møte
Torsdag 22.1. kl. 8.30 (evt. anna tidspunkt).