Latgales dati

2012. gada 8. jūnijs

Šī datuma mediju ziņa.
Rēzeknes Augstskola īsteno pārrobežu sadarbības projektu "HipiLatLit" jeb Development of Research Infrastructure for Education in the Humanities in Eastern Latvia, Lithuania.
Viena no projekta aktivitātēm - mūsdienu latgaliešu rakstu valodas korpusa izveidošana. Valodas korpuss ir tāds digitālu tekstu kopums, kas tiek apstrādāts ar īpašām programmām, lai iegūtu datus par biežāk lietotajiem vārdiem un par kāda konkrēta vārda lietojumu dažādos kontekstos.
Projektu HipiLatLit realizēja Rēzeknes Augstskola sadarbībā ar Vītauta Dižā Universitāti (Kauņa, Lietuva) un LU Matemātikas un informātikas institūtu (Rīga, Latvija). Projekta koordinatore Anna Briška.
2012. gadā tika izveidots pirmais mūsdienu latgaliešu valodas korpuss – MuLa (http://www.korpuss.lv/id/MuLa2012), kurā tika iekļauti latgaliešu rakstu valodā publicētie teksti. Korpusa apjoms ir 1 milj. vārdlietojumu, un korpusa tekstu lielāko daļu veido literārie un informatīvie teksti, kas tapuši laika posmā no 1988. līdz 2012. gadam. Kopš 2020. gada ir atjaunots darbs ar MuLa, atlasot korpusam tekstus, kas publicēti pēc 2012. gada, plānojot tajā vairāk iekļaut zinātnisku, populārzinātnisku un periodikas tekstu fragmentus.
2020. gadā uzsākta mūsdienu latgaliešu valodas runas korpusa (MuLaR) izveide, un tas paredzēts latgaliešu valodas dokumentēšanai, apguvei, studiju un pētniecības vajadzībām.

Atsauces