Latgalīšu volūdys tezaurs
Latgaliešu valodas tēzaurs
455 šķirkļi

Par Latgaliešu valodas tēzauru

Latgaliešu valodas (LTG) tēzaurs ir iecerēts kā plaša elektroniska skaidrojošā un sinonīmu vārdnīca, kam ir trīs pamatuzdevumi. Pirmkārt, dokumentēt latgaliešu leksiku visā tās bagātībā, vienā vietā apkopojot datus no dažādiem avotiem: 20. un 21. gadsimtā izdotām vārdnīcām un publicētiem vārdu sarakstiem, rakstītiem tekstiem un runas ierakstiem. Vārdnīcā iekļauti ne tikai mūsdienās plaši lietoti vārdi (tādi kā apleik, baba, cikom, duraceņš, guņs, jimt, jis, olūts, patmalis, vaicuot), bet arī dialektismi (piemēram, uļbiks), novecojuši vārdi (piemēram, abryuss) un neoloģismi (piemēram, vydabolss). Otrkārt, saglabāt un attīstīt latgaliešu rakstu valodu, veicinot tās lietošanu. LTG tēzaurs ir iecerēts kā palīgs ikvienam, kas pēta, raksta vai lasa latgaliešu tekstus, kas mācās vai māca latgaliešu rakstu valodu un lieto to lietišķajā saziņā. Šim nolūkam svarīga ir leksikas diferencēšana. Treškārt, mūsdienās valodas attīstībai, pētniecībai un lietojumam nozīmīga ir arī tās funkcionēšana digitālajā vidē. LTG tēzaurs ir viens no vairākiem rīkiem, kas to nodrošina.

Sākot atlasīt leksiku pirmajiem vārdnīcas šķirkļiem, Mūsdienu latgaliešu tekstu korpusā (MuLa2022) noskaidrojām 2200 vārdus, kas dažādās vārdformās pieminēti vismaz 100 reizes. Tad proporcionāli atlasījām dažādu vārdšķiru vārdus, kas atšķiras no latviešu literārās valodas. Tai pašā laikā, lai parādītu vārddarināšanas un gramatisko paradigmu daudzveidību, aprakstījām vienas saknes vārdu morfoloģiskos atvasinājumus, kas redzami kā saistītie šķirkļi.

Vārdnīca sastāv no sugas vārdiem un dažiem biežāk izplatītiem īpašvārdiem, stabiliem vārdu savienojumiem, tai skaitā frazeoloģismiem. Katrā šķirklī ir informācija par to, kuros avotos vārds un tā iespējamie varianti ir dokumentēti. Katrs vārds tika pārbaudīts visos primārajos avotos (sk. Avoti). Tas nozīmē, ja pie šķirkļa avotiem nav uzskaitīts kāds no primārajiem avotiem, tad tajās vārdnīcās šis vārds neparādās. Ja pie kādas leksēmas nav minēts avots, tad tēzaura autores to konstatēja latgaliešu tekstu vai runas korpusā vai drukātajos tekstos.

Kā šķirkļa vārds un pirmā pamatleksēma no vairākiem dokumentētajiem variantiem ir izvēlēts tas, kas ir pēc iespējas neitrālākais, kamēr izlokšņu un citi varianti ir uzskaitīti zemāk. Pamatleksēma parādās formā, kas atbilst pašlaik spēkā esošajiem pareizrakstības noteikumiem un kuru iesaka lietot rakstos. Jāpiebilst, ka latgaliešu rakstu valodas leksika nav normēta un tā pieļauj arī dialektismu izmantošanu rakstos.

LTG tēzaurs nenosaka normu, bet tas ir avots, kas informē par esošām normām un ieteikumiem tiem, kas nodarbojas ar latgaliešu rakstu valodas kopšanu. Latgaliešu valoda tiek nepārtraukti normēta, un diskusijas par leksiku, formveidošanu un rakstību ir svarīgas, lai latgaliešu rakstu valodu attīstītu arī turpmāk.

Leksisko vienību nozīmes LTG tēzaura šķirkļos pārsvarā kompilētas no vārdnīcām, taču, ņemot vērā skaidrojošo vārdnīcu nelielo skaitu un apjomu, daudzu leksisko vienību nozīme ir secināta no latgaliešu tekstu korpusos atrodamo piemēru konteksta, izmantoti arī latviešu valodas tēzaura šķirkļos pieņemtie nozīmju skaidrojuma principi. Nozīmes ir papildinātas ar saistītajām nozīmēm (sinonīmiem). Plašāk sk. Instrukcija.

Šobrīd tiek piedāvāta LTG tēzaura pilotversija. Vārdnīcu paredzēts periodiski papildināt, pievienojot jaunas leksiskās vienības, labojot novērotās neprecizitātes. LTG tēzaurs veidots, izmantojot Tēzaurs.lv platformu, tāpēc lietotāja saskarne un aprakstošā daļa ir latviešu literārajā valodā.


Kā atsaukties uz LTG tēzauru

Jaunākā atvērto datu kopaKļavinska, Antra et al. Latgaliešu valodas tēzaurs, 2025. CLARIN-LV digitālā bibliotēka, 🔗 http://hdl.handle.net/20.500.12574/116.

Pateicības

LTG tēzaura veidošana uzsākta 2022. gadā Valsts pētījumu programmas “Digitālās humanitārās zinātnes” projektā “Atvērtas un FAIR principiem atbilstošas digitālo humanitāro zinātņu ekosistēmas attīstība Latvijā (DHELI)”, Nr. VPP-IZM-DH-2022/1-0002.

Pateicība par audio ierakstu veikšanu Latvijas Radio Latgales studijai, projekta “Bolsu tolka” dalībniekiem.

Kontakti

Atsauksmēm un saziņai: ltg.tezaurs@rta.lv