Rudens versija 2024
405 379 šķirkļi

Par Tēzauru

Tēzaurs ir plaša skaidrojošā un sinonīmu vārdnīca, kas LU MII Mākslīgā intelekta laboratorijā (AiLab) tiek izstrādāta kopš 20. gs. 90. gadiem un joprojām tiek aktīvi pilnveidota. Vārdi, stabili vārdu savienojumi un to nozīmes Tēzaura šķirkļos pārsvarā kompilēti no vārdnīcām, enciklopēdijām, dažādām datubāzēm u.tml. – informācija iegūta no vairāk nekā 340 daudzveidīgiem avotiem. Šķirkļos, kas veido latviešu valodas leksisko tīklu, nozīmju dalījums ir būtiski pārstrādāts, balstoties Korpuss.lv datos.

Tēzaura veidotāju mērķis ir apkopot visus latviešu valodā lietotos vārdus un to nozīmes, kā arī pēc iespējas bagātināt šķirkļus ar papildu informāciju. Lielai daļai vārdu ir pieejamas locīšanas tabulas un automātiski atlasīti piemēri no Līdzsvarotā mūsdienu latviešu valodas tekstu korpusa. Biežāk lietoto vārdu nozīmes ir rediģētas un manuāli papildinātas ar piemēriem, saistītajām nozīmēm (t.sk. sinonīmiem, meronīmiem, hiponīmiem) un tulkojumiem (sk. AiLab leksikogrāfu komandas papildināto šķirkļu sarakstu).

Šī ir deskriptīva vārdnīca, kurā leksika tiek iekļauta neatkarīgi no valodas paveida, žanra vai lietojuma, tāpēc te var atrast arī apvidvārdus, novecojušus vārdus, rakstības variantus, nevēlamus vārdus, sarunvalodas vārdus, žargonvārdus u.tml. – pievērsiet uzmanību šķirkļos iekļautajām norādēm! Daļai šķirkļu pievienotas arī norādes par cilmi vai komentāri par dažādiem valodas kultūras aspektiem.

Tēzaurā ir fiksēti arī daudzi ģeogrāfiskie nosaukumi, bet pagaidām plašāk nav iekļautas tādas nosaukumu grupas kā personvārdi, organizācijas u.tml.


Kā atsaukties uz Tēzauru

Jaunākā atvērto datu kopaSpektors, Andrejs et al. Tēzaurs.lv, 2024, Rudens versija. CLARIN-LV digitālā bibliotēka, 🔗 http://hdl.handle.net/20.500.12574/110.
PublikācijaGrasmanis, Mikus et al. Tēzaurs.lv – the experience of building a multifunctional lexical resource. Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference, 2023. 🔗 PDF saite
PublikācijaSpektors, Andrejs et al. Tezaurs.lv: the largest open lexical database for Latvian. Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC), 2016.
🔗 PDF saite

Pateicības

Tēzaurs.lv pirmsākumi meklējami 90. gadu sākumā, kad ar Jaunmeksikas Valsts universitātes un Laskrusas Rotari kluba atbalstu LU MII Mākslīgā intelekta laboratorijā tika radīta "Latviešu valodas vārdnīcas" (Rīga: Avots, 1987) elektroniskā versija. Tēzaurs.lv attīstību ir ietekmējusi arī K. Mīlenbaha un J. Endzelīna "Latviešu valodas vārdnīcas" elektroniskās versijas izveide, kas 2000. gadu sākumā notika ar Latviešu Fonda un LR IZM finansiālu atbalstu.

Pēdējo vairāk nekā 15 gadu laikā Tēzaurs.lv platformas un datubāzes izstrāde un attīstība notiek dažādu pētniecības programmu ietvaros.

Valsts pētījumu programmas "Digitālās humanitārās zinātnes" projekts Nr. VPP-IZM-DH-2022/1-0002 (2022–2025)

Valsts pētījumu programmas "Letonika latviskas un eiropeiskas sabiedrības attīstībai" projekts Nr. VPP-LETONIKA-2021/1-0006 (2022–2024)

Valsts pētījumu programmas "Humanitāro zinātņu digitālie resursi" projekts Nr. VPP-IZM-DH-2020/1-0001 (2020–2022)

Latvijas Zinātnes padomes programmas "Fundamentālie un lietišķie pētījumi" projekts Nr. lzp-2019/1-0464 (2020–2022)

Latvijas Zinātnes padomes programmas "Fundamentālie un lietišķie pētījumi" projekts Nr. lzp-2022/1-0443 (2023–2026)

Valsts pētījumu programmas "Latviešu valoda" projekts Nr. VPP-IZM-2018/2-0002 (2018–2021)
Eiropas Reģionālās attīstības fonda programmas "Praktiskas ievirzes pētījumi" projekts Nr. 1.1.1.1/16/A/219 (2017–2019)
Valsts pētījumu programmas "Letonika: Latvijas vēsture, valoda, kultūra, vērtības" projekts Nr. 3 (2014–2017)
Valsts pētījumu programmas "Nacionālā identitāte: valoda, Latvijas vēsture, kultūra un cilvēkdrošība" projekts Nr. 3 (2010–2013)
Valsts pētījumu programmas "Letonika: pētījumi par vēsturi, valodu un kultūru" projekts Nr. 5.14 (2006–2009)
Valsts pētījumu programmas "Informācijas tehnoloģiju zinātniskā bāze" projekts Nr. 2 (2005–2009)