Ziemas versija 2024
399 012 šķirkļi

Par Tēzauru

Tēzaurs ir plaša skaidrojošā un sinonīmu vārdnīca, kas LU MII Mākslīgā intelekta laboratorijā tiek izstrādāta jau kopš 20. gs. 90. gadiem un arī šobrīd tiek aktīvi rediģēta un papildināta. Vārdi, stabili vārdu savienojumi un nozīmes vārdnīcas šķirkļos pārsvarā kompilēti no vārdnīcām, enciklopēdijām, dažādām datubāzēm u.tml. – informācija iegūta no vairāk nekā 300 daudzveidīgiem avotiem. Šķirkļos, kas veido latviešu valodas leksisko tīklu, nozīmju dalījums ir būtiski pārstrādāts, balstoties Korpuss.lv datos.

Tēzaura veidotāju mērķis ir apkopot visus latviešu valodā lietotos vārdus un to nozīmes, kā arī pēc iespējas bagātināt šķirkļus ar papildu informāciju. Lielai daļai šķirkļu ir pieejami locīšanas paraugi un automātiski atlasīti piemēri no Līdzsvarotā mūsdienu latviešu valodas tekstu korpusa. Biežāk lietoto latviešu valodas vārdu nozīmes ir rediģētas un manuāli papildinātas ar piemēriem, saistītajām nozīmēm (t.sk. sinonīmiem, meronīmiem, hiponīmiem) un tulkojumiem (sk. Mākslīgā intelekta laboratorijas leksikogrāfu komandas papildināto šķirkļu sarakstu).

Šī ir deskriptīva vārdnīca, kurā leksika tiek iekļauta neatkarīgi no valodas paveida, žanra vai lietojuma, tāpēc te var atrast arī apvidvārdus, novecojušus vārdus, rakstības variantus, nevēlamus vārdus, sarunvalodas vārdus, žargonvārdus u.tml. Atsevišķiem šķirkļiem pievienotas norādes par cilmi vai komentāri par dažādiem valodas kultūras aspektiem.

Tēzaurā ir fiksēti arī daudzi ģeogrāfiskie nosaukumi, bet pagaidām plašāk nav iekļautas tādas nosaukumu grupas kā personvārdi, organizācijas u.tml.


Kā atsaukties uz Tēzauru

Jaunākā atvērto datu kopaSpektors, Andrejs et al. Tēzaurs.lv, 2023, Autumn edition. CLARIN-LV digital library at IMCS, 🔗 http://hdl.handle.net/20.500.12574/92.
PublikācijaGrasmanis, Mikus et al. Tēzaurs.lv – the experience of building a multifunctional lexical resource. Electronic lexicography in the 21st century (eLex 2023): Invisible Lexicography. Proceedings of the eLex 2023 conference, 2023. 🔗 PDF saite
PublikācijaSpektors, Andrejs et al. Tezaurs.lv: the largest open lexical database for Latvian. Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC), 2016. 🔗 PDF saite

Pateicības

Tēzaurs.lv pirmsākumi meklējami 90. gadu sākumā, kad ar Jaunmeksikas Valsts universitātes un Laskrusas Rotari kluba atbalstu LU MII Mākslīgā intelekta laboratorijā tika radīta "Latviešu valodas vārdnīcas" (Rīga: Avots, 1987) elektroniskā versija. Tēzaurs.lv attīstību ir ietekmējusi arī K. Mīlenbaha un J. Endzelīna "Latviešu valodas vārdnīcas" elektroniskās versijas izveide, kas 2000. gadu sākumā notika ar Latviešu Fonda un LR IZM finansiālu atbalstu.

Pēdējo vairāk nekā 15 gadu laikā Tēzaurs.lv platformas un datubāzes izstrāde un attīstība notiek dažādu pētniecības programmu ietvaros.

Valsts pētījumu programmas "Digitālās humanitārās zinātnes" projekts Nr. VPP-IZM-DH-2022/1-0002 (2022–2025)

Valsts pētījumu programmas "Letonika latviskas un eiropeiskas sabiedrības attīstībai" projekts Nr. VPP-LETONIKA-2021/1-0006 (2022–2024)

Valsts pētījumu programmas "Humanitāro zinātņu digitālie resursi" projekts Nr. VPP-IZM-DH-2020/1-0001 (2020–2022)

Latvijas Zinātnes padomes programmas "Fundamentālie un lietišķie pētījumi" projekts Nr. lzp-2019/1-0464 (2020–2022)

Latvijas Zinātnes padomes programmas "Fundamentālie un lietišķie pētījumi" projekts Nr. lzp-2022/1-0443 (2023–2026)

Valsts pētījumu programmas "Latviešu valoda" projekts Nr. VPP-IZM-2018/2-0002 (2018–2021)
Eiropas Reģionālās attīstības fonda programmas "Praktiskas ievirzes pētījumi" projekts Nr. 1.1.1.1/16/A/219 (2017–2019)
Valsts pētījumu programmas "Letonika: Latvijas vēsture, valoda, kultūra, vērtības" projekts Nr. 3 (2014–2017)
Valsts pētījumu programmas "Nacionālā identitāte: valoda, Latvijas vēsture, kultūra un cilvēkdrošība" projekts Nr. 3 (2010–2013)
Valsts pētījumu programmas "Letonika: pētījumi par vēsturi, valodu un kultūru" projekts Nr. 5.14 (2006–2009)
Valsts pētījumu programmas "Informācijas tehnoloģiju zinātniskā bāze" projekts Nr. 2 (2005–2009)