Atbildes uz bieži uzdotiem jautājumiem

Ar ko Tēzaurs atšķiras no citām Tēzaurs.lv platformā iekļautajām vārdnīcām?

Tēzaurs veidots, pamatojoties uz informāciju no vairāk nekā 300 daudzveidīgiem avotiem. Vārdnīcas šķirkļi pārsvarā ir kompilēti no vārdnīcām, enciklopēdijām un dažādām datubāzēm. Šķirkļos, kas veido latviešu valodas leksisko tīklu, nozīmju dalījums ir būtiski pārstrādāts, balstoties Korpuss.lv datos.

Latviešu literārās valodas vārdnīca ir digitalizēta “Latviešu literārās valodas vārdnīca”, kuru Zinātņu akadēmijas Valodas un literatūras institūts sagatavoja un apgāds “Zinātne” izdeva 8 sējumos no 1972. līdz 1996. gadam. Šī vārdnīca netiek papildināta, tajā tiek labotas tikai tās kļūdas, kas radušās digitalizācijas procesā.

Mūsdienu latviešu valodas vārdnīca pieejama Tēzaura redaktorā, to kā atsevišķu vārdnīcu izstrādā LU Latviešu valodas institūta leksikogrāfi.

Kā sazināties ar Tēzaura veidotājiem?

Rakstiet uz info@tezaurs.lv.

Kā varu ziņot par kļūdu Tēzaura šķirklī?

Ir vairākas iespējas, kā ziņot.

Izmantot izvēlni “Ziņot” – teksta laukā norādiet uz kļūdu un aprakstiet vēlamo labojumu. Varat ziņot anonīmi, bet, ja vēlaties saņemt atbildi uz ziņojumu, lūdzu norādiet savu e-pasta adresi.
Rakstīt uz info@tezaurs.lv un, atsaucoties uz šķirkli, skaidrot neprecizitāti.
Ziņot tviterī, atzīmējot @AiLab_LV kontu, citādi varam nepamanīt ieteikumu.

Kā Tēzaurā tiek labotas lasītāju pamanītās neprecizitātes?

Lietotāju ziņojumi tiek izskatīti, un kļūdas tiek labotas vārdnīcu redaktorā, bet plašākai sabiedrībai šie labojumi ir redzami vārdnīcas nākamajā laidienā, kurš iznāk reizi ceturksnī.

Kas ir Vasaras / Rudens / Ziemas / Pavasara versija?

Tēzaurs tiek papildināts un labots visu laiku, bet tā jaunākais laidiens tiek publiskots reizi ceturksnī – līdz ar astronomisko gadalaiku maiņu.

Kas ir korpusa piemēri?

Informācija no avotiem Tēzaurā tiek ievietota bez valodas piemēriem. Valodas piemēri šķirklim automātiski tiek atlasīti no Nacionālās korpusu kolekcijas.

Manuāli atlasīti piemēri no dažādiem korpusiem parādās tikai pie nozīmēm un šķirkļiem, kas ir iekļauti latviešu valodas leksiskajā tīklā.

Kāpēc daži korpusa piemēri pie šķirkļa ir nepareizi?

Piemēri no korpusiem ir atlasīti automātiski, ņemot vērā arī korpusa automātisko gramatisko marķējumu. Kļūdas piemēru atlasē var rasties gan korpusa gramatiskā marķējuma neprecizitāšu dēļ, gan tādēļ, ka korpuss nav marķēts nozīmju līmenī, līdz ar to netiek nošķirti homonīmi un dažādas nozīmes nianses. Ja pamanāt neatbilstošu piemēru, ziņojiet.

Kas ir Tēzaurā norādītais vārdu lietojuma biežums?

Daļā šķirkļu pie šķirkļa galvenās leksēmas ir norādīts tās lietojuma biežums. Biežums ir automātiski izgūts no “Nacionālās korpusu kolekcijas” (NKK) datiem un ilustrēts ar svītriņām:

piecas zaļās svītriņas atbilst vismaz 100 vārdlietojumiem uz vienu miljonu korpusa vārdu,
četras – vismaz 10 vārdlietojumiem uz vienu miljonu korpusa vārdu,
trīs – vismaz 1 vārdlietojumam uz vienu miljonu korpusa vārdu,
divas – vismaz vienam vārdlietojumam uz 10 miljoniem korpusa vārdu,
viena – mazāk nekā vienam vārdlietojumam uz 10 miljoniem korpusa vārdu.

Biežuma statistika nav sniegta vairākvārdu leksēmu šķirkļiem un īpašvārdiem. Homonīmiem biežums ir norādīts pie pirmā homonīma, bet ietver visu homonīmu kopējo biežumu. Statistika balstīta uz 918 miljoniem vārdlietojumu 15 NKK korpusos.

Kāpēc dažos Tēzaura šķirkļos ir sinonīmi, tulkojumi u. tml. saites?

Biežāk lietoto vārdu nozīmes (sk. Mākslīgā intelekta laboratorijas leksikogrāfu komandas papildināto šķirkļu sarakstu) ir rediģētas un papildinātas ar piemēriem, saistītajām nozīmēm (t.sk. sinonīmiem, meronīmiem, hiponīmiem) un tulkojumiem.

Vai, atverot šķirkli, uzreiz var rādīt izvērstas locījumu tabulas, piemērus, saistītās nozīmes u. tml.?

Izvēlnē iestatījumi atzīmējiet sadaļas, kuras vēlaties redzēt, atverot šķirkli.

Kā tiek veidotas locīšanas tabulas?

Locījumi tiek veidoti automātiski, pamatojoties uz manuāli norādītu informāciju par vārda piederību noteiktai locīšanas grupai.

Kāpēc locīšanā nesniedzat arī divdabju formas?

Katram darbības vārdam iespējamas simtiem divdabja formu, ko būtu grūti attēlot vienā šķirkļa skatā. Apsveram iespēju ar laiku locīšanas tabulās iekļaut arī galvenās divdabju formas bez locījumiem.

Kāpēc locīšanas tabulā nenorādāt šauro un plato e, ē?

Šobrīd informācija par vārda izrunu nav iekļauta ne locīšanas tabulās, ne pie šķirkļavārda (ar atsevišķiem izņēmumiem), taču ar laiku plānojam to pievienot.