Šie piemēri no latviešu valodas tekstu korpusa ir atlasīti automātiski un var būt neprecīzi.
- Sintaktisko formu atspoguļo vārdu morfoloģiskās formas, saistītājvārdi, vārdu secība un runas intonācija.
- Mūsdienās tie pārsvarā ir zuduši, tāpat kā arī virkne no konstatētajām nominālajām vārdkopām ( piem., ar prievārdu no kā saistītājvārdu modelī [N+no+N]).
- Vārdu vektoru iegūšanai tiek norādīti papildu parametri, būtiskākie no kuriem nosaka vārdu sakņu izgūšanu ( stemmer), saistītājvārdu ( stopwords) izslēgšanu un vārdu salikumu izmantošanu ( garumā līdz 3 vārdiem), kā arī 100 biežāko, nevis visu, vārdu paturēšanu vārdu vektorā.
- Pakāpeniski aizstājot nominālās vārdkopas, kurās kā saistītājvārdi lietoti prievārdi ( N+iekš+N un N+uz+N), substantīvo vārdkopu ar atkarīgo komponentu lokatīvā lietojuma biežums pieaug ( 19. gs. – 2,08 % , 20. gs. – 4,38 % ) : Leelee negatawee reekʃti ʄahls uhdenî ( KB 1883: 49), Barawikas etiķî ( KB 1913: 59); Zivis sēņu mērcē ( KB 1987: 90), Vistas gaļas frikadeles želejā ( KB 1991b: 186).
- Veido tekstu, izmantojot saistītājvārdus ( piemēram, " pirmkārt", " otrkārt", " visbeidzot").