Üldist
Korpus on koostatud juhuslikult kogutud materjalist (10,4 miljonit sõnavormi; u 80% ulatuses ajalehetekstid) ja pole seega 'representatiivne'. Ka ei ole korpus märgendatud, sobides eelkõige leksikaalse materjali otsinguks. Päringud ja vastused opereerivad mitte lausete vaid lõikudega.
Palun mitte kasutada päringutes metasümboleid jm kribu-krabu. Kirjavahemärkide jms leidmiseks võib ja tuleb panna otsitav lõik jutumärkide vahele: "pole, " leiab need lõigud, kus sõna "pole" järel on tekstis koma ja tühik.
Päringureale võib kirjutada ka mitu sõnavormi, selline päring leiab mõlemat sõnavormi sisaldavad lõigud.
Ainult väiketähti sisaldav päring on tõstutundetu, st päringule 'looming' leitakse vasteks nii 'looming', 'Looming' kui ka 'LOOMING'. Kui kasutate päringus suurtähti, saate ainult täpse vaste: päring 'LOOMING' ei anna tulemusse lõike, kus otsitav on kujul 'looming' või 'Looming'.
Täpsed vasted värvitakse punaseks, suur-väiketähtede erinevuse korral aga lillaks. Kui päring eeldab terviksõnu, aga tulemuses on punaseks värvitud ka sõnaosi, ärge laske end segada.
Mida teeb
täpselt sellel kujul ?
Kõiki päringus esinevaid sõnavorme tõlgendatakse terviksõnadena. Keelab või lubab otsida tähejärjendit sõnade seest, st vastuste hulka tulevad need lõigud, kus otsitud tähejärjend on tekstis piiratud mitte-tähtedega.
Rubriigid sisaldavad
Ajalehed
ca 75 Mb
: suurelt jaolt "Eesti Ekspressi" tekstid 1994. aastast ja "Eesti Päevalehe" tekstid 1996. aastast, sekka "7 päeva", "Kaubaleht", "Eesti Elu" jms.
Ajakirjad (ajakirjad, populaarteaduslikud väljaanded, seadusetekstid jms)
ca 3 Mb
: esialgu "Vikerkaar", "Kultuur ja Elu" jms kuid loodetavasti täieneb peatselt.
Ilukirjandus
ca 8 Mb
: suuremad on "Must obelisk", "Sõrmuste isand", "Pipi Pikksukk", "Taipan", "Piiririik".
Kõnekeel
ca 0,5 Mb
: ainult 14 osa seriaalist "Dallas", mida saab vaevu kõnekeeleks pidada.
Maksimaalne vastuste arv rubriigis
25
Piiratud ei ole koguvastuste arv, vaid vastuste arv rubriigiti. Seega vaikimisi piiranguga 25 esitatud päring annab vastusesse kuni 100 lõiku (4 rubriiki * 25). Vaikeväärtus taastub pärast igat päringut.