31 May Sketch Engine – Uputstvo za pretragu korpusa (SR)
Ovaj tekst je prevedeno i prilagođeno originalno uputstvo, koje je dostupno na stranici Sketch Engine.
Kako dobiti konkordance
-
-
- Prvo kliknite na polje “Home”.
-
-
-
- Na početnoj stranici odaberite korpus koji želite da pretražujete.
-
-
-
- Unesite željeni upit u polje za pretragu. Upitom se mogu tražiti jedna ili više reči u nizu. Upitom unetim u polje pod nazivom “Simple Query” pretražuju se reči i leme (kod lematizovanih korpusa). Kod nekih korpusa, u zavisnosti od toga kako su podešene opcije, podjednako će se tretirati mala i velika slova.
-
Prosti upiti (“Simple Query”)
U aktuelnoj implementaciji osnovna pretraga uključuje lematizaciju, pa će, ukoliko unesete reč u flektivnom obliku, rezultat pretrage uključivati sve druge oblike zadate reči.
- Ukoliko unesete u polje za pretragu reč
kuća
-
- , kao rezultat ćete dobiti sve padežne oblike te reči:
kuća, kuće, kući, kuću…
-
- Rezultati se neće razlikovati u slučaju da unesete u polje za pretragu
Kuća, KUĆA
-
- ili
KuĆa
-
- Međutim, ako tražite
-
-
kući
-
- ili
KuĆi
-
- , kao rezultat ćete dobiti samo oblike lokativa i dativa imenice
kuća
-
- , tj. samo oblike koje ste uneli kao upit.
-
- Kada je upit
dobar razgovor
-
- , Sketch Engine će dati kao rezultat sve kombinacije oblika za obe reči:
dobar/a/og/u/om… razgovor/a/u…
-
- Specijalni karakteri
*
- i
?
omogućavaju fleksibilnu pretragu. Na primer:
-
- kuć*
-
-
- pronalazi
-
kuća, kuću, kućni, kućiti,…
-
-
- b?l
-
-
-
- pronalazi
-
bal, bol,…
-
-
- b*l
-
-
-
- pronalazi
-
bal, bol, bicikl, Brisel,…
- Kada želite da pronađete asterisk i znak pitanja, to se izvodi pomoću \*, \?.
Specijalni karakteri su deo regularnih izraza.
Detaljniji upiti
Ukoliko vam osnovna pretraga (“Simple Query”) sa unapred definisanim opcijama ne daje željene rezultate, detaljine upite možete postaviti pomoću “Query Type”. Klikom na polje “Query Type” možete da podesite opcije za zadavanje preciznijih upita. Za razliku od “Simple Query”, koji koristi redukovan set specijalnih karaktera, ove opcije podržavaju regularne izraze. Nakon što ste formulisali upit, kliknite na polje “Make Concordance” u dnu polja za pretragu.
- “Simple”: već opisana standardna pretraga koja uključuje velika i mala slova, osnovne i flektvne oblike reči.
- “Lemma”: unosi se osnovni oblik reči, a kao rezultat se dobija paradigma te reči (npr. gledati za gledam, gledate, gledali, …). U ovom okviru se možete zadati i konkretna vrsta reči (PoS) kako bi se izbegle greške kod homonima (npr. dug kao pridev vs. dug kao imenica).
- “Phrase”: za pretragu doslovnog niza reči (npr. devojčice i dečaci
- “Word Form”: za doslovan oblik reči, pri čemu će rezultati sadržati varijante sa velikim i malim slovima. Opciju “Match Case” omogućava razlikovanje velikih i malih slova. I ovde se može zadati vrsta reči (PoS).
- “Character”: za niz karaktera gde se kao rezultat dobijaju sve reči koje sadrže taj niz (npr. gol za golom, zagolicala, najmnogoljudnijih, …). Treba imati u vidu da generisanje rezultata u ovom slučaju može biti malo sporije.
- “CQL (Corpus Query Language)”: jezik za formulisanje složenih upita. Za efikasno zadavanje upita pomoću CQL potrebno je znati kako je korpus anotrian. Spisak tagova korišćenih u datom korpusu se prikazuje klikom na “Tagset Summary”.
Napredne opcije
Klikom na polje “Context” zadaje se kontekst pretrage. Kontekst se može zadati kao lema ili vrsta reči (PoS) koje se nalaze pre i posle pretraživane reči.
- “Lemma filter”: filtriranje konteksta prema osnovnom obliku reči.
- “PoS filter”: filtriranje konteksta prema vrsti reči.
Za oba filtera može se odrediti:
- Window: da li ta reč prethodi ili sledi pretraživani oblik, i koliko (izraženo u broju tokena)
- Možete uneti više od jedne leme ili PoS kategorija i dorediti da li se pretraga odnosi na:
- Sve unete (“All”)
- Neke od njih (“Any”)
- Nijednu od njih (“None”)