Sketch Engine – Uputstvo za pretragu korpusa (SR)

Ovaj tekst je pre­ve­de­no i pri­la­go­đe­no ori­gi­nal­no uput­stvo, koje je dostup­no na stra­ni­ci Sketch Engi­ne.

Kako dobi­ti kon­kor­dan­ce

      • Prvo klik­ni­te na polje “Home”.
      • Na počet­noj stra­ni­ci oda­be­ri­te kor­pus koji želi­te da pre­tra­žu­je­te.
      • Une­si­te želje­ni upit u polje za pre­tra­gu. Upi­tom se mogu tra­ži­ti jed­na ili više reči u nizu. Upi­tom une­tim u polje pod nazi­vom “Sim­ple Que­ry” pre­tra­žu­ju se reči i leme (kod lema­ti­zo­va­nih kor­pu­sa). Kod nekih kor­pu­sa, u zavi­sno­sti od toga kako su pode­še­ne opci­je, pod­jed­na­ko će se tre­ti­ra­ti mala i veli­ka slo­va.

Pro­sti upi­ti (“Sim­ple Que­ry”)

U aktu­el­noj imple­men­ta­ci­ji osnov­na pre­tra­ga uklju­ču­je lema­ti­za­ci­ju, pa će, uko­li­ko une­se­te reč u flek­tiv­nom obli­ku, rezul­tat pre­tra­ge uklju­či­va­ti sve dru­ge obli­ke zada­te reči.

  • Uko­li­ko une­se­te u polje za pre­tra­gu reč

    kuća

      • , kao rezul­tat ćete dobi­ti sve pade­žne obli­ke te reči:

    kuća, kuće, kući, kuću…

  • Rezul­ta­ti se neće razli­ko­va­ti u slu­ča­ju da une­se­te u polje za pre­tra­gu

    Kuća, KUĆA

      • ili

    KuĆa

  • Među­tim, ako tra­ži­te
  • kući

      • ili

    KuĆi

      • , kao rezul­tat ćete dobi­ti samo obli­ke loka­ti­va i dati­va ime­ni­ce

    kuća

      • , tj. samo obli­ke koje ste une­li kao upit.
  • Kada je upit

    dobar raz­go­vor

      • , Sketch Engi­ne će dati kao rezul­tat sve kom­bi­na­ci­je obli­ka za obe reči:

    dobar/a/og/u/om… razgovor/a/u…

  • Spe­ci­jal­ni karak­te­ri

*

         i

?

omo­gu­ća­va­ju flek­si­bil­nu pre­tra­gu. Na pri­mer:

    • kuć*
      • pro­na­la­zi

kuća, kuću, kuć­ni, kući­ti,…

      • b?l
      • pro­na­la­zi

bal, bol,…

      • b*l
      • pro­na­la­zi

bal, bol, bicikl, Bri­sel,…

  • Kada želi­te da pro­na­đe­te aste­risk i znak pita­nja, to se izvo­di pomo­ću \*, \?.
    Spe­ci­jal­ni karak­te­ri su deo regu­lar­nih izra­za.

Detalj­ni­ji upi­ti

Uko­li­ko vam osnov­na pre­tra­ga (“Sim­ple Que­ry”) sa una­pred defi­ni­sa­nim opci­ja­ma ne daje želje­ne rezul­ta­te, deta­lji­ne upi­te može­te posta­vi­ti pomo­ću “Que­ry Type”. Kli­kom na polje “Que­ry Type” može­te da pode­si­te opci­je za zada­va­nje pre­ci­zni­jih upi­ta. Za razli­ku od “Sim­ple Que­ry”, koji kori­sti redu­ko­van set spe­ci­jal­nih karak­te­ra, ove opci­je podr­ža­va­ju regu­lar­ne izra­ze. Nakon što ste for­mu­li­sa­li upit, klik­ni­te na polje “Make Con­cor­dan­ce” u dnu polja za pre­tra­gu.

  • Sim­ple”: već opi­sa­na stan­dard­na pre­tra­ga koja uklju­ču­je veli­ka i mala slo­va, osnov­ne i flek­tv­ne obli­ke reči.
  • Lem­ma”: uno­si se osnov­ni oblik reči, a kao rezul­tat se dobi­ja para­dig­ma te reči (npr. gle­da­ti za gle­dam, gle­da­te, gle­da­li, …). U ovom okvi­ru se može­te zada­ti i kon­kret­na vrsta reči (PoS) kako bi se izbe­gle gre­ške kod homo­ni­ma (npr. dug kao pri­dev vs. dug kao ime­ni­ca).
  • Phra­se”: za pre­tra­gu doslov­nog niza reči (npr. devoj­či­ce i deča­ci
  • Word Form”: za doslo­van oblik reči, pri čemu će rezul­ta­ti sadr­ža­ti vari­jan­te sa veli­kim i malim slo­vi­ma. Opci­ju “Match Case” omo­gu­ća­va razli­ko­va­nje veli­kih i malih slo­va. I ovde se može zada­ti vrsta reči (PoS).
  • Cha­rac­ter”: za niz karak­te­ra gde se kao rezul­tat dobi­ja­ju sve reči koje sadr­že taj niz (npr. gol za golom, zago­li­ca­la, naj­mno­go­ljud­ni­jih, …). Tre­ba ima­ti u vidu da gene­ri­sa­nje rezul­ta­ta u ovom slu­ča­ju može biti malo spo­ri­je.
  • CQL (Cor­pus Que­ry Lan­gu­a­ge)”: jezik za for­mu­li­sa­nje slo­že­nih upi­ta. Za efi­ka­sno zada­va­nje upi­ta pomo­ću CQL potreb­no je zna­ti kako je kor­pus ano­tri­an. Spi­sak tago­va kori­šće­nih u datom kor­pu­su se pri­ka­zu­je kli­kom na “Tag­set Sum­ma­ry”.

Napred­ne opci­je

Kli­kom na polje “Con­te­xt” zada­je se kon­tekst pre­tra­ge. Kon­tekst se može zada­ti kao lema ili vrsta reči (PoS) koje se nala­ze pre i posle pre­tra­ži­va­ne reči.

  • Lem­ma fil­ter”: fil­tri­ra­nje kon­tek­sta pre­ma osnov­nom obli­ku reči.
  • PoS fil­ter”: fil­tri­ra­nje kon­tek­sta pre­ma vrsti reči.

Za oba fil­te­ra može se odre­di­ti:

  • Win­dow: da li ta reč pret­ho­di ili sle­di pre­tra­ži­va­ni oblik, i koli­ko (izra­že­no u bro­ju toke­na)
  • Može­te une­ti više od jed­ne leme ili PoS kate­go­ri­ja i dore­di­ti da li se pre­tra­ga odno­si na:
    • Sve une­te (“All”)
    • Neke od njih (“Any”)
    • Nijed­nu od njih (“None”)