Strategija pretraivanja Osnovni postupci Postavljanje strategije pretraivanja n

  • Slides: 39
Download presentation
Strategija pretraživanja Osnovni postupci

Strategija pretraživanja Osnovni postupci

Postavljanje strategije pretraživanja n n n Precizno uobličiti rečenicu koja predstavlja upit Raščlaniti upit

Postavljanje strategije pretraživanja n n n Precizno uobličiti rečenicu koja predstavlja upit Raščlaniti upit na osnovne samostalne pojmove – koncepte Svaki koncept raščlaniti na srodne pojmove i istoznačnice (sinonime) Odrediti gramatičke oblike svakog izraza unutar svakog koncepta Povezati sve izraze unutar istoga koncepta operatorom OR Kombinirati različite koncepte operatorom AND

Posebnosti strategije za klinička pitanja n n n Temelji se na modelu PICO Nepotrebno

Posebnosti strategije za klinička pitanja n n n Temelji se na modelu PICO Nepotrebno je pretraživati svaki aspekt kliničkoga pitanja po modelu PICO – to bi dovelo do prevelikoga sužavanja pretraživanja Strategija pretraživanja za bazu kao što je MEDLINE obično sadrži tri elementa: n n n Izraze (Me. SH i slobodno odabrane ključne riječi) koji opisuju zdravstveno stanje koje nas zanima (populaciju/problem) Izraze koji opisuju intervenciju Izraze koji opisuju vrstu studije koja nas zanima (ne koristi se u specijaliziranim bazama kao što je CENTRAL koji sadrži samo određene vrste studija)

Osjetljivost i preciznost u strategiji pretraživanja n Osjetljivost q q n Cilj je takve

Osjetljivost i preciznost u strategiji pretraživanja n Osjetljivost q q n Cilj je takve strategije pronaći što je moguće više radova, pa i onih koji nisu fokusirani. Primjenjuje se kada se pretpostavlja da dostupna literatura nije velika ili kada je potrebno pronaći što veći broj relevantnih radova (tada je broj rezultata obično veoma velik). Preciznost q q Strategija ima za cilj pronaći najvažnije radove. Definira se kao omjer između broja pronađenih relevantnih studija i ukupnoga broja identificiranih studija.

Pretraživačka sučelja n n Ista baza može biti dostupna preko različitih providera koji imaju

Pretraživačka sučelja n n Ista baza može biti dostupna preko različitih providera koji imaju vlastita pretraživačka sučelja Sintaksa pretraživanja ovisi o sučelju preko kojega pristupamo bazi i strukturi same baze Ne može se primijeniti ista sintaksa za Pub. Med i Ovid MEDLINE Primjer: q q Randomized controlled trial. pt. (Ovid MEDLINE) Randomized controlled trial [pt] (Pub. Med)

Znakovi za kraćenje ili zamjenski znakovi n n Kako bi se pretraživanjem obuhvatili svi

Znakovi za kraćenje ili zamjenski znakovi n n Kako bi se pretraživanjem obuhvatili svi gramatički oblici neke riječi koju koristimo kao ključnu riječ, neophodno je koristiti znakove za kraćenje ili zamjenske znakove (engl. , wildcard). Kraćenje (engl. , truncation, stemming) može biti: q q q n n Lijevo (zamjenski znak je na početku riječi) Desno (zamjenski znak je na kraju riječi) Unutarnje (zamjenski znak je unutar riječi) Kod različitih baza (različitih sučelja) koriste se različiti zamjenski znakovi Najčešće se koriste znakovi * i $

Zamjenski znakovi - Ovid Znak $ Funkcija Zamjenjuje neograničeni broj znakova na kraju riječi

Zamjenski znakovi - Ovid Znak $ Funkcija Zamjenjuje neograničeni broj znakova na kraju riječi genetic$ = genetic, genetics, genetically $n Ograničava broj znakova iza osnove riječi na željeni broj genetic$1 = genetic, genetics ? Zamjenjuje 0 ili 1 znak na kraju ili unutar riječi tumo? r = tumour, tumor colo? r = colour, color # Zamjenjuje jedan znak na kraju ili unutar riječi hospitali#ation = hospitalization, hospitalisation wom#n = woman, women dog# = dogs

Zamjenski znakovi - Pub. Med Znak * Funkcija Zamjenjuje neograničeni broj znakova na kraju

Zamjenski znakovi - Pub. Med Znak * Funkcija Zamjenjuje neograničeni broj znakova na kraju riječi hospital* = hospital, hospitals, hospitalisation, hospitalization, hospitality… flavor* = flavor, flavored, flavorful, flavoring…

Zamjenski znakovi - EBSCOhost Znak * ? Funkcija Zamjenjuje neograničeni broj znakova na kraju

Zamjenski znakovi - EBSCOhost Znak * ? Funkcija Zamjenjuje neograničeni broj znakova na kraju riječi hospital* = hospital, hospitals, hospitalisation, hospitalization, hospitality… Zamjenjuje jedan znak na kraju ili unutar riječi hospitali? ation = hospitalization, hospitalisation

Zamjenski znakovi – Web of Science Znak * Funkcija Zamjenjuje 0, 1 ili više

Zamjenski znakovi – Web of Science Znak * Funkcija Zamjenjuje 0, 1 ili više znakova na kraju riječi (nova verzija Wo. S-a dopušta i zamjenu na početku riječi) gene* = gene, genes, genetics, generation… *carbon* = carbon, hydrocarbon, polycarbonate $ Zamjenjuje 0 ili 1 znak unutar riječi colo$r = color, colour tumo$r = tumor, tumour ? Zamjenjuje samo jedan znak unutar riječi en? oblast = entoblast, endoblast

Zamjenski znakovi – Scopus Znak Funkcija ? Zamjenjuje 0 ili 1 znak unutar riječi

Zamjenski znakovi – Scopus Znak Funkcija ? Zamjenjuje 0 ili 1 znak unutar riječi wom? n = woman, women * Zamjenjuje 0 ili više znakova na kraju ili unutar riječi transplant* = transplant, transplanted, transplanter, transplantation h*emoglobin = hemoglobin, haemoglobin…

Transliteracija i transkripcija n n n Radovi se objavljuju na različitim jezicima dok je

Transliteracija i transkripcija n n n Radovi se objavljuju na različitim jezicima dok je jezik poznatih svjetskih baza podataka engleski Problem transliteracije uočljiv je prije svega u imenima autora i nazivima ustanova Hrvatski se dijakritički znakovi trebaju izbjegavati iako je odnedavno prisutan trend uključivanja posebnih znakova iz drugih jezika i u te baze podataka Transliteraciju ponekad provode i sami autori (Đurković – Durkovic, Gjurkovic, Djurkovic) Transkripcija s nelatiničnih pisama je potpuno neujednačena

Stop words – riječi koje baza ignorira A B C D E F H

Stop words – riječi koje baza ignorira A B C D E F H I J K a, about, again, all, almost, also, although, always, among, and, another, any, are, as, at be, because, been, before, being, between, both, but, by can, could did, does, done, during each, either, enough, especially, etc for, found, from, further had, has, have, having, here, however i, if, into, is, its, itself just kg, km

M N O P Q R S T U V W made, mainly, make,

M N O P Q R S T U V W made, mainly, make, may, mg, might, ml, mm, mostly, must nearly, neither, nor obtained, often, our, overall perhaps, pmid quite rather, really, regarding seem, seen, several, should, showed, shown, shows, significantly, since, some, such than, that, their, theirs, them, then, therefore, these, they, this, those, through, thus, to upon, used, using various, very was, were, what, when, which, while, within, without, would

Operatori n n Operatori su riječi ili znakovi koji tijekom pretraživanja vrše točno određenu

Operatori n n Operatori su riječi ili znakovi koji tijekom pretraživanja vrše točno određenu funkciju unutar sintaktičke cjeline. Određuju odnos između ključnih riječi koje se koriste unutar pojedine sintaktičke cjeline i unutar same strategije. Omogućuju preciznije pretraživanje. Najpoznatiji su i najčešće korišteni Booleovi operatori.

Booleovi operatori q AND q OR q NOT q George Boole (1815. – 1864.

Booleovi operatori q AND q OR q NOT q George Boole (1815. – 1864. ) – engleski matematičar, razvio algebru sustava koji se sastoji od samo dva moguća stanja

Operator AND OR NOT Funkcija § Sužava pretraživanje § U rezultate su uključeni samo

Operator AND OR NOT Funkcija § Sužava pretraživanje § U rezultate su uključeni samo oni radovi koji sadrže sve riječi ili izraze koji su povezani tim operatorom § Proširuje pretraživanje § Rezultati uključuju sve radove koji sadrže bilo koju riječ ili izraz koji su povezani tim operatorom § Uključuje i radove koji sadrže sve korištene riječi § Isključuje iz rezultata sve radove koji sadrže riječ ili izraz koji se nalaze iza tog operatora § Treba se koristiti veoma oprezno § Obično se rijetko koristi

Primjer korištenja Booleovih operatora 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

Primjer korištenja Booleovih operatora 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Prva ključna riječ o bolesniku/bolesti PRVI KONCEPT Druga ključna riječ o bolesniku/bolesti 1 OR 2 Prva ključna riječ o intervenciji DRUGI KONCEPT Druga ključna riječ o intervenciji 4 OR 5 TREĆI Prva ključna riječ o tipu studije KONCEPT Druga ključna riječ o tipu studije 7 OR 8 3 AND 6 AND 9

Gniježđenje (engl. , nesting) n n n Kod baza koje ne omogućuju provođenje pretraživanja

Gniježđenje (engl. , nesting) n n n Kod baza koje ne omogućuju provođenje pretraživanja u pojedinačnim naredbenim redcima koristi se postupak gniježđenja – provođenja pretraživanja u jednom nizu. Za grupiranje ključnih riječi za svaki koncept koriste se zagrade. Primjer: q (1 OR 2) AND (3 OR 4 OR 5 OR 6) AND (7 OR 8) PRVI KONCEPT DRUGI KONCEPT TREĆI KONCEPT

Ostali operatori n n U pojedinim se pretraživačkim sučeljima, odnosno bazama podataka, pored Booleovih

Ostali operatori n n U pojedinim se pretraživačkim sučeljima, odnosno bazama podataka, pored Booleovih operatora mogu koristiti i neki drugi. Najčešći su među njima operatori koji određuju udaljenost unutar koje se tražene ključne riječi mogu naći i učestalost njihova pojavljivanja unutar određenoga polja u bazi.

Operatori blizine i učestalosti - Ovid Operator Funkcija ADJn § Operator blizine ADJ (engl.

Operatori blizine i učestalosti - Ovid Operator Funkcija ADJn § Operator blizine ADJ (engl. , adjacency) definira udaljenost na kojoj se mogu naći dvije riječi koje se koriste u pretraživanju § adj 1 ne treba pisati jer Ovid niz od dvije riječi između kojih je razmak tretira kao da je operator primijenjen § vaginal adj 5 delivery - odabrane ključne riječi mogu biti na udaljenosti od najviše 5 riječi § Operator funkcionira obostrano (s lijeve i s desne strane sintaktičke cjeline) § Operator učestalosti FREQ (engl. , frequency) definira FREQ učestalost pojavljivanja neke riječi u polju sažetka § neonatal. ab. /freq=3 – pronalazi samo one radove u čijem sažetku se odabrana riječ pojavljuje najmanje 3 puta “x / y” § Navodni znakovi omogućuju pretraživanje po određenoj sintaktičkoj cjelini (frazi) koja može, ali i ne mora, sadržavati neke znakove kao što su kosa crtica, brojke i sl. § “stem cell” – pronalazi točno taj izraz

Operatori blizine i učestalosti - EBSCOhost Operator N Funkcija § Operator blizine N (engl.

Operatori blizine i učestalosti - EBSCOhost Operator N Funkcija § Operator blizine N (engl. , near) definira udaljenost na kojoj se mogu naći dvije riječi koje se koriste u pretraživanju § vaginal N 5 delivery - odabrane ključne riječi mogu biti na udaljenosti od najviše 5 riječi § Operator funkcionira obostrano (s lijeve i s desne strane sintaktičke cjeline) § Ne funkcionira kada se koriste zagrade za grupiranje srodnih izraza (gniježđenje) § Operator blizine W (engl. , within) također definira udaljenost W “x y” na kojoj se mogu naći dvije riječi koje se koriste u pretraživanju, ali ne funkcionira obostrano, već prema redoslijedu riječi § Ne funkcionira uz primjenu gniježđenja § Navodni znakovi omogućuju pretraživanje po određenoj sintaktičkoj cjelini (frazi) § Ako fraza sadrži stop word, ona će biti ignorirana iako se nalazi unutar navodnika

Operatori blizine i učestalosti - Wo. S Operator NEAR/x SAME “x y” Funkcija §

Operatori blizine i učestalosti - Wo. S Operator NEAR/x SAME “x y” Funkcija § Operator NEAR definira udaljenost na kojoj se mogu naći dvije riječi koje se koriste u pretraživanju § research NEAR/3 integrity – odabrane ključne riječi mogu biti na udaljenosti od najviše tri riječi § research NEAR integrity – ako se ne odredi broj, podrazumijeva se da se između može naći do 15 riječi § Operator SAME pronalazi zapise u kojima se unutar polja adresa nalaze zadane riječi § U ostalim poljima funkcionira kao operator AND § Navodni znakovi omogućuju pretraživanje po određenoj sintaktičkoj cjelini (frazi) § Može se koristiti samo kod pretraživanja u poljima Title i Topic (Title, Abstract, Keywords)

Operatori blizine i učestalosti - Scopus Operator Funkcija W/n § Operator W (engl. ,

Operatori blizine i učestalosti - Scopus Operator Funkcija W/n § Operator W (engl. , within) određuje na kojoj udaljenosti unutar nekoga polja se mogu naći zadane riječi § stroke W/5 mortality – odabrane ključne riječi mogu biti na udaljenosti od najviše pet riječi § Funkcionira s obje strane sintaktičke cjeline PRE/n “x y” § Operator PRE (engl. , precedes by) određuje broj riječi za koji prvi izraz može prethoditi drugomu § stroke PRE/3 mortality – prva riječ se nalazi najviše 3 riječi ispred druge § Navodni znakovi omogućuju pretraživanje po određenoj sintaktičkoj cjelini (frazi) § “water resources” – pronalazi točno taj izraz

Predmetno označivanje u bazama n n n Uobičajeno je da autori sami predmetno označuju

Predmetno označivanje u bazama n n n Uobičajeno je da autori sami predmetno označuju svoj rad (Author Keywords). Neke baze podataka dodatno predmetno označuju radove da bi olakšale pretraživanje. Radovima se obično pridodaju: q q q Dodatne ključne riječi (Keywords Plus) i identifikatori (Identifiers) Predmetnice (Headings, Subject Headings) Klasifikacijske oznake

Kontrolirani pojmovi - predmetnice n n n Predmetnice su strogo kontrolirani pojmovi koji omogućuju

Kontrolirani pojmovi - predmetnice n n n Predmetnice su strogo kontrolirani pojmovi koji omogućuju konzistentnost terminologije prilikom opisivanja rada. Tezaurus je kontrolirani rječnik koji se sastoji od predmetnica i potpredmetnica. Svaka predmetnica unutar tezaurusa ima: q q q detaljan opis sinonime i srodne izraze podređene i nadređene pojmove

Nekontrolirani izrazi - identifikatori n n n Indekseri mogu koristiti i slobodno odabrane, nekontrolirane

Nekontrolirani izrazi - identifikatori n n n Indekseri mogu koristiti i slobodno odabrane, nekontrolirane izraze za dodatno opisivanje radova. Takvi izrazi nemaju strukturiran tezaurus, odnosno nisu hijerarhijski određeni niti jasno opisani. Prilikom takvog predmetnog označivanja nastoje se ne koristiti izrazi koje je autor već koristio.

Mapiranje n n n Mapiranje (engl. , mapping) je postupak povezivanja slobodno odabranih ključnih

Mapiranje n n n Mapiranje (engl. , mapping) je postupak povezivanja slobodno odabranih ključnih riječi s odgovarajućim pojmovima (predmetnicama) u kontroliranom rječniku (tezaurusu). Može se koristiti jedino u bazama koje takav rječnik imaju (MEDLINE, Psyc. INFO, ERIC…) Mapiranje je obično zadana postavka koja se može prema potrebi isključiti.

Kontrolirani rječnik ili slobodno odabrane ključne riječi? n n Dobra strategija mora obuhvaćati oboje

Kontrolirani rječnik ili slobodno odabrane ključne riječi? n n Dobra strategija mora obuhvaćati oboje ako baza koristi kontrolirani rječnik (tezaurus) kao što je Me. SH Za svaki je koncept potrebno odabrati odgovarajuće predmetnice Polazište može biti neki relevantni članak u čijem zapisu se mogu vidjeti pridodani mu termini Me. SH Database (Pub. Med) se također može koristiti za identifikaciju odgovarajućih termina

Struktura Me. SH-a

Struktura Me. SH-a

Struktura tezaurusa u bazi ERIC

Struktura tezaurusa u bazi ERIC

Struktura tezaurusa u bazi Psyc. INFO

Struktura tezaurusa u bazi Psyc. INFO

Primjer kombinacije predmetnica i ključnih riječi za jedan koncept 1. 2. 3. 4. 5.

Primjer kombinacije predmetnica i ključnih riječi za jedan koncept 1. 2. 3. 4. 5. 6. 7. 8. Osteoporosis, Postmenopausal/ osteoporo$. ti, ab. Bone Density/ (bone adj 5 (densit$ OR loss OR mass)). ti, ab. BMD. ti, ab. Fractures, Bone/ fracture$. ti, ab. OR/1 -7

Primjer cijele strategije Sampson M, Mc. Gowan J, Lefebvre C, Moher D, Grimshaw J.

Primjer cijele strategije Sampson M, Mc. Gowan J, Lefebvre C, Moher D, Grimshaw J. PRESS: Peer review of electronic search strategies, 2008. MEDLINE (OVID) 1. search$. tw. 2. exp "information storage and retrieval"/ or Medical Informatics/ 3. Data Compression/ 4. 2 not 3 5. or/1, 4 6. quality control/ or Evaluation Studies/ or "reproducibility of results"/ 7. (quality adj 2 assess$). tw. 8. or/6 -7 9. (quality or evaluat$). tw. 10. (precision or recall or sensitivity or relevance or specificity). tw. 11. (performance adj 2 (measur$ or indicat$ or assess$)). tw. 12. "Sensitivity and Specificity"/ 13. or/10 -12 14. (error$ or mistake$ or failure$ or inaccura$ or misspell$). tw.

15. (Me. SH or (subject adj 2 heading$) or (controlled adj 2 vocabulary) or

15. (Me. SH or (subject adj 2 heading$) or (controlled adj 2 vocabulary) or redundan$ or explod$ or explos$ or spell$ or Medline). tw. 16. truncat$. tw. 17. (truncat$ adj 6 (protein$ or gene$)). mp. 18. 16 not 17 19. exp Documentation/ 20. exp Molecular Sequence Data/ 21. 19 not 20 22. or/15, 18, 21 23. EVIDENCE-BASED MEDICINE/ 24. META-ANALYSIS/ 25. Review. pt. 26. "Review Literature"/ 27. or/23 -26 28. "INFORMATION STORAGE AND RETRIEVAL"/st [Standards] 29. and/27 -28 30. and/5, 8, 13 31. and/5, 13 -14 32. and/9, 13, 22 33. or/29 -32 34. "cochrane database of systematic reviews". jn. 35. 33 not 34 36. limit 35 to yr=1980 - 2005

SCOPUS ((TITLE-ABS-KEY(quality)) AND (TITLE-ABS-KEY(precision) OR TITLE-ABSKEY(recall) OR TITLE-ABS-KEY(sensitivity) OR TITLE-ABS-KEY(specificity) OR TITLEABSKEY(relevance) OR TITLE-ABS-KEY(performance

SCOPUS ((TITLE-ABS-KEY(quality)) AND (TITLE-ABS-KEY(precision) OR TITLE-ABSKEY(recall) OR TITLE-ABS-KEY(sensitivity) OR TITLE-ABS-KEY(specificity) OR TITLEABSKEY(relevance) OR TITLE-ABS-KEY(performance W/2 measure) OR TITLE-ABSKEY (performance W/2 indicator) OR TITLE-ABS-KEY(performance W/2 assessment)) AND (((TITLE-ABS-KEY(truncat*)) AND NOT (TITLE-ABSKEY(truncat* W/6 protein) OR TITLE-ABS-KEY(truncat* W/6 gene))) OR (TITLEABS-KEY(mesh) OR TITLE-ABSKEY( subject W/2 heading) OR TITLE-ABSKEY(controlled W/2 vocabulary) OR TITLEABS- KEY(redundancies) OR TITLE-ABSKEY(redundant) OR TITLE-ABSKEY(explode) OR TITLE-ABS-KEY(explosion) OR TITLE-ABS-KEY(spelling) OR TITLEABSKEY( medline)))) OR ((TITLE-ABSKEY(search*)) AND (TITLE-ABS-KEY(precision) OR TITLE-ABS-KEY(recall) OR TITLE-ABS-KEY(sensitivity) OR TITLE-ABSKEY (specificity) OR TITLE-ABSKEY(relevance) OR TITLE-ABS-KEY(performance W/2 measure) OR TITLE-ABSKEY(performance W/2 indicator) OR TITLE-ABSKEY( performance W/2 assessment)) AND (TITLE-ABS-KEY(error) OR TITLE-ABSKEY( mistake) OR TITLE-ABSKEY(failure) OR TITLE-ABS-KEY(inaccurate) OR TITLEABSKEY(misspelling) OR TITLE-ABS-KEY(misspelled))) OR ((TITLE-ABSKEY( search*)) AND (TITLE-ABSKEY(quality)) AND (TITLE-ABS-KEY(precision) OR TITLE-ABSKEY(recall) OR TITLE-ABS-KEY(sensitivity) OR TITLE-ABSKEY( specificity) OR TITLEABSKEY(relevance) OR TITLE-ABS-KEY(performance W/2 measure) OR TITLEABSKEY(performance W/2 indicator) OR TITLE-ABSKEY( performance W/2 assessment))) AND PUBYEAR AFT 1979 AND (EXCLUDE(EXACTSRCTITLE, "Cochrane database of systematic reviews (Online : Update Software)"))

Evidence Based Assessment Form for the Peer Review of Electronic Search Strategies (PRESS EBC)

Evidence Based Assessment Form for the Peer Review of Electronic Search Strategies (PRESS EBC) PRESS EBC Assessment Form 1. Translation of the research question: �� Adequate with recommendations �� Needs revision Provide an explanation or example _______________________________________________ 2. Boolean and proximity operators: �� Adequate with recommendations �� Needs revision Provide an explanation or example _______________________________________________ 3. Subject headings: �� Adequate with recommendations �� Needs revision Provide an explanation or example _______________________________________________

4. Natural language / free-text: �� Adequate with recommendations �� Needs revision Provide an

4. Natural language / free-text: �� Adequate with recommendations �� Needs revision Provide an explanation or example _______________________________________________ 5. Spelling, syntax and line numbers: �� Adequate with recommendations �� Needs revision Provide an explanation or example _______________________________________________ 6. Limits and filters: �� Adequate with recommendations �� Needs revision Provide an explanation or example _______________________________________________ 7. Search strategy adaptations: �� Adequate with recommendations �� Needs revision Provide an explanation or example _______________________________________________ © Sampson M, Mc. Gowan J, Lefebvre C