VEBOMETRIJA Mihailo kori Netometrija Vebometrija Internetometrija Sajbermetrija Bibliometrija
VEBOMETRIJA Mihailo Škorić
– – – Netometrija Vebometrija Internetometrija Sajbermetrija Bibliometrija veba U naučnoj zajednici uglavnom priznati kao sinonimi za isto polje istraživanja. Međutim u nekim preciznijim podelama vebometrija je zapravo podskup sajbermetrije.
Uvod 1. 0 • Šta je to vebometrija? Vebometrija je kvantitativna studija fenomena povezanih sa vebom. Kvantitativna studija toga kako su različite vrste informacija generisane, organizovane, distribuisane i korišćene od strane različitih korisnika i u različitim kontekstima.
Veb je od samih početaka bio korišćen za formalnu i neformalnu akademsku komunikaciju i saradnju i stoga je značaj kvantitativnog merenja ovog resursa brzo prepoznat. I na vebu se prepoznaju obrazci slični Bredfordovom zakonu. Prema istraživanju Rusoa iz 1997. godine. Obrazci se primećuju na distribuciji najviših internet domena (top level domain) na neku zadatu temu. Međutim glavni napredak u razvoju citatne analize na vebu je bio kada je utvrđena sličnost između citatnih mreža i hipertekstualnih struktura u dokumentu sredinom devedesetih.
Nastala je iz shvtanja da se metode, koje su originalno korišćene za bibliometričku analizu citatnih obrazaca članaka u časopisima, mogu primeniti na sadržaj na vebu. (Sve to pod pretpostavkom da komercijalne mašine za pretraživanje mogu za te obrasce da obezbede sirove podatke. ) Da li vebometrija treba da obuhvata istraživanja iz naučnih polja van informacionih nauka, kao što su studije komunikacija, statistička fizika i računarstvo?
KOMPARACIJA I ODNOS 1. 1 Vebometrija i druge metrije prema Bjorneborgu
• Pre svega, vebometrija je podgrana informetrije koja izučava kvantitativne svojine svih oblika informacija. • Preseca se sa sajentometrijom, jer postoji sadržaj na vebu koji nije naučan i postoji naučni sadržaj koji nije na vebu. • Podgrana je sajbermetrije jer je WWW samo jedan vid informacija u sajber svetu. (Prema Bjornebornu i Ingverstenu). Gde npr. ne spada internet komunikacija. • Vebometrija se na dijagramu prikazuje kao podgrana i bibliometrije jer kako kaže Bjorneborn Celokupan sadržaj na www čine informacije zapisane na različitim veb serverima. Gde bi sve ono što tu ne spada pripalo sajbermetriji.
KONCEPTUALNA OKOSNICA 1. 2 Koja su glavna polja istraživanja vebometrije? 1. Analiza sadržaja veb stranica 2. Analiza struktura linkova na tim veb stranicama 3. Analiza korišćenosti veba od strane korisnika 4. Analiza same veb tehnologije
Koja su glavni problemi vebometrije? U početku su to bili nedostaci naučne osnove. Nije problem u tome da hipertekst nema strukturu, već u tome što mi nemamo reči da je opišemo. Bernstejn, 1998 Međutim sada je ova oblast razvijenija.
Osnovni koncepti i metode vebometrije 2. 0 Jedinice analize čvorovi/nodovi: 1. Top level domen 2. Veb sajt 3. Direktorijum 4. Veb stranica veb sadržaja ili veb
TERMINOLIGA LINKOVA 2. 1 Dolazni/unutrašnji/sitat – link koji je primljen od strane veb čvora. Odlazni link – šalje van sajta ili na neki drugi sajt. Ali terminologija je komplikovanija od toga? Jedan link može istovremeno biti odlazni – zavisno od perspektive. i dolazni i
1. B ima dolazni link od A (inlink). 2. B ima odlazni link do C (outlink). 3. Bima refleksivni link ka samom sebi (selflink). 4. E i F su recipročno linkovani. 5. A ima transverzalni link ka G koji koristi kao prečica. Povezuje nepovezano. 6. H je povezano sa A direknim putem (linkpath). 7. I nema ni dolazne ni odlazne linkove. I je izolovano. 8. B i E ko-linkuju ka D (co-outlink). 9. C i D su ko-linkovani od strane B (co-inlink)
Pojednačavanje terminologije linkova i bibliometrije: Odlazni link = referenca Dolazni link = citat Refleksivni link = samocitiranje Ko-link(inlink) = ko-citiranje Ko-link(outlink) = bibliografsko uparivanje
JEDINICE ANALIZE 2. 2 Šta sve uopšte spada u web? Ne-html automatski generisane stranice? Stranice zaštićene lozinkom? Duboki veb? Da li treba vebom da se smatra sve čemu može da se pristupi internet pretraživačem ili samo stranice koje su indeksirane i dostupne?
Najčešća jedinica brojanja objekata na vebu je veb sajt. Brojanje veb stranica nailazi na problem frameset-ova. (Ono što izgleda kao jedna, može zapravo biti više stranica. )
Šta su ADM? –> Alternativni modeli dokumenata. Služe za preciznije određivanje jedinica. 1. Stranica - Sve stranice u jednom direktorijumu (url) se broje kao jedna jedinica. 2. Domen – Sadrži sve stranice koje se nalaze na jednom domenu. 3. Sajt - Dozvoljava i nekoliko vezanih domena. Sadrži sve podjedinice. 4. SEAT – Žanrovska aralela sajtu. Kolekcija veb stranica kreiranih od strane jedne osobe ili u jednu određenu svrhu. (Seat može da bude ekvivalntan sajtu, direktorijumu ili čak domenu).
• Kako se te jedinice koriste? Mogu se prebrojavati poddomeni nekog domena; broj stranica, direktorijuma ili sajtova koji sadrže link (referencu) ka nekom drugom sajtu. Koriste se da se reference stave u određene okvire kako bi se lakše manipulisalo njihovim prebrojavanjem i stanjem.
Predložene su i dve metode korišćenja: Upoređivanje korelacija raznih statistika koje koriste različite ADM-ove, vezanih za prikupljene podatke, kako bi se došlo do zaključka. Teorijski pristup koristeći pretpostavke u vezi procesa koji uzrokuju kreiranje dokumenata i uvođenje testova koji bi upoređivali u kojoj meri se te pretpostavke slažu sa prikupljenim podacima. U svakom slučaju neophodno je prikupljanje podataka.
METODE PRIKUPLJANJA PODATAKA 2. 3 Personalni veb paukovi/veb indekseri/web crowlers Komercijalne mašine za pretraživanje Veb logovi
Veb paukovi – sakupljaju linkove sa predodređene veb stranice ili skupa stranica. Oni takođe prate linkove koje indeksiraju i prate ih dalje. Ali linkovi moraju da dođu u obliku u kojem ih on razume. Određeni broj nedostataka mogao da se reši tako što paukovi ne bi išli po mreži već po serverima, ali za to su potrebne posebne dozvole. Neke druge nedostatke nadoknađuju komercijalni pretraživači.
Komercijalne mašine za pretraživanje veba – Imaju svoje probleme. Iz razloga što su komercijalni njihovi algoritmi za pretraživanje su tajni, pa ih istraživači teže koriste. Ne pokrivaju čitav veb. Jedan metod je korišćenje više mašina i uzimanje proseka za rezultat. Takođe, stranice koje su više puta indeksirane dobijaju veću težinu.
Veb logovi – Kreiraju se na serveru za svaki događaj ili interakciju. Obrađuju se od strane softvera za analizu veb logova. Oni mogu da odgovore na pitanja kada, kako i ko koristi određeni veb server i njegovu sadržinu. Veliki problem što je veb logovima u velikoj meri zabranjen pristup.
Kako nije moguće analizirati svaku veb stranicu i svaki link za istraživanje se koriste uzorci, kao u statistici. Primer: za neku usko specifičnu oblast, moguće je da se na određenom broju najpopularnijih strana mogu naći svi relevantni podaci. Slično alociranosti narelevantnijih članaka u nekolicini časopisa u bibliometriji.
Faktori i mere 3. 0 • Veličina • Vidljivost • Veb impakt faktor (WIF) • Google scholar?
Veličina – Najjednostavnija mera. Broj stranica na nekom veb sajtu ili domenu. Paralela broju objavljenih radova nekog naučnika u tradicionalnoj bibliometriji. Alternativa samoj veličini sajta je brojanje bogatih datoteka (rich files). A mogu se uzeti i obe u obzir. Ova mera se koristi pod pretopstavkom da nemaju sve datoteke istu težinu. Daje veću težinu pdf, ps, doc i ppt datotekama.
Vidljivost – Broj dolaznih linkova određenog veb sajta. ka nekoj Paralela citiranosti radova tradicionalnoj bibliometriji. od nekog veb stranica naučnika u Normalizuje se uzimanjem kvadratnog korena ukuponog broja linkova i množenjem sa brojem različitih domena sa kojih ti linkovi dolaze radi ravnopravnosti. Sqrt(L)*n
Veb impakt faktor je očiglenda paralela faktoru u tradicionalnoj bibliometriji. impakt Jedna je od najosnovnijih mera i računa se kao količnik broja linkova ka nekom veb sajtu i broja njegovih stranica. (Vidljivost/Veličina) WIF=L/W Na primer ukoliko nek veb sajt ima 100 stranica i 100 linkova ka nekoj od tih stranica, njegob WIF je 1. On se, kao i impakt faktor, može normalizovati.
Scholar mera? – Dodeljuje je Google scholar. Koristi se pri vebometrijskom rangiranju univerziteta unutar google scholar mreže. Odnosi se na broj članaka i citata za svaki akademski domain.
PROBLEMATIKA 3. 1 U čemu je razlika između scholara i WIF-a? Premda se odlazni linkovi računaju kao reference, nisu ista stvar. Link ka nečemu ne mora da bude referenca i ne mora da bude pokazatelj impakta. Tu stupaju studije o motivaciji za kreiranje linkova (na akademskim domenima). One pokušavaju da odgovore na pitanje zašto je neki link kreiran i da li može važiti za validnu referencu. Na primer: linkovi ka sajtovima univerziteta. lokalnim restoranima na
Zaključak 4. 0 • Velika količina podataka je potrebna za preciznu analizu. • Kvantitativna izračunavanja u vebometriji zahtevaju komplementarna kvalitativna izučavanja. • Impakt institucije na vebu se može popraviti sa boljim shvatanjem veba.
Univerzitet u Beogradu. 184. u Evropi, 431. u svetu prema istraživanju sa www. webometrics. info. 50. 00% impakt, 16. 67% prisutnost, 16. 67% otvorenost i 16. 67% odličnost. Impact rank - sqrt(L)*n, gde je n broj domena. Presence rank – W, broj veb stranica prema Google. Openness rank – broj objavljenih Bogatih datoteka prema Google Scholaru. Exellence rank – broj članaka u znamenitim časopisima.
Reference • Nicola Bellis. 2009. Bibliometrics and citation analysis from the Science citation index to cybermetrics, Lanham, Md. : Scarecrow Press. • Lennart Björneborn. 2004. Small-world link structures across an academic web space: a library and information science approach, Copenhagen: Department of Information Studies, Royal School of Library and Information Science. • Mike Thewall, Liwen Vaughan, and Lennart Bjorneborn. Webometrics. In Annual Review of Information Science and Technology. 81– 135.
- Slides: 32