ZSKANIE INFORMCI O OBJEKTE NA INTERNETE Vyhadvanie informci
ZÍSKANIE INFORMÁCIÍ O OBJEKTE NA INTERNETE Vyhľadávanie informácií 2011/2012 Michal Palček
ČO? PREČO? NAČO? Vyhľadanie webových stránok a liniek nelegálne šíriace produkt ESET NOD 32 Antivirus ESET Smart Security Nové inovatívne riešenia pre zamestnávateľa Vlastná iniciatíva
ČO PODOBNÉ EXISTUJE? Vyhľadávanie na torrent sieti Pre zábavu Pre profit Ukázanie majiteľom obsahov ako sa šíri ich obsah internetom. Umožniť im efektívne zakročiť proti nelegálnemu šíreniu legálnymi zbraňami
POSTUP PRÁCE 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. JAVA JSON Google Search API Crawler Kľúčové slová Extrakcia liniek Extrakcia meta liniek Extrakcia všetkých liniek Testovanie anchor textov Testovanie url adresy Krížové testovanie Crawlovanie
VÝSLEDOK
VÝSLEDOK II. Parametre príkazového riadka -resume -google -depth -pages -nocrawl Textové súbory Frázy pre Google, kľúčové slová, blacklist, whitelist Výsledok Illegal. txt (PAGE, LINK)
VYHODNOTENIE 20 náhodných linkov Slovenské stránky Stránky so softvérom Nelegálne šíriace stránky konkurenčné produkty Nelegálne šíriace produk Výsledok Všetky nelegálne šíriace stránky + 4 „omyly“ naviac
POĎAKOVANIE Ďakujem za pozornosť!
- Slides: 8