Materi Pengayaan: Information Retrieval PENGANTAR SEARCH ENGINE
SEARCH ENGINE RANKINGS
GOOGLE TAHUN 1998
GOOGLE TAHUN 1999
GOOGLE TAHUN 2000
GOOGLE TAHUN 2003
GOOGLE TAHUN 2005
YAHOO! TAHUN 1996
YAHOO! TAHUN 1997
YAHOO! TAHUN 2000
YAHOO! TAHUN 2001
YAHOO! TAHUN 2003
JENIS SEARCH ENGINE � Berbasis Crawl � Berbasis Directory � Berbasis Computational
COMPUTATIONAL SEARCH ENGINE
COMPUTATIONAL SEARCH ENGINE
TUJUAN SEARCH ENGINE � Mengorganisir informasi dari seluruh dunia (Internet) dan membuatnya menjadi mudah untuk diakses serta memiliki daya guna.
YANG DIBUTUHKAN USER � Komprehensif, � Cepat � Relevan Sederhana, Powerfull
WORKFLOW SEARCH ENGINE
WORKFLOW SEARCH ENGINE
WORKFLOW SEARCH ENGINE
CRAWLING � Seringkali crawler search engine tidak menyelesaikan menu pulldown.
CRAWLING � Contoh menu yang mudah pengaksesannya:
CRAWLING: KONTEN TANPA COOKIES � Kebanyakan search engine tidak menerima cookies. � Persiapkan halaman tanpa-cookies untuk menampilkan informasi sederhana pada website.
CRAWLING: MENU DENGAN FLASH � Menu dengan flash terlihat wah dan keren. � Walaupun terlihat sederhana seperti menu biasa, namun kebanyakan crawl gagal melaksanakan tugasnya.
GUNAKAN META TAG � Meta data adalah informasi mengenai data � Dalam html biasanya terletak pada <head> <meta name=“keywords” content=“. . . ” /> <meta name=“description” content=“. . . ” /> � Kebanyakan search engine masih menggunakan meta data sebagai info yang ditampilkan pada hasil search.
CRAW-ABLE ARCHITECTURE � Mulai dengan konten � Struktur situs/link/navigasi dibuat dalam (x)html � Link sebaiknya se-deskriptif mungkin � Buat layer tampilan dengan CSS � Buat layer interaktif dengan DOM Scripting (Javascript)
WEB CRAWLER
WEB CRAWLER ARCHITECTURES
ALGORITMA WEB CRAWLER � Breadth-First, � Best-First, � Page. Rank, � Shark-Search, � Info. Spiders. dan
ALGORITMA WEB CRAWLER Proses Breadth-First (a) dan Best-First (b)