Materi Pengayaan Information Retrieval PENGANTAR SEARCH ENGINE SEARCH

  • Slides: 34
Download presentation
Materi Pengayaan: Information Retrieval PENGANTAR SEARCH ENGINE

Materi Pengayaan: Information Retrieval PENGANTAR SEARCH ENGINE

SEARCH ENGINE RANKINGS

SEARCH ENGINE RANKINGS

GOOGLE TAHUN 1998

GOOGLE TAHUN 1998

GOOGLE TAHUN 1999

GOOGLE TAHUN 1999

GOOGLE TAHUN 2000

GOOGLE TAHUN 2000

GOOGLE TAHUN 2003

GOOGLE TAHUN 2003

GOOGLE TAHUN 2005

GOOGLE TAHUN 2005

YAHOO! TAHUN 1996

YAHOO! TAHUN 1996

YAHOO! TAHUN 1997

YAHOO! TAHUN 1997

YAHOO! TAHUN 2000

YAHOO! TAHUN 2000

YAHOO! TAHUN 2001

YAHOO! TAHUN 2001

YAHOO! TAHUN 2003

YAHOO! TAHUN 2003

JENIS SEARCH ENGINE � Berbasis Crawl � Berbasis Directory � Berbasis Computational

JENIS SEARCH ENGINE � Berbasis Crawl � Berbasis Directory � Berbasis Computational

COMPUTATIONAL SEARCH ENGINE

COMPUTATIONAL SEARCH ENGINE

COMPUTATIONAL SEARCH ENGINE

COMPUTATIONAL SEARCH ENGINE

TUJUAN SEARCH ENGINE � Mengorganisir informasi dari seluruh dunia (Internet) dan membuatnya menjadi mudah

TUJUAN SEARCH ENGINE � Mengorganisir informasi dari seluruh dunia (Internet) dan membuatnya menjadi mudah untuk diakses serta memiliki daya guna.

YANG DIBUTUHKAN USER � Komprehensif, � Cepat � Relevan Sederhana, Powerfull

YANG DIBUTUHKAN USER � Komprehensif, � Cepat � Relevan Sederhana, Powerfull

WORKFLOW SEARCH ENGINE

WORKFLOW SEARCH ENGINE

WORKFLOW SEARCH ENGINE

WORKFLOW SEARCH ENGINE

WORKFLOW SEARCH ENGINE

WORKFLOW SEARCH ENGINE

CRAWLING � Seringkali crawler search engine tidak menyelesaikan menu pulldown.

CRAWLING � Seringkali crawler search engine tidak menyelesaikan menu pulldown.

CRAWLING � Contoh menu yang mudah pengaksesannya:

CRAWLING � Contoh menu yang mudah pengaksesannya:

CRAWLING: KONTEN TANPA COOKIES � Kebanyakan search engine tidak menerima cookies. � Persiapkan halaman

CRAWLING: KONTEN TANPA COOKIES � Kebanyakan search engine tidak menerima cookies. � Persiapkan halaman tanpa-cookies untuk menampilkan informasi sederhana pada website.

CRAWLING: MENU DENGAN FLASH � Menu dengan flash terlihat wah dan keren. � Walaupun

CRAWLING: MENU DENGAN FLASH � Menu dengan flash terlihat wah dan keren. � Walaupun terlihat sederhana seperti menu biasa, namun kebanyakan crawl gagal melaksanakan tugasnya.

GUNAKAN META TAG � Meta data adalah informasi mengenai data � Dalam html biasanya

GUNAKAN META TAG � Meta data adalah informasi mengenai data � Dalam html biasanya terletak pada <head> <meta name=“keywords” content=“. . . ” /> <meta name=“description” content=“. . . ” /> � Kebanyakan search engine masih menggunakan meta data sebagai info yang ditampilkan pada hasil search.

CRAW-ABLE ARCHITECTURE � Mulai dengan konten � Struktur situs/link/navigasi dibuat dalam (x)html � Link

CRAW-ABLE ARCHITECTURE � Mulai dengan konten � Struktur situs/link/navigasi dibuat dalam (x)html � Link sebaiknya se-deskriptif mungkin � Buat layer tampilan dengan CSS � Buat layer interaktif dengan DOM Scripting (Javascript)

WEB CRAWLER

WEB CRAWLER

WEB CRAWLER ARCHITECTURES

WEB CRAWLER ARCHITECTURES

ALGORITMA WEB CRAWLER � Breadth-First, � Best-First, � Page. Rank, � Shark-Search, � Info.

ALGORITMA WEB CRAWLER � Breadth-First, � Best-First, � Page. Rank, � Shark-Search, � Info. Spiders. dan

ALGORITMA WEB CRAWLER Proses Breadth-First (a) dan Best-First (b)

ALGORITMA WEB CRAWLER Proses Breadth-First (a) dan Best-First (b)

ALGORITMA CRAWLING (©Rada Mihalcea 2006)

ALGORITMA CRAWLING (©Rada Mihalcea 2006)

WEB CRAWLER AND INDEXING

WEB CRAWLER AND INDEXING

SEARCH ENGINE ARCHITECTURE

SEARCH ENGINE ARCHITECTURE

SEARCH ENGINE INFRASTRUCTURE

SEARCH ENGINE INFRASTRUCTURE