BAB 3 TEKNIKTEKNIK DATA MINING By Sari Ningsih
BAB 3. TEKNIK-TEKNIK DATA MINING By. Sari Ningsih, S. Si. , MM 1 by. Sari Ningsih. , S. Si. , MM 31/08/2010
KLASIFIKASI Adalah : Proses untuk menemukan model atau fungsi yang menjelaskan / membedakan konsep atau kelas data. Tujuan: Untuk memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. 2 by. Sari Ningsih. , S. Si. , MM 31/08/2010
KLASIFIKASI Model tersebut bisa berupa aturan : 1. 2. 3. 3 IF- THEN pada Decision Tree Formula matematis Neural Network. by. Sari Ningsih. , S. Si. , MM 31/08/2010
DECISION TREE v. Decision Tree adalah satu metode 4 klasifikasi yang paling populer karena mudah untuk diinterpretasikan manusia. Contoh: Decision tree untuk identifikasi pembeli komputer. Salah satu kelompok yang potensial: - usia< 30 tahun. by. Sari Ningsih. , S. Si. , MM 31/08/2010 -pelajar,
DECISION TREE Metode-metode klasifikasi lainnya: 1. Bayesian 2. Neural Network 3. Genetic Algoritm 4. Fuzzy, dll. 5 by. Sari Ningsih. , S. Si. , MM 31/08/2010
Proses Klasifikasi Biasanya dibagi menjadi 2 Fase: 1. Learning Sebagian data yang telah diketahui kelas datanya diumpan untuk membentuk model perkiraan. 2. Test. Model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tersebut. Misal dengan : test entropi 6 by. Sari Ningsih. , S. Si. , MM 31/08/2010
PROSES KLASIFIKASI Bila akurasinya mencukupi, model tersebut dapat dipakai untuk prediksi kelas data. 7 by. Sari Ningsih. , S. Si. , MM 31/08/2010
ASSOCIATION RULE MINING Adalah: Teknik data mining untuk menentukan aturan assosiatif antara suatu kombinasi item. Contoh: Analisa Pembelian di pasar swalayan. Untuk mengetahui berapa besar kemungkinan seorang pelanggan membeli : roti & susu; susu bayi & diapers. , dll. 8 by. Sari Ningsih. , S. Si. , MM 31/08/2010
ASSOCIATION RULE MINING Dengan teknik tersebut: ØPengetahuan baru untuk mengatur penempatan barang. ØMerancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang. ØDsb. 9 by. Sari Ningsih. , S. Si. , MM 31/08/2010
ASSOCIATION Rule Mining Parameter yang digunakan : SUPPORT Yaitu: Persentase kombinasi item tersebut dalam database. CONFIDENCE Yaitu: Kuatnya hubungan antar item dalam aturan assosiatif. 10 by. Sari Ningsih. , S. Si. , MM 31/08/2010
ASSOCIATION RULE MINING Algoritma yang paling populer : ‘APRIORI’ dengan paradigma generate and test”. 11 by. Sari Ningsih. , S. Si. , MM 31/08/2010
CLUSTERING Adalah: Melakukan Pengelompokan data tanpa berdasarkan kelas data tertentu. Prinsipnya: - Memaximalkan kesamaan antar anggota 1 klas dan meminimalkan kesamaan antar kelas / cluster. 12 by. Sari Ningsih. , S. Si. , MM 31/08/2010
Beberapa kategori algoritma clustering Metode Partisi, dimana pemakai harus menentukan jumlah k partisi yang diinginkan , lalu data dites untuk dimasukkan pada salah satu partisi. Metode Hierarki: Bottom up dan Top Down. 13 by. Sari Ningsih. , S. Si. , MM 31/08/2010
- Slides: 13