Euclidean Distance Rumus Euclidean Distance Dimana n adalah jumlah dimensi (attributes) pk and qk adalah atribut ke-k dari objek data p dan q. 2/25/2021
Contoh (Iterasi ke-1) Jarak Instance ke centroid Pilih K=2 (jumlah cluster = 2) Pilih instance 1(1. 0, 1. 5) sbg centroid awal cluster 1 and instance 3 (2. 0, 1. 5) sbg centroid awal cluster 2 (pilih acak) Hitung jarak masing-masing titik terhadap centroid yg dipilih (menggunakan rumus jarak euclidean) Bandingkan jarak setiap instance terhadap setiap centroid cluster (C 1 dan C 2). Cari jarak paling pendek. Cluster C 1 berisi instance : 1, 2 Cluster C 1 berisi instance : 3, 4, 5, 6 Instance C 1 C 2 1 0 1 2 3 3. 16 3 1 0 4 2. 24 2 5 2. 24 1. 41 6 6. 02 5. 41 CS 4333 Data Mining - IMD 6
Contoh (Iterasi ke-2) Hitung ulang centroid masing-masing cluster Jarak Instance ke centroid C 1 : (1, 3) Instance C 1 C 2 diperoleh dari : 1 1. 5 2. 74 centroid C 2 : (3, 3. 375) 2 1. 5 2. 29 diperoleh dari : 3 1. 8 2. 125 4 1. 12 1. 01 5 2. 06 0. 875 6 5 3. 3 Hitung juga jarak masing-masing instance terhadap centroid baru Cluster 1 berisi instance : 1, 2, 3 Cluster 2 berisi instance : 4, 5, 6 CS 4333 Data Mining - IMD 7
Contoh (Iterasi ke-3) Hitung lagi centroid baru untuk setiap cluster : C 1 : (1. 33, 2. 5) C 2: (3. 33, 4) Hitung jarak masing-masing instance terhadap centroid baru. . dst Hentikan proses jika anggota setiap cluster tidak berubah jika dibandingkan iterasi sebelumnya. CS 4333 Data Mining - IMD 8
Tugas Menggunakan data contoh : Lanjutkan perhitungan proses clustering untuk k=2 dan k=3. Tugas ditulis tangan, dikumpulkan minggu depan