Analisis asosiasi assosiation Analysis 1 ANALISIS ASOSIASI o

  • Slides: 32
Download presentation
Analisis asosiasi (assosiation Analysis ) 1

Analisis asosiasi (assosiation Analysis ) 1

ANALISIS ASOSIASI o o Analisis asosiasi atau association rule mining adalah teknik data mining

ANALISIS ASOSIASI o o Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Contoh dari aturan assosiatif adalah analisa pembelian di suatu pasar swalayan yaitu dapat diketahuinya berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu. Karena analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, analisis asosiasi juga sering disebut dengan istilah market basket analysis 2

o Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter: n support (nilai

o Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter: n support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database n confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif 3

BENTUK ATURAN ASOSIASI o {roti, mentega} -> {susu} (support = 40%, confidence = 50%)

BENTUK ATURAN ASOSIASI o {roti, mentega} -> {susu} (support = 40%, confidence = 50%) o Yang artinya : n "50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat ketiga item itu. ” n "Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini. " 4

DEFINISI ANALISIS ASOSIASI o suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat

DEFINISI ANALISIS ASOSIASI o suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence). 5

METODOLOGI DASAR ANALISIS ASOSIASI o Analisa pola frekuensi tinggi Tahap ini mencari kombinasi item

METODOLOGI DASAR ANALISIS ASOSIASI o Analisa pola frekuensi tinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database o Pembentukan aturan assosiatif dicari aturan assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A B 6

SUPPORT 7

SUPPORT 7

Contoh Aturan Asosiasi o Algoritma Apriori 8

Contoh Aturan Asosiasi o Algoritma Apriori 8

CONTOH TRANSAKSI 9

CONTOH TRANSAKSI 9

FORMAT TRANSAKSI DALAM DATABASE TRANSAKSIONAL 10

FORMAT TRANSAKSI DALAM DATABASE TRANSAKSIONAL 10

FORMAT TABULAR TRANSAKSI 11

FORMAT TABULAR TRANSAKSI 11

o o o Misalkan D adalah himpunan transaksi, dimana masing transaksi T dalam D

o o o Misalkan D adalah himpunan transaksi, dimana masing transaksi T dalam D merepresentasikan himpunan item yang berada dalam I. Misalkan kita memiliki himpunan items A (misal Beans dan squash) dan himpunan item lain B (misal asparagus). Kemudian aturan asosiasi akan berbentuk Jika A, maka B ( A B) o Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B merupakan mutually exclusive. o Definisi ini tidak berlaku untuk aturan trivial seperti : Jika beans dan Squash Maka beans 12

o Aturan yang akan diambil adalah aturan yang memiliki support dan/atau confidence yang tinggi.

o Aturan yang akan diambil adalah aturan yang memiliki support dan/atau confidence yang tinggi. o Aturan yang kuat adalah aturan yang melebihi kriteria support dan/atau confidence minimum. o Misalnya seorang analist menginginkan aturan yang memiliki support lebih dari 20 % dan confidence lebih dari 35 %. 13

o Sebuah itemset adalah himpunan item-item yang ada dalam I o k-itemset adalah itemset

o Sebuah itemset adalah himpunan item-item yang ada dalam I o k-itemset adalah itemset yang berisi k item. Misalnya: n {squash, beans) : 2 -itemset n {broccoli, green peppers, corn) : 3 -itemset. o Frequent Itemset menunjukkan itemset yang memiliki frekuensi kemunculan lebih dari nilai minimum yang telah ditentukan (ф). Misalkan ф = 4, maka semua itemset yang frekuensi kemunculannya lebih dari 4 kali disebut frequent. Himpunan dari frequent kitemset dilambangkan dengan Fk. 14

CALON 2 -ITEMSET 15

CALON 2 -ITEMSET 15

o jika ditetapkan nilai ф = 4 maka F 2 = { {asparagus, beans},

o jika ditetapkan nilai ф = 4 maka F 2 = { {asparagus, beans}, {asparagus, squash}, {beans, corn}, {beans, squash}, {beans, tomatoes}, {broccoli, green peppers}, {corn, tomatoes} } o Kombinasi dari itemset dalam F 2 dapat kita gabungkan menjadi calon 3 -itemset. o Itemset-itemset dari F 2 yang dapat digabungkan adalah itemset-itemset yang memiliki kesamaan dalam k-1 item pertama 16

CALON 3 -ITEMSET o Dengan demikian F 3 = {{asparagus, beans, squash}}, karena hanya

CALON 3 -ITEMSET o Dengan demikian F 3 = {{asparagus, beans, squash}}, karena hanya kombinasi inilah yang memiliki frekeunsi kemunculan >= ф 17

CONFIDENCE ATURAN A B 18

CONFIDENCE ATURAN A B 18

CALON ATURAN ASOSIASI DARI F 3 o Misalkan ditetapkan nilai confidence minimal adalah 80%

CALON ATURAN ASOSIASI DARI F 3 o Misalkan ditetapkan nilai confidence minimal adalah 80% maka aturan yang bisa terbentuk adalah aturan dengan 2 antecedent berikut: 19

CALON ATURAN ASOSIASI DARI F 2 20

CALON ATURAN ASOSIASI DARI F 2 20

ATURAN FINAL 21

ATURAN FINAL 21

RANCANGAN DATABASE (NORTHWIND) 22

RANCANGAN DATABASE (NORTHWIND) 22

23

23

24

24

RANCANGAN FORM 25

RANCANGAN FORM 25

HASIL 26

HASIL 26

ATURAN ASOSIASI YANG TERBENTUK n n n JIKA membeli 21 MAKA akan membeli 61

ATURAN ASOSIASI YANG TERBENTUK n n n JIKA membeli 21 MAKA akan membeli 61 dengan SUPPORT 0. 96 % dan CONFIDENCE 20. 51 % JIKA membeli 61 MAKA akan membeli 21 dengan SUPPORT 0. 96 % dan CONFIDENCE 33. 33 % JIKA membeli 16 MAKA akan membeli 31 dengan SUPPORT 0. 84 % dan CONFIDENCE 16. 28 % JIKA membeli 31 MAKA akan membeli 16 dengan SUPPORT 0. 84 % dan CONFIDENCE 13. 73 % JIKA membeli 16 MAKA akan membeli 60 dengan SUPPORT 0. 72 % dan CONFIDENCE 13. 95 % 27

n n n JIKA membeli 60 MAKA akan membeli 16 dengan SUPPORT 0. 72

n n n JIKA membeli 60 MAKA akan membeli 16 dengan SUPPORT 0. 72 % dan CONFIDENCE 11. 76 % JIKA membeli 16 MAKA akan membeli 62 dengan SUPPORT 0. 72 % dan CONFIDENCE 13. 95 % JIKA membeli 62 MAKA akan membeli 16 dengan SUPPORT 0. 72 % dan CONFIDENCE 12. 50 % JIKA membeli 30 MAKA akan membeli 54 dengan SUPPORT 0. 72 % dan CONFIDENCE 18. 75 % JIKA membeli 54 MAKA akan membeli 30 dengan SUPPORT 0. 72 % dan CONFIDENCE 16. 67 % 28

n n JIKA membeli 31 MAKA akan membeli 72 dengan SUPPORT 0. 72 %

n n JIKA membeli 31 MAKA akan membeli 72 dengan SUPPORT 0. 72 % dan CONFIDENCE 11. 76 % JIKA membeli 72 MAKA akan membeli 31 dengan SUPPORT 0. 72 % dan CONFIDENCE 15. 79 % JIKA membeli 60 MAKA akan membeli 71 dengan SUPPORT 0. 72 % dan CONFIDENCE 11. 76 % JIKA membeli 71 MAKA akan membeli 60 dengan SUPPORT 0. 72 % dan CONFIDENCE 14. 29 % 29

LANGKAH-LANGKAH o o Mengambil Product. Id dan frekunesi transaksi terhadap produk tersebut dari tabel

LANGKAH-LANGKAH o o Mengambil Product. Id dan frekunesi transaksi terhadap produk tersebut dari tabel Order Details yang memenuhi minimum transaksi dan dimasukkan ke dalam tabel C 1. Minimum transaksi ditentukan oleh user pada form aplikasi, dan dalam hal ini diambil nilai minimum transaksi sebesar 5. Membuat kombinasi item-item pada tabel C 1 dan dimasukkan ke dalam tabel C 2 menjadi calon 2 itemset. Pada langkah ini dilakukan pula penghitungan frekuensi transaksi yang mengandung kombinasi item-item tersebut. Kombinasi item yang memiliki frekuensi transaksi kurang dari nilai minimum_transaksi dihapus dari tabel C 2. 30

o o Membuat kombinasi item-item pada tabel C 2 dan dimasukkan ke tabel C

o o Membuat kombinasi item-item pada tabel C 2 dan dimasukkan ke tabel C 3 menjadi calon 3 -itemset. Seperti pada langkah 2, dilakukan penghitungan frekuensi transaksi yang mengandung kombinasi item dari calon k-itemset, dan kombinasi yang tidak memenuhi nilai minimum transaksi dihapus dari tabel C 3. Isi dari tabel C 3 kosong, yang artinya tidak ada kombinasi item yang memuhi syarat minimum transaksi. Dari tabel C 2 dibentuk aturan asosiasi yang berbentuk jika nilai[item 1] maka nilai[item 2] dan sebaliknya jika nilai[item 2] maka nilai[item 1] 31

o dari masing-masing bentuk aturan asosiasi pada seluruh record yang ada di tabel C

o dari masing-masing bentuk aturan asosiasi pada seluruh record yang ada di tabel C 2 di lakukang perhitungan nilai confidence. Bagi aturan yang memenuhi syarat minimum confidence akan ditampilkan, sedangkan yang tidak memenuhi tidak ditampilkan. Dalam hal ini, minimum confidence ditentukan sebesar 10% 32