MULTIPLE REGRESSION ANALYSIS ANALISIS REGRESI GANDA TUJUAN MENJELASKAN

  • Slides: 20
Download presentation
MULTIPLE REGRESSION ANALYSIS (ANALISIS REGRESI GANDA) TUJUAN MENJELASKAN PRINSIP, MANFAAT ANALISIS REGRESI GANDA DAN

MULTIPLE REGRESSION ANALYSIS (ANALISIS REGRESI GANDA) TUJUAN MENJELASKAN PRINSIP, MANFAAT ANALISIS REGRESI GANDA DAN INTERPRETASI HASIL

MRA ekstensi regresi garis lurus situasi lebih dari satu independen variabel dilibatkan dalam model.

MRA ekstensi regresi garis lurus situasi lebih dari satu independen variabel dilibatkan dalam model. Beberapa hal yang harus diperhatikan: 1. Sering sulit menentukan ‘the best model’ karena ada bbrp kemungkinan model; 2. Sulit me-visualisasikan ‘the fitted model’ tidak bisa mem plot data dalam 1 grafik; 3. Sering sulit menginterpretasikan ‘arti’ ‘the best-fitting model’ dalam kehidupan; 4. Penghitungan MRA harus menggunakan komputer dengan program yg sudah diuji.

Model Regresi Ganda Data tekanan darah sistolik (TDS), Konsumsi garam sehari (KGS) dan Berat

Model Regresi Ganda Data tekanan darah sistolik (TDS), Konsumsi garam sehari (KGS) dan Berat Badan (BB) TDS dipengaruhi oleh KGS dan BB modelnya TDS = b 0+b 1 KGS+b 2 BB+E atau Y=b 0+b 1 X 1+b 2 X 2+E bentuk umum model regresi ganda dengan k-independen variabel Y=b 0+b 1 X 1+b 2 X 2+ ……… +bk. Xk+E dimana b 0, b 1, b 2, ……, bk adalah ‘koefisien regresi’ yang harus di estimasi. Independen variabel X 1, X 2, ……. , Xk merupakan variabel dasar namun dapat merupakan fungsi dari variabel dasar

Andai kita ingin mempelajari variasi berat badan (WGT) terhadap tinggi (HGT) dan umur (AGE)

Andai kita ingin mempelajari variasi berat badan (WGT) terhadap tinggi (HGT) dan umur (AGE) anak 2. Variabel dependent Y=WGT, dua independent adalah X 1=HGT dan X 2=AGE. Datanya: WGT HGT AGE 64 57 8 71 59 10 53 49 6 67 62 11 55 51 8 58 50 7 77 55 10 57 48 9 56 42 10 51 42 6 76 61 12 68 57 9 WGT lbs, HGT inch, AGE yrs

Data digunakan mempelajari hubungan antara WGT terhadap HGT dan AGE dan modelnya Y=b 0+b

Data digunakan mempelajari hubungan antara WGT terhadap HGT dan AGE dan modelnya Y=b 0+b 1 X 1+b 2 X 2+E X 1 = HGT dan X 2 = AGE dan nilai prediksi dari persamaan itu adalah X 1=HGT, X 2=AGE Nilai prediksi dari persamaan adalah Untuk mendapatkan ‘least square estimates’

Gambar 2 berikut adalah scatter diagram data

Gambar 2 berikut adalah scatter diagram data

Hubungan (+) HGT dan WGT (r 1 Y = 0. 814) dan AGE dan

Hubungan (+) HGT dan WGT (r 1 Y = 0. 814) dan AGE dan WGT (r 2 Y=0. 77) Bila kita analisa secara terpisah, kita memperoleh hubungan (+) antara WGT dan HGT, dan WGT dan AGE Pertanyaan: Apakah kedua model tsb memberikan ‘the best fitting model? ’ Bgmn kalau kedua IV (HGT dan AGE) dimasukkan dlm 1 model? Jawabannya cukup sulit utk dipastikan krn scatter diagram HGT & AGE juga ber korelasi (+) (r 12=0. 614). Hal-hal seperti ini harus diperhatikan dalam membuat model multiple regression

Asumsi Multiple regression 1. Existence, setiap kombinasi nilai independen variabel X 1, X 2,

Asumsi Multiple regression 1. Existence, setiap kombinasi nilai independen variabel X 1, X 2, ……. , Xk, nilai Y adl random dgn distribusi probabilitas dgn nilai means dan variance tertentu, 2. Independence, setiap nilai Y adl independen satu sama lainnya; 3. Linearity, nilai rata 2 Y utk setiap kombinasi spesifik X 1, X 2, ……, Xk adl fungsi linear dr X 1, X 2, …. , Xk artinya Atau

Komponen E merupakan komponen error yang merefleksikan perbedaan nilai 2 Y dengan rata 2

Komponen E merupakan komponen error yang merefleksikan perbedaan nilai 2 Y dengan rata 2 nilai 4. Homoscedasticity, nilai varians Y adl sama untuk setiap kombinasi nilai X 1, X 2, …. . Xk yaitu 5. Normality, untuk setiap kombinasi nilai 2 X 1, X 2, …. . , Xk, variabel Y terdistribusi secara normal

Menentukan ‘the best estimate’ dari ‘multiple regression analysis’ Dua pendekatan: a. ‘Least Square’ b.

Menentukan ‘the best estimate’ dari ‘multiple regression analysis’ Dua pendekatan: a. ‘Least Square’ b. ‘The minimum variance’ keduanya memberikan hasil yang sama * Pendekatan ‘Least Square’ menggunakan ‘minimizes the sum of squares’ jarak antara nilai 2 observasi dan nilai prediksi dari model regresi.

Maka nilai ‘sum of squares of deviation’ nilai Y dari nilai prediksi adalah Pemecahan

Maka nilai ‘sum of squares of deviation’ nilai Y dari nilai prediksi adalah Pemecahan ‘Least Square’ melibatkan nilai 2 dan jumlahnya minimum Minimum ‘sum of squares’ disebut ‘residual sum of squares’ atau ‘error sum of squares’ atau ‘sum of squares about regression SSE

Pendekatan ‘Minimum Variance’ mengestimasi persamaan regresi dgn menggunakan ‘minimum variance’ dari estimasi Setiap nilai

Pendekatan ‘Minimum Variance’ mengestimasi persamaan regresi dgn menggunakan ‘minimum variance’ dari estimasi Setiap nilai estimasi merupakan satu fungsi linear dari nilai 2 Y. Karena nilai 2 Y diasumsikan berdistribusi normal maka setiap nilai estimasi juga berdistribusi normal dengan Standard Deviasi (SD) yang dapat dihitung

Hal-hal yang perlu diperhatikan dalam ‘Least Squares’ 1. Setiap estimasi merupakan fungsi linear dari

Hal-hal yang perlu diperhatikan dalam ‘Least Squares’ 1. Setiap estimasi merupakan fungsi linear dari nilai 2 Y. Karena nilai 2 Y tersebut distribusinya normal maka nilai 2 distribusinya normal 2. Persamaan regresi ‘least square’ merupa kan kombinasi linear yang unik dari independen variabel X 1, X 2, …. . , Xk yg mempunyai korelasi maksimum dengan dependent variabel

Atau semua kemungkinan kombinasi linear dari bentuk b 0+b 1 X 1+b 2 X

Atau semua kemungkinan kombinasi linear dari bentuk b 0+b 1 X 1+b 2 X 2+………+bk. Xk , dan kombinasi linear dengan korelasi adalah maksimum, dimana adalah nilai prediksi dari Y utk ith individu & adl mean dr karenanya, nilai adalah benar, artinya nilai 2 prediksi adalah sama dengan nilai observasi

3. Seperti regresi garis lurus adalah terkait dengan bivariat distribusi normal, MRA juga terkait

3. Seperti regresi garis lurus adalah terkait dengan bivariat distribusi normal, MRA juga terkait dengan multiple distribusi normal. Sebagai contoh dari data yang kita punyai, kita bisa membuat ‘least square algorithme’ dengan model: WGT=b 0+b 1 HGT+b 2 AGE+b 3(AGE)2+E Yang menghasilkan estimasi Maka

Tabel ANOVA Multiple Regression Source df Regression K=3 SS MS F R 2 9.

Tabel ANOVA Multiple Regression Source df Regression K=3 SS MS F R 2 9. 47 0. 78 SSY-SSE= 231. 02 693. 06 Residual N-k-1= 8 SSE= 195. 15 Total N-1=11 SSY= 888. 25 24. 04

Dari tabel ANOVA adalah total sum of squares merupakan total variabilitas dr nilai 2

Dari tabel ANOVA adalah total sum of squares merupakan total variabilitas dr nilai 2 observasi Yi sebelum memperhitungkan efek bersama (joint effect) variabel 2 HGT, AGE dan AGE 2 adalah residual sum of squares atau sum of squares due to error merupakan jumlah nilai 2 Y yg bervariasi tanpa bisa dijelaskan setelah IV digunakan untuk memprediksi Y

adalah regression sum of squares dan mengukur variasi yang dapat diterangkan oleh independent variabel

adalah regression sum of squares dan mengukur variasi yang dapat diterangkan oleh independent variabel model regresi Dengan demikian: Total SS = Regression SS + Residual SS Nilai r 2 menjelaskan tentang kesesuaian model yang terdiri dari HGT, AGE, (AGE)2 yang memprediksi variabel WGT

Latihan TDS 135 148 162 IMT 28 37 37 Um 45 52 60 TDS

Latihan TDS 135 148 162 IMT 28 37 37 Um 45 52 60 TDS 122 146 160 IMT 32 29 36 Um 41 54 48 TDS 130 129 144 IMT 31 28 23 Um 49 47 44 180 152 134 135 137 132 161 46 41 30 32 33 30 38 64 64 50 57 53 48 63 166 138 145 142 132 120 170 39 36 34 34 32 28 41 59 56 49 56 50 43 63 138 140 142 144 149 126 152 40 35 30 37 33 29 39 51 54 46 58 54 43 62 TDS=Tekanan Darah Sistolik, IMT= Indeks Massa Tubuh, Um=Umur

Tugas: lakukan prediksi TDS dengan variabel independen IMT dan Umur Bekerja bersama di laboratorium

Tugas: lakukan prediksi TDS dengan variabel independen IMT dan Umur Bekerja bersama di laboratorium a. Hitung Sum of Square for Regression (X) b. Hitung Sum of Square for Residual c. Hitung Means Sum of Square for Regression (X) d. Hitung Means Sum of Square for Residual e. Hitung nilai F f. Hitung nilai r 2