Analisa Regresi Garis Lurus TUJUAN Memahami pengertian dasar

  • Slides: 14
Download presentation
Analisa Regresi Garis Lurus TUJUAN Memahami pengertian dasar analisa regresi garis lurus (straight-line regression)

Analisa Regresi Garis Lurus TUJUAN Memahami pengertian dasar analisa regresi garis lurus (straight-line regression)

PENGANTAR Analisa adalah tehnik statistik digunakan untuk mengevaluasi hubungan satu atau lebih varibel independen

PENGANTAR Analisa adalah tehnik statistik digunakan untuk mengevaluasi hubungan satu atau lebih varibel independen X 1, X 2, ……, Xk dan variabel dependen kontinu Y. Berikut adalah bbrp contoh aplikasi analisa regresi: 1. Bila kita mempelajari karakteristik hubungan antara dependen dan independen variabel dilihat dari kekuatan hubungan (strength of association) 2. Bila kita ingin membuat formula kuantitatif atau persamaan yang menjelaskan dependen variabel Y adalah fungsi dari beberapa independen variabel X’s. Misalnya: pengaruh dosis obat X untuk menurunkan tekanan darah terhadap perubahan tekanan darah

3. Bila kita ingin menjelaskan secara kuantitatif hubungan antara X’s dan Y tetapi di

3. Bila kita ingin menjelaskan secara kuantitatif hubungan antara X’s dan Y tetapi di kontrol oleh variabel C’s dan kita percaya variabel ini berperan penting. Misalnya, kita mempelajari hubungan Tekanan darah (Y) dan Merokok (X 1) dan Pendapatan (X 2), dikontrol oleh Umur (C 1) dan Berat Badan (C 2) 4. Bila kita ingin menentukan variabel-variabel independen (X’s) yang paling penting pengaruhnya terhadap dependen variabel (Y) 5. Bila kita ingin menentukan ‘the best mathematical model’ untuk menguraikan hubungan antara dependen (Y) dan independen variabel (X’s) 6. Bila kita ingin mengevaluasi efek interaksi dari 2 atau lebih independen variabel dan mendapatkan ‘a valid and precise estimate regression coefficients’.

Analisa Regresi Garis Lurus • 1 dependen variabel Y dan 1 independen variabel X

Analisa Regresi Garis Lurus • 1 dependen variabel Y dan 1 independen variabel X Y = b 0 + b 1 X + e • 1 dependen variabel Y dan bbrp independen var. X’s Y = b 0 + b 1 X 1+ …………+ bk. Xk +e Tugas utama analisa regresi adalah menjelaskan temuan data dalam bentuk garis lurus atau curva atau parabola dlsb-nya yang sangat sesuai dengan data yang ada (the best fits). Pertama kali lakukan ‘scatter diagram’ dari data yang ada Lihat gambar berikut

TDS UMUR

TDS UMUR

Pertanyaan yang harus dijawab • Manakah model matematik yang terbaik, apakah kita harus menggunakan

Pertanyaan yang harus dijawab • Manakah model matematik yang terbaik, apakah kita harus menggunakan garis lurus, parabola, atau fungsi log? • ‘Given specific model’, apa yang kita maksud dan bagaimana kita menentukan ‘the best fitting model? . Atau jika model yang dipilih adalah garis lurus (straight line), bagaimana kita menemukan ‘the best fitting line’?

Langkah-langkah • Mulai dengan asumsi bahwa garis lurus adalah model terbaik • Temukan ‘the

Langkah-langkah • Mulai dengan asumsi bahwa garis lurus adalah model terbaik • Temukan ‘the best fitting straight line’ • Tentukan model garis lurus telah memenuhi asumsi statistik • Check apakah asumsi model garis lurus sudah benar dari hasil ‘testing for lack of fit’ • Bila asumsi model garis lurus tidak sesuai, lakukan transformasi data (misal parabola, fungsi log, dlsb)

Mathematical Properties of Straight Line • Secara matematik, persamaan suatu garis lurus adalah y

Mathematical Properties of Straight Line • Secara matematik, persamaan suatu garis lurus adalah y = b 0 + b 1 x • Simbol b 0 dan b 1 adalah bilangan konstan untuk suatu garis lurus; b 0 disebut intercept dan b 1 disebut slope Nilai intercept b 0 adalah nilai y bila x = 0 • Misal: y = 3 + 5 x maka intercept = 3 dan slope = 5 Bila x =1 maka y = 3 +5 (1) = 8; bila x = 3 maka y = 3 + 5 (3) = 18 • Pelajari bila b 1 adalah negatif (-)

Asumsi untuk suatu model garis lurus • Eksistensi, untuk setiap nilai fixed dari variabel

Asumsi untuk suatu model garis lurus • Eksistensi, untuk setiap nilai fixed dari variabel X, Y adalah random variabel dengan probabilitas distribusi yang mempunyai nilai rata-rata dan varians tertentu. Notasi mylx dan s 2 ylx untuk populasi. Notasi ‘Yl. X’ adalah rata-rata dan varians dari random variabel Y tergantung dengan nilai X • Nilai-nilai Y adalah independen satu sama lain, artinya suatu nilai Y tidak dipengaruhi oleh nilai Y lain (perhatikan gambar-gambar berikut)

3. Linearity : nilai rata-rata Y, mylx , adalah fungsi garis lurus X, dengan

3. Linearity : nilai rata-rata Y, mylx , adalah fungsi garis lurus X, dengan demikian mylx = b 0 + b 1 x

Persamaan garis lurus itu dapat ditulis Y= b 0 + b 1 X +

Persamaan garis lurus itu dapat ditulis Y= b 0 + b 1 X + E Dimana E adalah Error yang merupakan random variabel dengan nilai rata-rata 0 untuk setiap nilai X ( yaitu m. El. X = 0 untuk setiap nilai X). Dengan demikian nilai Y adalah jumlah dari b 0 + b 1 X dan E (random variabel) dan karena nilai E = 0 maka Y= b 0 + b 1 X atau dapat ditulis E = Y – (b 0 + b 1 X) = Y – m. Yl. X PERHATIKAN GAMBAR BERIKUT

4. Homoscedasticity varians Y adalah sama untuk setiap nilai X (Homo artinya sama; scedastic

4. Homoscedasticity varians Y adalah sama untuk setiap nilai X (Homo artinya sama; scedastic artinya ‘menyebar’=scattered) Pada gambar telihat bahwa distribusi nilai Y pada X 1 lebih menyebar dibanding Y pada X 2. Ini berarti s 2 Yl. X 1, varians Y pada X 1 lebih besar dibanding s 2 Yl. X 2, varians Y pada X 2 5. Distribusi normal. Untuk setiap nilai X, nilai Y berdistribusi normal