Korelasi dan Regresi Oleh Anwar Dita Erna Program

  • Slides: 22
Download presentation
Korelasi dan Regresi Oleh: Anwar, Dita, Erna Program Studi Magister Biomedik Fakultas Kedokteran Universitas

Korelasi dan Regresi Oleh: Anwar, Dita, Erna Program Studi Magister Biomedik Fakultas Kedokteran Universitas Sumatera Utara 2011

Pendahuluan Beberapa penelitian di bidang kedokteran sering ingin menilai apakah ada hubungan antara dua

Pendahuluan Beberapa penelitian di bidang kedokteran sering ingin menilai apakah ada hubungan antara dua variabel (dependent dan independent) yang numerik. contoh : Hubungan Index Massa Tubuh dengan kadar kolesterol. Hubungan antara KGD dengan Kadar LDL pada pasien DM.

 Analisis regresi dapat diketahui bentuk hubungan antara dua variabel (Prediksi dari data yang

Analisis regresi dapat diketahui bentuk hubungan antara dua variabel (Prediksi dari data yang ada). Analisis korelasi untuk mengetahui eratnya hubungan antara dua variabel. Semakin erat hubungannya maka semakin yakin bahwa hubungan dua variabel tersebut adalah hubungan sebab akibat. Analisis regresi dan korelasi didasarkan atas hubungan yang terjadi antara dua variabel atau lebih.

 Variabel yang digunakan untuk meramal disebut variabel bebas (independen). Dapat lebih dari satu

Variabel yang digunakan untuk meramal disebut variabel bebas (independen). Dapat lebih dari satu variabel. Variabel yang akan diramal variabel respons (dependen). Terdiri dari satu variabel.

A. Diagram Tebar (Scatter plot) Diagram tebar adalah diagram dengan memakai garis koordinat dengan

A. Diagram Tebar (Scatter plot) Diagram tebar adalah diagram dengan memakai garis koordinat dengan axis X dan ordinat Y. Tiap pengamatan diwakili oleh satu titik. Hubungan antara variabel dapat berupa garis lurus (linier), garis lengkung (kurva linier) atau tdk terlihat pola tertentu. Dapat berupa garis regresi positif atau negatif.

Contoh linier positif linier negatif

Contoh linier positif linier negatif

Kekuatan Hubungan Bila titik-titik menbar pada satu garis lurus, maka kekuatan hubungan antara kedua

Kekuatan Hubungan Bila titik-titik menbar pada satu garis lurus, maka kekuatan hubungan antara kedua variabel tersebut sangat sempurna. Kekuatan hubungan dapat dikuantifikasi melalui suatu koefisien yaitu koefisien korelasi (r pearson). Koefisien ini akan berkisar antara 0 – 1. bila r = 0 tidak ada hubungan linier. r = 1 hubungan linier sempurna. 0 -1 = bila mendekati 1 semakin kuat hubungannya, bila mendekati 0 semakin lemah hubungannya. Lihat tandanya apakah korelasi positif atau negatif.

Interval Koefisien Tingkat Hubungan 0. 000 – 0. 199 Sangat rendah 0. 200 –

Interval Koefisien Tingkat Hubungan 0. 000 – 0. 199 Sangat rendah 0. 200 – 0. 399 Rendah 0. 400 – 0. 599 Sedang 0. 600 – 0. 799 Kuat 0. 800 – 1. 000 Sangat kuat

Rumus koefisien korelatif (Pearson) n(∑XY) – (∑X) (∑Y) r= √[(n∑X 2) – (∑X)2] [(n∑Y

Rumus koefisien korelatif (Pearson) n(∑XY) – (∑X) (∑Y) r= √[(n∑X 2) – (∑X)2] [(n∑Y 2) – (∑Y)2] Ket: n = jumlah sampel X = nilai pada ordinat X Y = nilai pada ordinat Y

Contoh. . No X (SGOT) Y (HDL) XY X 2 Y 2 1. 2.

Contoh. . No X (SGOT) Y (HDL) XY X 2 Y 2 1. 2. 3. 4. 5. 6. 7. 12. 7 11. 3 13. 5 15. 1 17. 9 19. 3 15. 5 42. 2 41. 2 42. 3 42. 8 43. 8 44. 5 45. 5 535. 94 465. 56 571. 05 646. 28 784. 02 858. 85 705. 25 161. 29 127. 69 182. 25 228. 01 320. 41 372. 49 240. 25 1780. 84 1697. 84 1789. 29 1831. 84 1918. 44 1980. 25 2070. 25 ∑ 105. 3 302. 3 4566. 95 1632. 39 13068. 35 n(∑XY) – (∑X) (∑Y) r= √[(n∑X 2) – (∑X) 2] [(n∑Y 2) – (∑Y)2] 7 (4566. 95) – (105. 3) (302. 3) r= = 0. 768 √[(7 x 1632. 39) – (105. 3)2] [(7 x 13068. 35) – (302)2]

Scatter Plot

Scatter Plot

Kesimpulan hasil Dilihat dari besarnya r yang mendekati 1, maka hubungan antara SGOT dengan

Kesimpulan hasil Dilihat dari besarnya r yang mendekati 1, maka hubungan antara SGOT dengan HDL adalah kuat. Berpola linier positif Maka makin tinggi SGOT maka akan semakin tinggi kadar HDL.

Koefisien Determinasi R = r 2 Yaitu besarnya proporsi variasi Y yang dapat dijelaskan

Koefisien Determinasi R = r 2 Yaitu besarnya proporsi variasi Y yang dapat dijelaskan oleh variabel X. Apabila r = 1 maka R = 100% X memegang peranan dalam perubahan Y. bila terjadi perubahan X, maka Y akan berubah. Pada kasus diatas r = 0. 768 maka R = r 2 R= (0. 768)2 = 0. 59 59%. Hal ini berarti HDL dapat dijelaskan oleh Variabel SGOT sebesar 59%.

Uji Hipotesis koefisien Korelasi Pengujian signifikansi Selain menggunakan tabel r, juga dapat dihitung dengan

Uji Hipotesis koefisien Korelasi Pengujian signifikansi Selain menggunakan tabel r, juga dapat dihitung dengan uji t. rumusnya: t= r√(n-2) √(1 -r 2) df= n-2 bila t hitung > t tabel, Ho di tolak bila t hitung < t tabel, Ho diterima

B. Regresi Linier Persamaan garis Linier : Y = a + b. X Pada

B. Regresi Linier Persamaan garis Linier : Y = a + b. X Pada persamaan ini harus jelas dan tentukan mana variabel Y (dependen) dan variabel X (independen). Penetapan disesuaikan dengan tujuan analisis. Biasanya variabel Y lebih sulit diukur Variabel X lebih mudah diukur Mengapa?

 Karena dari persamaan garis regresi linier, kita dapat melakukan banyak hal. Contohnya :

Karena dari persamaan garis regresi linier, kita dapat melakukan banyak hal. Contohnya : menduga satu nilai variabel dependen berdasarkan nilai variabel bebasnya. Dari contoh kasus diatas, SGOT merupakan variabel bebas dan HDL merupakan variabel terikat. Sehingga: HDL = a + b SGOT Garis linier dapat digambarkan bila koefisien a dan b diperoleh.

Metode kuadrat terkecil b= n(∑XY) – (∑X) (∑Y) n∑(X)2 – (∑X)2 Koefisien b =

Metode kuadrat terkecil b= n(∑XY) – (∑X) (∑Y) n∑(X)2 – (∑X)2 Koefisien b = besarnya perubahan nilai variabel Y apakah nilai variabel X berubah sebesar satu unit (satuannya) Koefisien a = nilai awal/intercept besarnya nilai variabel Y, bila variabel X = 0 a = y - bx

 Maka dari contoh soal diatas dapat dihitung: b= n(∑XY) – (∑X) (∑Y) n∑(X)2

Maka dari contoh soal diatas dapat dihitung: b= n(∑XY) – (∑X) (∑Y) n∑(X)2 – (∑X)2 b= 7 x 4566. 95 – (105. 3 x 302. 3) 7 x 1632. 39 – (105. 3)2 a= y – b. X = (302. 3/7) – (0. 403)(105. 3/7) = 37. 123 Maka HDL = 37. 123 + 0. 403 SGOT = 0. 403

Regresi Linier Ganda Contoh kasus diatas adalah Regresi linier sederhana. Hubungan 1 variabel dependen

Regresi Linier Ganda Contoh kasus diatas adalah Regresi linier sederhana. Hubungan 1 variabel dependen biasanya tidak hanya dengan satu variabel saja. Variabel X lebih dari 1. maka : Y = a + b 1 X 1 + b 2 X 2 + ……. +bp. Xp Hasilnya sudah terkontrol koefisien b terhadap variabel bebas lain yang berada dalam model. Dalam hal ini koefisien determinasi (R) cukup penting. Untuk menjelaskan variabel X yang kita pilih dapat menjelaskan vaiasi Y.

Soal… Seorang dokter ingin mengetahui apakah ada hubungan antara berat badan seseorang dengan tinggi

Soal… Seorang dokter ingin mengetahui apakah ada hubungan antara berat badan seseorang dengan tinggi badan sesorang, untuk keperluan tsb dilakukan penelitian terhadap 10 orang dengan data sbb: Tinggi (cm) Berat Badan (kg) 161 46 158 68 166 57 171 48 160 62 156 41 143 47 136 52 132 39 140 42 Buat persamaan regresinya dan koefisien korelasinya!

 40 25 20 30 50 40 25 50 385 400 395 365 475

40 25 20 30 50 40 25 50 385 400 395 365 475 440 490 420 560 525 480 510