Statistika 2 Topik Bahasan Regresi dan Korelasi Linier
Statistika 2 Topik Bahasan: Regresi dan Korelasi Linier Oleh : Edi M. Pribadi, SP. , MSc. E-mail: edi_mp@staff. gunadarma. ac. id edi_mp@ymail. com
Cakupan Materi 1. 2. 3. 4. Regresi Linier Sederhana Korelasi Linier Regresi Berganda Korelasi Berganda 1. Regresi Linier Sederhana • Persamaan Regresi : — Model regresi adalah persamaan matematik yang memungkinkan dalam peramalan nilai variabel tak bebas dari satu atau lebih variabel bebas Dependent Variable) y y = a + bx — Study tentang pengaruh 1 variabel bebas thd variabel tak bebas → regresi sederhana — Sedangkan jika ada 2 atau lebih variabel bebas → regresi berganda x (Independent Variable) Regresi & Korelasi Linier ~ Statistika 2 2
— Dua variabel yang berhubungan (bivariat) diplotkan dalam grafik yaitu ‘diagram pencar’, yang menyatakan berbagai pola hubungan tertentu : a. b. c. d. • Hubungan positif linier Hubungan negatif linier Hubungan non-linier (eksponential) Tidak ada hubungan Analisis Regresi : Dua kegunaan pokok analisis regresi, yaitu : 1. Memperoleh suatu persamaan dan garis yang menyatakan hubungan antara 2 variabel 2. Pendugaan nilai ‘dependent variable’, y, dengan nilai tertentu ‘dependent variable’, x, yang diketahui berdasarkan hubungan dalam persamaan regresi y = a + bx → y = dependent variable x = independent variable a, b = parameter / konstanta regresi linier sederhana Regresi & Korelasi Linier ~ Statistika 2 3
• Analisis Korelasi : − Mengukur keeratan hubungan antara 2 variabel yang didasarkan pada persamaan regresi − Bukan meramalkan nilai variabel y − Kekuatan hubungan antara 2 variabel dinyatakan dalam suatu bilangan yang disebut ‘koefesien korelasi’, yang dilambangkan dengan r 2 − Pola hubungan, antara lain : a. Korelasi positif → tinggi, rendah b. Korelasi negatif → tinggi, rendah c. Korelasi nol • Persamaan dan Garis Regresi − Regresi sederhana hanya memiliki 2 variabel, yaitu 1 dependent dan independent variable − Linier → terdapat hubungan garis lurus antara kedua variabel − Persamaan hubungan linier 2 variabel x dan y : y = a + bx → y = dependent variable x = independent variable Regresi & Korelasi Linier ~ Statistika 2 a = konstanta / y-intercept b = konstanta / slope 4
• Contoh : Diketahui persamaan regresi y = 50 + 5 x Jika x = 0, maka y = 50 x = 10, maka y = 100 y y = 50 + 5 x 150 1 100 5 → perubahan y perubahan x 50 5 10 15 x Perpotongan garis y • Analisis Regresi Linier Sederhana : — Model regresi linier sederhana : y = A+ Bx → deterministic model → tiap satu nilai x memiliki satu nilai y (exact relationship) — Dalam kenyataannya, hubungan x dan y → not exact y = A + Bx + є → dimana є (=baca epsilon) adalah random error → A dan B merupakan parameter populasi maka garis regresi yang dihasilkan disebut ‘garis regresi populasi’ → Selalu digunakan sampel data dlm penentuan model regresi ŷ = a + bx + e → dimana a & b adalah nilai penduga bagi A & B Regresi & Korelasi Linier ~ Statistika 2 5
— Analisis regresi dengan sampel data akan menghasilkan galat e e = y – ŷ → e = random error atau galat untuk sampel data Σe = Σ(y – ŷ) → ŷ = nilai prediksi untuk y y Garis regresi e = galat x — Untuk menentukan garis regresi yang baik, digunakan metode “Least Square” atau “jumlah kuadrat terkecil” Dalam hal ini dihasilkan garis “Least Square”, dimana a dan b menghasilkan jumlah kuadrat galat minimum SSE = Σe 2 = Σ(y – ŷ)2 SSE = Error Sum of Square Regresi & Korelasi Linier ~ Statistika 2 6
— Untuk garis regresi “Least Square” dimana ŷ = a + bx ; a = ў - bxˉ dimana SS = Sum of Square ; ў dan xˉ = rata-rata — Contoh : Tentukan garis regresi “Least Square” dari data income dan belanja ($/hari) untuk 7 keluarga pada tabel berikut : Income (x) 35 49 21 39 15 28 25 Belanja (y) 9 15 7 11 5 8 9 Jawab : y = a + bx Step untuk menghitung a dan b : Step 1. Menghitung Σx, Σy, x, ˉ ў Σx = 212 → ˉx = Σx/n = 212/7 = 30. 29 Σy = 64 → ў = Σy/n = 64/7 = 9. 14 Regresi & Korelasi Linier ~ Statistika 2 7
Step 2. Menghitung Σxy dan Σx 2 Σxy = 2150 dan Σx 2 = 7222 Step 3. Menghitung SSxy dan SSxx Step 4. Menghitung a dan b ˉ = 9. 14 – (0. 26) (30. 29) = → a = ў – bx 1. 14 Sehingga model regresi pendugaan ŷ = a + bx adalah : ŷ = 1. 14 + 0. 26 x — Garis yang dihasilkan disebut garis regresi “Least Square”, yang memberikan regresi belanja atas income. — Dengan model regresi pendugaan bisa memprediksi nilai y pada nilai x tertentu — Contoh : Berapa biaya belanja yang dikeluarkan suatu sampel keluarga yang memiliki income $35/hari. Regresi & Korelasi Linier ~ Statistika 2 8
Jawab : ŷ = 1. 14 + (0. 26)(35) = $10. 39 → ŷ = $10. 39 e = galat = y – ŷ y = $9 = 9 – 10. 39 = -1. 39 e = -1. 39 → nilai pendugaan y lebih besar dari nilai y yang sebenarnya y ŷ = 1. 14 + 0. 26 x Titik penduga e = galat y aktual = 9 12 8 4 10 20 30 40 Regresi & Korelasi Linier ~ Statistika 2 x 9
• Interpretasi Nilai a dan b — ŷ = 1. 14 + 0. 26 x → Diperoleh dari data sampel dimana nilai x → 15 ≤ x ≤ 49 → Hanya pada selang nilai x tsb, persamaan ŷ = 1. 14 + 0. 26 x, dapat diaplikasikan dan menghasilkan nilai y yang valid → ŷ yang dihasilkan adalah nilai rata-rata pendugaan, µy|x → Nilai b, bisa positif atau negatif b positif → hubungan x dan y linier positif b negatif → hubungan x dan y linier negatif y y b<0 b>0 x x Linier Positif Regresi & Korelasi Linier ~ Statistika 2 Linier Negatif 10
• Simpangan Baku Galat — Simpangan baku galat suatu populasi, σe, mengukur sebaran error di sekitar garis regresi populasi — σe biasanya unknown, sehingga nilainya diduga dari nilai Se, yaitu simpangan baku galat dari sampel data SSE = Σe 2 = Σ(y – ŷ)2 — n - 2 adalah derajat bebas df • Koefesien Determinasi — Suatu model regresi dianggap baik, dapat dinilai dari koefesien determinasi, yang dinotasikan : ρ2 → dihitung untuk data populasi r 2 → dihitung untuk data sampel Nilai r 2 → 0 ≤ r 2 ≤ 1 — Makin besar nilai r 2, makin baik suatu model regresi, dimana variabel y sangat berhubungan dengan variabel x Regresi & Korelasi Linier ~ Statistika 2 11
2. Korelasi Linier • • • Korelasi linier mengukur keeratan hubungan atau asosiasi linier antara 2 variabel Koefesien korelasi linier mengukur bagaimana dekat titik-titik dalam diagram pencar tersebar di sekitar garis regresi Koefesien korelasi linier merupakan akar dari koefesien determinasi dinotasikan : ρ → dihitung untuk data populasi r → dihitung untuk data sampel Nilai ρ dan r → -1 ≤ ρ ≤ 1 y r=1 x Korelasi Linier Positif Regresi & Korelasi Linier ~ Statistika 2 dan -1 ≤ r ≤ 1 y r = -1 x Korelasi Linier Negatif y r=0 x Tidak Korelasi Linier 12
y y Korelasi Linier positif kuat ( r mendekati 1) • x y Korelasi Linier positif lemah ( r + mendekati 0) x y Korelasi Linier negatif kuat ( r mendekati -1) x x Korelasi Linier negatif lemah ( r - mendekati 0) Korelasi linier sederhana, dinotasikan r, dihitung dengan rumus : Regresi & Korelasi Linier ~ Statistika 2 13
• Latihan : 1. Nilai kuis (x) dan ujian akhir semester (y) dari 9 mahasiswa adalah sebagai berikut : x 77 50 71 72 81 94 96 99 67 y 82 66 78 34 47 85 99 99 68 a. Tentukan persamaan garis regresinya b. Dugalah nilai ujian akhir dari seorang mahasiswa yang nilai kuisnya adalah 85 2. Tabel berikut menunjukkan besarnya income per minggu (dalam dolar) dan biaya telepon untuk 10 keluarga sebagai sampel yang diambil acak. Income 55 45 36 32 30 13 41 15 36 40 Phone Bill 35 78 102 56 75 26 130 42 59 85 a. b. c. d. e. Tentukan SSxx, SSyy, SSxy Tentukan SSE Tentukan simpangan baku galat Tentukan koefesien determinasi Tentukan koefesien korelasi Regresi & Korelasi Linier ~ Statistika 2 14
3. Regresi Linier Berganda • • Dalam regresi berganda dinyatakan hubungan antara sebuah variabel dependen (y) dengan 2 atau lebih variabel independen (x) If ada n variable independen, maka variabel tersebut → x 1, x 2, x 3 …. xn Regresi bergada kemudian menentukan nilai a, b 1, b 2, b 3 …. bn untuk mendapatkan persamaan regresinya y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 +. . . + bnxn b 1 = koefisien x 1 , b 2 koefisien x 2 , dst. • Untuk menentukan nilai a, b 1, b 2, b 3 …. bn maka digunakan persamaan normal : → a. n + b 1. Σx 1 + b 2. Σx 2 + b 3. Σx 3 = Σy → → → a. Σx 1 + b 1. Σ(x 1. x 1) + b 2. Σ(x 2. x 1) + b 3. Σ(x 3. x 1) = Σ(y. x 1 ) a. Σx 2 + b 1. Σ(x 1. x 2) + b 2. Σ(x 2. x 2) + b 3. Σ(x 3. x 2) = Σ(y. x 2 ) a. Σx 3 + b 1. Σ(x 1. x 3) + b 2. Σ(x 2. x 3) + b 3. Σ(x 3. x 3) = Σ(y. x 3 ) ………………. . a. Σxn + b 1. Σ(x 1. xn) + b 2. Σ(x 2. xn) + b 3. Σ(x 3. xn) = Σ(y. xn) Regresi & Korelasi Linier ~ Statistika 2 15
• Contoh : Tabel berikut menunjukkan jumlah penjualan (y) dalam hubungannya dengan lamanya pengalaman sebagai sales (x 1) dan nilai test iq (x 2) dari 8 orang sales dalam suatu periode tertentu. Tentukan persamaan garis regresinya Sales y x 1 x 2 A 9 6 3 B 6 5 2 C 4 3 2 D 3 1 1 E 3 4 1 F 5 3 3 G 8 6 3 H 2 2 1 Jawab : Sales y x 1 x 2 y 2 x 12 x 22 x 1. x 2 y. x 1 y. x 2 A B C D E F G H 9 6 4 3 3 5 8 2 6 5 3 1 4 3 6 2 3 2 2 1 1 3 3 1 81 36 16 9 9 25 64 4 36 25 9 1 16 9 36 4 9 4 4 1 1 9 9 1 18 10 6 1 4 9 18 2 54 30 12 3 12 15 48 4 27 12 8 3 3 15 24 2 Σy = Σ x 1 = 30 Σ x 2 = 16 Σ y 2 = 224 Σ x 12= 136 Σ x 22= 38 Σx 1. x 2= 68 Σ y. x 1= 178 Σ y. x 2= 94 Total 40 Regresi & Korelasi Linier ~ Statistika 2 16
• Didapatkan 3 persamaan normal : → a. n + b 1. Σx 1 + b 2. Σx 2 = Σy 8 a + 30 b 1 + 16 b 2 = 40 ………………………. … (1) → a. Σx 1 + b 1. Σ(x 1. x 1) + b 2. Σ(x 2. x 1) = Σ(y. x 1 ) 30 a + 136 b 1 + 68 b 2 = 178 ……………………. . . (2) → a. Σx 2 + b 1. Σ(x 1. x 2) + b 2. Σ(x 2. x 2) = Σ(y. x 2 ) 16 a + 68 b 1 +38 b 2 = 94 ………………. . (3) Dengan cara eliminasi ketiga persamaan tersebut didapatkan : a = -0. 4545 ; b 1 = 0. 7273 ; b 2 = 1. 3636 Maka persamaan regresi yang dihasilkan ŷ = -0. 4545 + 0. 7273 x 1 + 1. 3636 x 2 • Simpangan Baku Simpangan baku regresi berganda dapat dihitung dengan formula sebagai berikut : Dari contoh di atas, maka simpangan bakunya adalah : Regresi & Korelasi Linier ~ Statistika 2 17
4. Korelasi dan determinasi Berganda • Untuk contoh acak {(x 1, x 2, y)}, koefesien determinasi berganda contoh dilambangkan dengan r 2 y. 12 • Untuk contoh diatas, maka : Dengan koefesien determinasi 0. 9, artinya bahwa bidang regresi : ŷ = -0. 4545 + 0. 7273 x 1 + 1. 3636 x 2 dapat menjelaskan 90% keragaman dalam y berhubungan dengan variabel x 1 dan x 2 • Koefesien korelasi, r adalah akar dari koefesien determinasi. Sehingga : Regresi & Korelasi Linier ~ Statistika 2 18
- Slides: 18