DUMMY VARIABEL PADA VARIABEL BEBAS MODEL REGRESI Gangga
DUMMY VARIABEL PADA VARIABEL BEBAS MODEL REGRESI Gangga Anuraga, M. Si
• Variabel Dummy • Variabel artificial yang digunakan untuk mengkuantifikasikan Variabel kualitatif • Variabel kualitatif: • - Gender (perempuan, laki) • - Tingkat pendidikan(SD, SMP, SMA, PT) • - dll • • 2
PENERAPAN VARIABEL DUMMY • Untuk membedakan kategori –kategori dalam variabel kualitatif menggunakan nilai 0 dan 1. • Dengan ketentuan jumlah variabel dummy : - Model regresi dengan intersep, jumlah variabel dummy r-1 (r=jumlah kategori variabel kualitatif) 3
• Model regresi intersep: • Pola alokasi variabel dummy untuk variabel kualitatif r kategori diperoleh dengan menuliskan matrik 1 yang berukuran (r-1) ditambah satu baris (r-1) angka 0. Contoh 4
• Contoh : • Variabel tingkat pendidikan (SD, SMP, SMA, PT) • r=4 jumlah var dummy=3 • Alokasi penulisan: D 1 D 2 D 3 Kategori Dlm var kualitatif • SD SMP SMA PT 1 0 0 (0 0 1 0) kategori dasar pembanding dengan kategori lain 5
Sifat-sifat variabel Dummy • Untuk membedakan kategori dalam variabel kualitatif tanpa menyebabkan matrik (x’x) nya singular • Interpretasi hasil dari model yang menggunakan var dummy tergantung pada penggunaan angka 1 dan 0, artinya kategori mana yang dikode 1 dan 0. • Kategori yang diberi angka 0 disebut kategori dasar • Koefisien dari var dummy (D) disebut sebagai differential intercept koefisien, sebab menerangkan besarnya pendapatan kategori yang diberi nilai 1 dengan kategori dasar (angka 0) 6
• CONTOH : Data merupakan data berat ayam kalkun (Y) dalam pound dan umur (X) dalm minggu dari 13 kalkun untuk perayaan thanks giving. Empat diantara ayam kalkun itu berasal dari Georgia (G), empat dari Virginia (V), dan lima dari Wincosin (W). Postulate model menyatakan ada pengaruh umur dan asal terhadap berat ayam kalkun estimasi modelnya? 7
X(umur) Y (berat) D 1 D 2 28 13. 3 1 0 20 8. 9 1 0 32 15. 1 1 0 22 10. 4 1 0 29 13. 1 0 1 27 12. 4 0 1 28 13. 2 0 1 26 11. 8 0 1 21 11. 5 0 0 27 14. 2 0 0 29 15. 4 0 0 23 13. 1 0 0 25 13. 8 0 0
• • The regression equation is y = 1. 43 + 0. 487 x - 1. 92 D 1 - 2. 19 D 2 • • • Predictor Constant x D 1 D 2 • S = 0. 3002 • Analysis of Variance • • Source DF SS Regression 3 38. 606 Residual Error 9 0. 811 Total 12 39. 417 • • Source DF Seq SS x 1 26. 202 D 1 1 2. 717 D 2 1 9. 687 Coef SE Coef T P 1. 4309 0. 6574 2. 18 0. 058 0. 48676 0. 02574 18. 91 0. 000 -1. 9184 0. 2018 -9. 51 0. 000 -2. 1919 0. 2114 -10. 37 0. 000 R-Sq = 97. 9% R-Sq(adj) = 97. 3% MS F P 12. 869 142. 78 0. 000 0. 090 9
• Estimasi model yang didapat: y = 1. 43 + 0. 487 x - 1. 92 D 1 - 2. 19 D 2 • Estimasi model untuk Georgia y = -0. 49+ 0. 487 x • Estimasi model untuk Virginia y = -0. 76 + 0. 487 x Estimasi model untuk Winconsin y = 1. 43 + 0. 487 x 10
- Slides: 10