Chapter 15 Minitab 1 The regression equation is
Chapter 15 複迴歸
下圖為運用Minitab軟體對表 1資料做簡單線性 迴歸後所得之統計報表 The regression equation is Time = 1. 27+0. 0678 Miles Predictor Coef SE Coef T P Constant 1. 274 1. 401 0. 91 0. 390 Miles 0. 06783 0. 01706 3. 98 0. 004 S=1. 002 R-sq=66. 4% 含一個自變數 的Minitab 電腦報表 R-sq (adj)=62. 2% Analysis of Variance SOURCE DF SS MS F P Regression 1 15. 871 15. 81 0. 004 Residual Error 8 8. 029 1. 004 Total 9 23. 900
含兩個自變數的Minitab電腦報表 The regression equation is Time = -0. 869+0. 0611 Miles+0. 923 Deliveries Predictor Coef SE Coef Constant -0. 8687 0. 9515 -0. 91 0. 392 Miles 0. 061135 0. 0009888 6. 18 0. 000 S=0. 5731 R-sq=90. 4% T P R-sq (adj)=87. 6% Analysis of Variance SOURCE DF SS MS F P Regression 2 21. 601 10. 800 32. 88 0. 000 Residual Error 7 2. 299 0. 328 Total 9 23. 900
調整複判定係數 (Adjusted Multiple Coefficient of Determination ) 2 Ra = 1 -( 1 - R 2 ) n-1 n-p-1 l 在巴特勒貨運公司例子中 10 -1 Ra = 1 -( 1 -0. 904 ) = 0. 88 10 -2 -1 2
圖 15. 6 含行駛哩程數(x 1)及送貨批數(x 2) 兩個自變數 的巴特勒貨運公司Minitab的電腦報表 The regression equation is Time = - 0. 869+0. 0611 Miles+0. 923 Deliveries Predictor Coef SE Coef T P Constant 1. 274 1. 401 0. 91 0. 390 Miles 0. 06783 0. 01706 3. 98 0. 004 Deliveries 0. 9234 0. 2211 4. 18 S=0. 5731 R-sq=90. 4% 0. 004 R-sq (adj)=87. 6% Analysis of Variance SOURCE DF SS MS F P Regression 2 21. 601 10. 800 32. 88 0. 000 Residual Error 7 2. 299 0. 328 Total 9 23. 900
巴特公司問題中 95%信賴與預測區間估計值 信賴區間 預測區間 X 1值 X 2值 下限 上限 50 2 3. 146 4. 924 2. 414 5. 656 50 3 4. 127 5. 789 3. 368 6. 548 50 4 4. 815 6. 948 4. 157 7. 607 100 2 6. 258 7. 926 5. 500 8. 683 100 3 7. 385 8. 645 6. 520 9. 510 100 4 8. 135 9. 742 7. 362 10. 515
含一個自變數的強生公司電腦報表 The regression equation is Time = 2. 15+0. 304 Months Predictor Coef SE Coef T P Constant 2. 1473 0. 6050 3. 55 0. 008 Months 0. 3041 0. 1004 3. 03 0. 016 S=0. 7810 R-sq=53. 4% R-sq (adj)=47. 6% Analysis of Variance SOURCE DF SS MS Regression 1 5. 5960 Residual Error 8 4. 8800 0. 6100 Total 9 10. 4760 F 9. 17 P 0. 016
含兩個自變數的強生公司電腦報表 The regression equation is Time = 0. 93+0. 388 Months+1. 26 Type Predictor Coef SE Coef T P Constant Months Type 0. 9305 0. 4670 1. 99 0. 087 0. 38762 0. 06257 6. 20 0. 0000 1. 2627 0. 3141 4. 02 0. 005 S=0. 4590 R-sq=85. 9% R-sq (adj)=81. 9% Analysis of Variance SOURCE DF SS MS Regression 2 9. 0009 4. 5005 Residual Error 7 1. 4751 0. 2107 Total 9 10. 4760 F 21. 36 P 0. 001
l表 15. 7巴特勒貨運公司問題的殘差與標準化殘差 行駛 哩程數 送貨批數 行駛時間 預測時間 ^ (x ) (y) 2 (x 1) 殘差 ^ (y - y) 標準化殘差 0. 361541 0. 78344 50 3 4. 8 4. 95830 -0. 158304 -0. 34962 100 4 8. 93846 -0. 038460 -0. 08334 100 2 6. 5 7. 09161 -0. 591609 -1. 30929 50 2 4. 03488 0. 165121 0. 38167 80 2 6. 2 5. 86892 0. 331083 0. 65431 … … … 8. 93846 … 9. 3 … 4 … 100
l表 15. 8巴特勒貨運公司的Student化刪除殘差 行駛 哩程數 (x 1) 送貨批數 (x 2) 行駛時間 (y) 標準化殘差 Student化 刪除殘差 0. 78344 0. 75939 50 3 4. 8 -0. 34962 -0. 32654 100 4 8. 9 -0. 08334 -0. 07720 100 2 6. 5 -1. 30929 -1. 39494 50 2 4. 2 0. 38167 0. 35709 80 2 6. 2 0. 65431 0. 62519 … … … 9. 3 … 4 … 100
l表 15. 9巴特勒貨運公司的槓桿作用值及其庫克距離 行駛 哩程數 (x 1) 送貨批數 (x 2) 行駛時間 (y) 槓桿作用 (hi) 庫克距離度量 (Di) 0. 351704 0. 110994 50 3 4. 8 0. 375863 0. 024536 100 4 8. 9 0. 351704 0. 001256 100 2 6. 5 0. 378451 0. 347923 50 2 4. 2 0. 430220 0. 036663 80 2 6. 2 0. 220557 0. 040381 … … … 9. 3 … 4 … 100
表 15. 11 Sim百貨的樣本資料 顧客 1 2 3 4 5 6 7 8 9 10 年度開銷($1, 000) 2, 291 3, 215 2, 135 3, 924 2, 528 2, 473 2, 384 7, 076 1, 182 3, 345 Sim信用卡 1 1 1 0 0 0 1 0 消費與否 0 0 0 1 0
^ e -2. 1464 +0. 3416(2)+1. 0987(0) y= 1+e -2. 1464 +0. 3416(2)+1. 0987(0) = e -1. 4623 1+e-1. 4623 l = 0. 2315 =0. 1880 1. 2315 欲估計去年消費$2, 000且具有sim信用卡 的顧客機率,將x 1= 2,x 2= 1代入式(15. 32)
圖 15. 13 以Sim百貨為例的部分羅吉斯迴歸報表 Logistic Regression Table Predictor Coef Constant -2. 1464 Spending Card SE Coef Odds Z P 0. 5772 -3. 72 0. 000 0. 3416 0. 1287 2. 66 1. 0987 0. 4447 2. 47 95%CI Ratio Lower Upper 0. 008 1. 41 1. 09 1. 81 0. 013 3. 00 1. 25 7. 17 Log-Likelihood=-60. 487 Test that all slopes are zero : G=13. 628, DF=2, P-Value=0. 001
表 15. 12 Sim百貨估計機率值 年度開銷 $1000 $2000 $3000 $4000 $5000 $6000 $7000 有 0. 3305 0. 4099 0. 4943 0. 5790 0. 6593 0. 7314 0. 7931 信用卡 無 0. 1413 0. 1880 0. 2457 0. 3143 0. 3921 0. 4758 0. 5609
0. 4099 Odds 1的估計值= 1 - 0. 4099 = 0. 6946 Odds 0的估計值= 0. 1880 = 0. 2315 1 - 0. 1880 0. 6946 估計勝算比= =3 0. 2315
以Sim百貨為例,估計的logit如下 估計的logit ^ g(x 1,x 2)=-2. 1464+0. 3416 x 1+1. 0987 x 2
- Slides: 111