Veiksni parinkimo problema Veiksni parinkimo problema Veiksni traukimo
Veiksnių parinkimo problema
Veiksnių parinkimo problema Veiksnių įtraukimo į regresiją procedūra ¡ Visų galimų regresijų metodas ¡ t arba p-reikšmės kriterijaus taikymas parenkant statistiškai reikšmingus koeficientus (veiksnius) ¡
Veiksnių įtraukimo į regresiją procedūra ¡ Veiksnių parinkimo žingsniai l l Teorinis-loginis veiksnių sąrašas Matematinė –statistinė parinkimo procedūra
Teorinis-loginis veiksnių sąrašo sudarymas ¡ Praktinės taisyklės: l l l Veiksnių skaičius susijęs su stebėjimų skaičiumi (n>6 k) Vienas kintamasis vieno veiksnio įtakai aprašyti į vieną regresijos lygtį netraukiami suminiai/agreguoti ir juos sudarantys duomenys: pvz. bedarbių skaičius šakoje ir papildomai vyrų ir moterų bedarbių skaičius.
Visų galimų regresijų metodas
Koreguotas determinacijos koeficientas - Koreguotas determinacijos koeficientas
Visų galimų regresijų metodas ¡ ¡ ¡ ¡ Ysū Ysū = = = = 43, 39+ 0, 78 Xmū +e 77, 90+ 0, 53 Xtū +e 69, 04+ 15, 59 Dvm+e 20, 64+0, 69 Xmū+0, 21 Xtū +e 77, 90+0, 55 Xmū + 13, 84 vm+e 89, 55+ 0, 44 Xtū+15, 15 Dvm +e 51, 62+0, 45 Xmū+0, 24 Xtū+13, 92 Dvm+e 0. 25 0. 10 0. 53 0, 25 0. 63 0. 60 0. 66
t- arba p-reikšmės kriterijaus taikymas parenkant reikšminius veiksnius Laipsniško veiksnių įtraukimo metodas Forward ¡ Laipsniško veiksnių išmetimo metodas Backward ¡ Kombinuotas metodas Stepwise ¡
Forward procedūra ¡ Pirmas žingsnis l l l Apskaičiuojame visas galimas porines regresijas = f(X 1), = f(X 2) … = f(Xk) Palyginame visas apskaičiuotas 1 tb 1 , 1 tb 2. . . 1 tbk statistikas Išrenkame didžiausią 1 tbj statistiką Palyginame gautą 1 tbj su teorine statistikos tn 2, α/2 reikšme Jeigu 1 tbj tn-2, , α/2 j veiksnį įtraukiame į regresiją
Forward procedūra ¡ Antras žingsnis l Apskaičiuojame visas galimas dviejų kintamųjų regresijas l l = f(Xj, X 1), = f(Xj, X 2), = f(Xj, Xk), Palyginame visose regresijose naujai įtraukiamų kintamųjų įverčių apskaičiuotas 2 tbj , 2 tb 2. . . 2 tbk statistikas l Išrenkame didžiausią 2 tbs statistiką l Palyginame gautą 2 t bs su teorine statistikos tn-3, α/2 reikšme l Jeigu 2 tbs tn-3, α/2 , s veiksnį įtraukiame į regresiją
Forward procedūra ¡ Forward procedūra baigiama: l l kai įtraukti visi veiksniai kai visos naujai įtrauktų veiksnių apskaičiuotos t statistikos mažesnės už tn-k-1, α/2
Pvz. Forward metodas Pirmas žingsnis ¡ ¡ ¡ YPVM = -26, 85+ t -0, 27 t 14, 38 t 14, 24 t 14, 37 t -0, 88 YPVM = 1318+ YPVM = 1303, 16+ YPVM = 1282, 08+ YPVM = -4616 YPVM = 1181, 94+ t 17, 11 t 33; 0, 05/2 = 2, 03 1, 24 XDU + e 14, 40 2, 86 DII + e 0, 02 63, 63 XIII + e 0, 35 162, 05 XIV + e 0, 87 +332, 35 XTR + e 1, 13 766, 265 XIV + e 4, 70 Išvada: įtraukiam veiksnį XDU
Forward metodas Antras žingsnis ¡ ¡ ¡ YPVM = 11121, 59+ 1, 47 XDU t -3, 47 23, 70 YPVM = -4597, 70+ 1, 73 XDU t -3, 47 14, 93 YPVM = -62, 48+ 1, 24 XDU t -0, 66 15, 18 t 32; 0, 05/2 = 2, 03 -630, 47 XTR+ e -7, 59 Koreg. R 2 =0. 94 - 556, 48 Dkrizė +e -5, 13 Koreg. R 2 =0. 91 + 157, 882 DIV +e 2, 15 Koreg. R 2 =0. 87
Backward procedūra ¡ Pirmas žingsnis Apskaičiuojame dauginę regresiją, įtraukdami visą kintamųjų sąrašą = f(x 1, x 2, . . . xk) l Surandame visų įverčių apskaičiuotas statistikas: 1 tb 1, 1 tb 2. . . 1 tbk l Išrenkame mažiausią 1 tbj statistiką Palyginame gautą statistikos 1 tbj reikšmę su teorine tn-k-1, α/2 reikšme Jeigu 1 tbj tn-k-1, α/2 , j veiksnio į regresiją netraukiame l
Backward procedūra ¡ Antras žingsnis l l l Apskaičiuojame dauginę regresiją be veiksnio j = f( x 1, x 2. . xj-1, xj+1, . . . xk) Apskaičiuojame visų įverčių statistikas 2 tb 1 , 2 tb 2 2. . . tbk Randame mažiausią 2 tbs statistiką Palyginame gautą 2 tbs su teorine statistikos tn-k-1, /2 reikšme Jeigu 2 tbs tn-k-1 α/2 , s veiksnį pašaliname iš regresijos
Backward procedūra ¡ Backward procedūra baigiama: kai visos apskaičiuotos įverčių t statistikos didesnės už teorinę reikšmę tn-k-1 , α/2
STEPWISE-kombinuota procedūra ¡ ¡ Stepwise –forward procedūros žingsnis pradedamas, kaip Forward procedūroje, ir tęsiamas, kaip Backward. Stepwise - backward procedūros žingsnis pradedamas, kaip backward procedūroje, ir tęsiamas, kaip Forward
Veisnių statistinio nereikšmingumo priežastys ¡ Objektyvi priežastis: l ¡ Veisnys nedaro įtakos nagrinėjamam reiškiniui Modelio netikslumai: l Modelio formos parinkimo netikslumai ¡ l Neteisingai parinkta veiksnio priklausomybės matematinė išraiška (pvz. įtraukta tiesine forma, o sąveika yra netiesinio pavidalo) Pažeista multikolinearumo prielaida ¡ Būtina patikrinti veiksnių multikolinearumą
Nereikšmingas laisvasis narys b 0 ¡ ¡ ¡ Regresijos be laisvojo nario koeficientas R 2 skaičiuojamas pagal skirtingas formules, todėl jų negalima lyginti Regresijos lygties be laisvojo nario paklaidų suma ir paklaidų vidurkis gali būti nelygūs 0, t. y netenkinama klasikinė regresijos prielaida. Todėl neverta skubėti eliminuoti laisvąjį narį iš regresijos lygties. Apskaičiavus regresiją be jo, būtina patikrinti ar paklaidų vidurkis lygus 0.
- Slides: 19