2 R Belirleme Katsays R 2 u Regresyon
2 R Belirleme Katsayısı
R 2 u Regresyon denklemi ile belirlenen bağımlı değişkenliğin toplam değişkenliğe oranı: R 2 = ___SS___ RSS + SS SS: Regresyonun Kareleri Toplamı RSS: Kalanların Kareleri toplamı (RSS) y değerlerinin ortalaması Hesaplanan y değeri Gözlemlenen y değeri
R 2 u R 2 = 1 uydurulan eğri örneklemdeki tüm bağımlı değişken değerlerindeki farklılaşmayı açıklayabiliyor. u R 2 = 0 Regresyon denklemi verideki değişkenliği hiçbir şekilde açıklamıyor.
R 2 Uyarılar u Yüksek R 2 değerleri geçerli bir ilişki olduğunu göstermez. Ülkedeki gazete fiyatlarıyla, hacca giden insan sayısı arasında yüksek R 2’li bir ilişki bulunabilir ancak bu hacca gidenlerin gazete fiyatlarındaki değişimden dolayı olduğunu söyleyemeyiz. Bu durumda R 2’nin hiçbir belirleyici gücünden söz edemeyiz.
u u R 2 değerleri aşağıdaki 4 veri seti için de aynıdır. Her zaman için veriyi çizin. R 2 = ___SS___ RSS + SS
R 2 Değeri Anlamlı mı? İstatistiksel Anlamlılık Seviyesi Örneklem %10 Büyüklüğü n %5 %1 3 0. 9756 0. 9938 0. 998 4 0. 810 0. 903 0. 980 5 0. 65 0. 77 0. 92 25 0. 11 0. 16 0. 26 100 0. 03 0. 04 0. 07 Doğrusal y = ax + b modelleri için geçerlidir.
Anlamlı bir R 2 modelin kullanışlı, yararlı olduğu anlamına gelmez. İki nicelik arasındaki gayet önemsiz gerçek bir ilişki yeterince yüksek sayıda gözlem yapıldığı takdirde istatistiksel olarak anlamlı hale gelebilir. Diğer taraftan az sayıdaki veri yüzünden güçlü bir ilişki istatistiksel olarak anlamlı olmayabilir. u R 2’nin yüksek ve istatistiksel olarak anlamlı olması istenilen bir şeydir ancak bu durumda bile tahmin edilen değerlerin belirsizliği gene de yüksek olabilir. R 2’nin büyüklüğü tahmin edilen niceliklerin ne kadar doğru olduğu hakkında bir bilgi vermez. u
R 2 nin büyüklüğü x değişkeninin aralığına bağlıdır. u Bağımsız değişkenin değişim aralığı azaldıkça R 2’nin değeri de azalır. (Diğer herşey eşit alınıp gerçek modelin veriye uydurulduğunu varsayarak)
u Yüksek R 2 verinin gerçekçi olmayan geniş bir x aralığında toplandığına işaret edebilir.
Modelle Veri Uyumunu İncelemenin Diğer Yolları u Her zaman için veriyi ve uydurulan modeli grafiksel olarak kontrol etmek u Tahmin edilen değerin standard hatasını veya güvenilirlik aralığını hesaplamak
Excel’de Regresyon u Araçlar/Veri Çözümleme/Regresyon
Otokorelasyonun Regresyona Etkisi u Vaka: Şüpheli bir laboratuar deneyi: – Öğrencilere x faktöründe 1 birim artışın y faktörünün 0. 5 birim arttığını göstermek için yapılıyor (Model: y=a+0. 5 x). Aşağıda verilen x değerlerine karşılık öğrenciler y değerlerini ölçüyorlar. – Regresyon sonuçları y = 21. 04 +0. 12 x ve R 2 = 0. 12 – Eğimin güvenilirlik aralığı -0. 12 -0. 31 elde edilmesi beklenen 0. 5’i içermiyor. Ayrıca bu aralık 0’ı da kapsadığından x ve y’nin ilgili olduğundan emin bile değiliz.
Oto Korelasyonun Etkisi y = ax + b a = 0. 12 [-0. 12, 0. 31] 0. 5 olması gereken bu değer hem 0. 5’e uzak hem de aralık 0’ı kapsıyor. Deneyler rastgele sırayla yapılması gerekirken sırayla, önce x=0, sonra x=1 şeklinde yapılmış.
Vaka İnceleme
Otokorelasyonun Regresyona Etkisi y = b 0 + b 1 x u y i = m + e i = b 0 + b 1 x i + e i u ei, kalanlar bağımsız mı? u Eğer ei’nin değeri ei-1 ei-2 ile ilgili değilse bağımsızdır. Eğer ilgiliyse bunu aşağıdaki şekilde ifade edebiliriz: ei= pei-1 +ai ai : bağımsız ve normal dağılım gösteren hata p: otokorelasyon katsayısı Eğer p = 0 ise ei bağımsız Eğer 0<p≤ 1 ise otokorelasyon var. Ardarda gelen ei değerlerinin birbirine benzediğine işaret. u
Otokorelasyonun Regresyona Etkisi Ardarda yerine koyarak: Terimlerin derecelerini sıralayarak yazarsak:
a’nın varyansı: e’nin varyansı: 0<p<1 için, p kuvvet serisi 1/(1 -p 2) ‘ye eşittir.
Bu eşitliğe göre eğer pozitif oto korelasyon varsa ve farkına varılıp düzeltilmezse, hesaplanan varyans gerçek varyansın 1/ (1 -p 2) katı olacaktır.
Otokorelasyon Testi-Durbin ve Testi. Watson testi Kalanlar içinde bir otokorelasyon olup olmadığını nasıl söyleriz? ei = yi - ˆyi yi: Ölçülen (gözlemlenen) değer ˆyi: Hesaplanan y değerleri Durbin ve Watson D istatistiği için en üst (d. U)ve en alt sınır (d. L) değerlerini belirlediler. Eğer d. L < D < d. U ise , test sonuçsuz D> d. U ise p = 0 (otokorelasyon yok) D< DL ise p>0 (otokorelasyon mevcut) Eğer korelasyon negatifse, bu durumda D yerine 4 -D değeri hesaplanır ve karşılaştırılır.
11 0. 93 1. 32
Durbin ve Watson İstatistiğinin Kritik Değer Tablosu: http: //www. stanford. edu/~clint/bench/dwcrit. htm
Örnek Yandaki veriye lineer regresyon uygulanmıştır ve kalanların kareleri toplamı tabloda verilmiştir. Regresyonun olası bir otokorelasyondan etkilendiği söylenebilir mi? n = 20
Örnek
Örnek D = 1. 08 u d. U =1. 41 u d. L = 1. 20 1. 08 < 1. 20 u Kalanlar pozitif korelasyon gösteriyorlar. u
- Slides: 26