BYOSTATSTK KONUM VE YAYGINLIK LLER MERKEZ LLER EYREK
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof. Dr. İ. Safa GÜRCAN
DAĞILIMI TANIMLAYICI ÖLÇÜLER 1 - YER GÖSTEREN ÖLÇÜLER 2 - YAYGINLIK ÖLÇÜLERİ a)Standart Sapma b) Standart Hata Merkezi Ölçüler: Ortalamalar Çeyrek ve Yüzdelikler c) Varyasyon katsayısı d)Varyans
ORTALAMALAR Dağılımın orta noktasını gösteren ve incelenen bireylerin değerlerinin tek değerle temsil edilmesini sağlayan ölçüler Ortanca (Medyan) Aritmetik Ortalama Tepe Değeri ORTALAMA
UYGULAMA • SINIFLANDIRILMIŞ VERİLERDE ARİTMETİK ORTALAMANIN HESAPLANMASI Yaş (Yıl) 15 -19 20 -24 25 -29 30 -34 35 -39 40 -44 45 -49 fi 50 75 100 150 90 70 45 A. O: Aritmetik ortalama bi: Çalışma birimi, frekansı en yüksek olan sınıfın karşısına 0 yazılır. A: Çalışma biriminde sıfıra karşılık gelen sınıfın, sınıf değeridir. C: Sınıf Aralığı n: Denek Sayısı
UYGULAMA • SINIFLANDIRILMIŞ VERİLERDE ARİTMETİK ORTALAMANIN HESAPLANMASI Yaş (Yıl) 15 -19 20 -24 25 -29 30 -34 35 -39 40 -44 45 -49 fi bi f ib i 50 75 100 150 90 70 45 -3 -2 -1 0 1 2 3 -150 -100 0 90 140 135 A. O: Aritmetik ortalama bi: Çalışma birimi, frekansı en yüksek olan sınıfın karşısına 0 yazılır. A: Çalışma biriminde sıfıra karşılık gelen sınıfın, sınıf değeridir. C: Sınıf Aralığı n: Denek Sayısı
ORTANCA • Dağılımın orta noktasındaki değerdir. • Dağılımdaki « aşırı » değerlerden etkilenmez. • Sınıflanmamış Değerlerde: • Denek Sayısı Tek • Denek Sayısı Çift (n+1)/2 ‘nci değer n/2’ nci değer ile (n+2)/2’ nci değerin ortalaması
UYGULAMA • SINIFLANDIRILMIŞ VERİLERDE ORTANCA’NIN HESAPLANMASI Yaş (Yıl) f 15 -19 20 -24 25 -29 30 -34 35 -39 40 -44 45 -49 50 75 100 150 90 70 45 L: Ortancanın içinde bulunduğu sınıfın ara değeridir. Yf: Ortancanın içinde bulunduğu sınıfın bir üstündeki sınıfın yığılımlı frekansı f: Ortancanın içinde bulunduğu sınıfın frekansı C: Sınıf Aralığı n: Denek Sayısı
İzlenecek Adımlar: Yaş (Yıl) f 15 -19 50 20 -24 75 25 -29 100 30 -34 150 35 -39 90 40 -44 70 45 -49 45 Toplam 580 Yf 50 125 225 375 465 535 580 Ortanca Değer: 31, 67 1. Yığılımlı Frekans Tablosu hazırla 2. Ortancanın bulunduğu sınıfı belirleyip SAD’ i bul (L) 3. Ortancanın içinde bulunduğu sınıfın bir üstündeki yığılımlı frekansı bul (Yf) 4. Ortancanın içinde bulunduğu sınıfın frekansını bul (f) 5. Sınıf Aralığını bul (C) 6. Değerleri Formüle Yerleştir n/2: 290 Yf: 225 F: 150 C: 5 L: 29, 5
Sınıflanmış Verilerde Tepe Değeri Sınıflanmış Verilerde tepe değeri en fazla frekansa sahip olan sınıfın sınıf değeridir.
Çeyrek Ve Yüzdelikler • Ortalamalar • Çeyrek ve Yüzdelikler Dağılımın orta noktasını gösterir Dağılımın herhangi bir noktasını gösterir • Dağılımı parçaya bölen bir merkezi eğilim ölçüsüdür. • Ör. • Birinci Çeyrek • Üçüncü Çeyrek %25. değer %75. değer
UYGULAMA Sınıflanmış Verilerde Çeyrek ve Yüzdeliklerin Hesaplanması Deneklerin %35 ‘ i hangi değerden daha az değer almıştır? «Den az» ; sayı ve yüzdeleri herhangi bir SAD’ nden daha az alan kaç denek olduğunu ve bunların toplam denek sayısının yüzde kaçın olduğunu gösterir. X 1: Verilen Yüzde X 2: «Den az» yüzde kolonunda X 1 ‘ in düştüğü aralığın üzerindeki değer X 3: «Den az» yüzde kolonunda X 1’ in düştüğü aralığın altındaki değer X: Hesaplanacak Değer X 2 SAD: X 2’nin sınıf ara değeri X 3 SAD: X 3’ ün sınıf ara değeri
Deneklerin %35 ‘ i hangi değerden daha az değer almıştır? Yaş f 15 -19 50 20 -24 75 25 -29 100 30 -34 150 35 -39 90 40 -44 70 45 -49 45 Toplam 580 1. Sınıflar ve frekanslar yazılır 2. Sınıf Ara Değerleri (SAD) bulunur 3. «Den az» kolonu geliştirilir. Her SAD’nden az değer alan kaç denek olduğu sayı olarak, sonra da yüzde olarak yazılır. …den az Sınıf Ara Değeri Sayı Yüzde 14, 5 19, 5 24, 5 29, 5 34, 5 39, 5 44, 5 0 50 125 225 375 465 535 0 8, 62 21, 55 38, 79 64, 66 80, 17 92, 24 X 1: 35 X 2 SAD: 24, 5 X 2: 21, 55 X 3 SAD: 29, 5 X 3: 38, 79 X = 28, 40
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir.
Dağılım I 6 15 6 2 Dağılım II 3 7 6 5 6 9 Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I dağılım II’ye göre daha yaygındır.
Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler * Dağılım Aralığı * Standart Sapma * Varyans * Değişim Katsayısı
Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür. Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur. R ile gösterilir R= En Büyük Değer-En Küçük Değer
Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür. Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez.
Standart Sapma Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır.
ØStandart sapma büyüdükçe dağılımın yaygınlığı artar. Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır. ØStandart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. ØStandart sapmanın, ortalama ölçüsü olarak aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılması önerilmektedir. ØÇarpık dağılımlarda kullanılması önerilmez.
Standart sapma s ile gösterilir. Sınıflandırılmış ve sınıflandırılmamış verilerde farklı formüllerle hesaplanır. Sınıflandırılmamış verilerde standart sapma Örnek: Yukarıda ortalama, ortanca ve tepe değerleri aynı olan dağılımların standart sapmasını hesaplayalım.
Dağılım I için Standart Sapma Bu dağılımdaki değerler aritmetik ortalama etrafında ortalama ± 4, 94 birimlik değişkenliğe sahiptir.
Dağılım II için Standart Sapma Bu dağılımdaki değerler aritmetik ortalama etrafında ortalama ± 2 birimlik değişkenliğe sahiptir. Buna göre ikinci dağılımın yaygınlığı birinciye göre oldukça düşüktür.
Varyans Standart sapmanın karesine varyans denir (s 2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz.
Standart Sapma ve Varyans
Değişim Katsayısı (DK) Standart sapma bir dağılımın yaygınlığını gösteren ölçülerden birisidir. Ancak standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak güçtür. İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız.
Değişim Katsayısı
Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısını hesaplamalıyız. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir.
DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım II Dağılım I’deki değerler ortalamaya göre %82, 3’lük bir değişim gösterirken, dağılım II’deki değerler %33, 3’lük bir değişim göstermektedir.
Çarpıklık (Skewness) • Normal dağılımda Çarpıklık katsayısı 0’dır. Uygulamalarda ± 1 oldukça, ± 2 kabul edilebilir değerdir.
Basıklık (Kurtosis) • Normal dağılımda Çarpıklık katsayısı 0’dır. Uygulamalarda ± 1 oldukça, ± 2 kabul edilebilir değerdir. Pozitif yüksek değer dikliği, negatif düşük değer basıklığı gösterir.
- Slides: 31