statistik ve Biyoistatistie Giri Kaynak Kitaplar Merkez Ktphanede
İstatistik ve Biyoistatistiğe Giriş
Kaynak Kitaplar (Merkez Kütüphanede Okumak Üzere Ayrılmış) 1. WA 900 D 184 1991 Daniel, Wayne W. Biostatistics: A Foundation for Analysis in the Health Sciences 2. WA 950 D 272 2004 Dawson, Beth Trapp, Robert G. Basic & Clinical Biostatistics Lange Medical Books/ Mc. Grow-Hill New. York 2004 3. QT 260 A 456 2000 Alpar R. Spor bilimlerinde uygulamalı istatistik Nobel yayın , Ankara, 2000. 4. WA 950 A 733 2002 Armitage, P. Statistical Methods in Medical Research Blackwell Science Oxford 2002 5. WA 950 G 545 2002 Glantz, Stanton A. Primer of Biostatistics Mc. Grow-Hill New. York 2002
• • Dersin amacı: Bazı faktörler ve hastalıklar arasındaki ilişkiyi açığa çıkarmak Hastalığın etiyolojisini açıklamak(hastalıklara neden olan faktörler) Hastalık oluş sayısını tahmin etmek Sağlık literatürünü okumak, anlamak ve yorumlayabilmek
• Makale hakkında fikir sahibi olunabilmesi ve değerlendirme yapılabilmesi için yeterli biyoistatistik bilgisine ihtiyaç vardır. • Sağlık araştırmalarının çoğunda planlama, yürütme ve yorumlamada istatistiksel yöntemler kullanılmaktadır.
Planlama • Kaç kişi/birey tedaviye alınmalıdır? • Hastalar tedavilere nasıl dağıtılmalıdır? • Bağımlı değişkeni etkileyebilecek diğer değişkenler nelerdir?
Yürütme • Çalışma hangi şartlar altında yürütülmelidir? • Eşleştirme gerekli midir? • Körleme (tek körleme, çift körleme) gerekli midir? • Kontrol grubuna gerek var mıdır? • Plasebo etkisi dikkate alınmalı mıdır? • Hangi deneysel tasarım yöntemi daha uygundur?
Yorumlama Örnek 1: Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı Sağlıklı kadınların kan grupları dağılımı Kan Grubu Sayı % A 32 58. 2 A 75 51. 7 AB 4 7. 3 AB 8 5. 5 B 8 14. 5 B 19 13. 1 O 11 20. 0 O 43 29. 7 Toplam 55 100. 0 Toplam 145 100. 0
Herhangi bir konu hakkında ►Bilgi toplamak, ►Toplanan bilgileri düzenlemek, ►Çözümlemek ve ►Yorumlamak için gerekli yöntemler topluluğudur.
Biyoloji, tıp ve diğer sağlık bilimlerinde; ►Araştırma düzeninin oluşturulması, ►Verilerin elde edilmesi ve ►Değerlendirilmesi ile uğraşan bilim dalıdır.
Tanımlayıcı İstatistik Çıkarımsal İstatistik (Descriptive Statistics) (Inferential Statistics) olarak iki ana gruba ayrılır.
ØVerilerin özetlenmesi, ØSınıflandırılması, ØTablo ve grafiklerle sunulmasını içerir.
Veri (Data) : İncelenen konuya açıklık getirmek amacıyla toplanan bilgiler, belgeler, ölçümler, . . . vb. Denek : Bireysel veri kaynağı (Subject) Değişken: (Variable) Deneklerin herhangi bir özelliğine ilişkin verilere değişken denir. Örneğin, boy uzunluğu, yaş, öğrenim düzeyi, cinsiyet vb.
Kitle (Population) : Araştırma kapsamına giren, aynı özellikleri taşıyan deneklerin tümüne denir. Örneklem: Bir kitleden, kitleyi temsil edecek (Sample) biçimde seçilen alt gruba denir. Parametre: Kitlenin özelliklerini tanımlamak için (Parameter) kullanılan ölçülere denir. İstatistik : Örneklemin özelliklerini tanımlamak (Statistics) için kullanılan ölçülere denir.
Niceliksel (Quantitative) Niteliksel (Qualitative) Nicelik belirten (ölçülerek yada sayılarak elde edilen) verilerdir. Bireylerin sahip olduğu belli özelliklerin sınıflara ayrılarak belirtildiği verilerdir. Örneğin, yaş, ağırlık, boy gibi. Örneğin, cinsiyet, medeni durum, başarılı-başarısız gibi.
Sıralanabilir Sınıflanabilir (Ordered) (Nominal) Nitelik verilerde belli bir sıralama söz konusu ise (kötüorta-iyi-mükemmel gibi) bu tür verilere sıralanabilir nitelik veriler denir. Nitelik verilerde belli bir sıralama yoksa bu tür verilere sınıflanabilir nitelik veriler denir. Örneğin cinsiyet, medeni durum gibi. İki Sınıflı Çok Sınıflı
Kesikli Sayısal Discrete numeric variable Sürekli Sayısal Continuous numeric variable Belirli bir aralıktaki tam sayıları alan veri türüdür. Örnek: Sınıftaki öğrenci sayısı, Ölçümle belirtilirler ve bir aralıktaki bütün değerleri alırlar. Örnek: Boy uzunluğu, yaş, günlük kalsiyum tüketim miktarı (mg) gibi. Aralık Ölçekli Interval Scale Oran Ölçekli Ratio Scale
Örneklemden elde edilen bulgular yardımıyla; • Kitle hakkında kestirimde bulunma, • Hipotezleri test etme, • Karara varma, işlemlerini içerir.
Örneklem : Bir kitleden, kitleyi temsil edecek (Sample) biçimde seçilen alt gruba denir. Örnek : Örnekleme seçilmiş denek (Sample) Örnekleme : Kitleden örnek seçmek amacıyla (Sampling) geliştirilen çeşitli yöntemler vardır. Uygun yöntemlerle kitleden örneklem seçme işlemine “örnekleme” denir.
Doğruluk : Ölçülen ya da hesaplanan değerin (Accuracy) kendi gerçek değerine olan yakınlığı Kesinlik : Aynı özelliğin bir çok kez ölçümü (Precision) sonucunda elde edilen değerlerinin birbirine yakınlığı
Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Merkezi Eğilim Ölçüleri Konum Ölçüleri Yaygınlık Ölçüleri
Yer Gösteren Ölçüler ØBir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır. ØBu ölçüler merkez ölçüleri ya da ortalama ölçüleri olabileceği gibi, dağılımdaki herhangi bir noktayı da gösteren ölçüler olabilir.
Merkezi Eğilim (Ortalama) Ölçüleri Aritmetik Ortalama Ortanca Tepe Değeri Oran Geometrik Ortalama Konum Ölçüleri Çeyrekler Yüzdelikler Harmonik Ortalama
Aritmetik Ortalama Ø Aritmetik ortalama, veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir. Örnek 2: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması = 12 + 13 + 11 + 12 + 14 + 29 + 12 + 13 + 11 = 14, 11 yıl 9
Ø Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir. Bu dağılımda 29 yaş aşırı bir değerdir ve ortalamayı etkiler ve aritmetik ortalamanın yüksek çıkmasına neden olur.
Ortanca Bir veri grubu küçükten büyüğe sıralandığında, terim sayısı tek ise ortadaki sayı, çift ise ortadaki iki sayının toplamının yarısıdır. Örnek 3: 9 kişinin yaşları küçükten büyüğe doğru sıralandığında 11, 12, 12 , 13, 14, 29 Gözlem sayısı tektir. Ortanca =(9+1)/2=5. değer
Denek sayısı çift olduğunda Denek sayısı 10 ve yaşlar aşağıdaki gibi olsaydı 12, 13, 11, 12, 14, 29, 12, 13, 15 11 Yaşlar sıraya dizildiğinde 11 11 12 12 12 13 13 14 15 29 Denek sayısı çift olduğundan Ortanca (n/2)=5. ve ortalamasıdır. (n+2)/2=6. değerlerin 12 + 13 Ortanca = = 12, 5 2
Ortanca, dağılımın orta noktası hakkında bilgi verir. ve aşırı değerlerden etkilenmez. Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur.
Tepe Değeri • Tepe değeri dağılımda en fazla tekrarlanan değerdir. Örnek 4: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.
• Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur. • En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en yüksek sayıya sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. • Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.
Oran Nitelik veriler; aritmetik ortalama, ortanca, tepe değeri gibi ortalama ölçüleri ile özetlenmez. Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler.
Örnek 5: Beslenme ve Diyetetik Dönem IV Öğrencilerinin Cinsiyet Dağılımı Cinsiyet Sayı Yüzde (Oran) Erkek 50 41, 67 Kız 70 58, 33 Toplam 120 100 Oran farklı bir ortalama ölçüsü olarak algılansa da bir aritmetik ortalamadır.
A Okulunda Öğrencilerin Ağırlıklarının Dağılımı Erkek Kız Sayı % Zayıf 80 15, 8 45 14, 3 Normal 225 44, 6 190 60, 3 Hafif Şişman 147 29, 1 52 16, 5 Şişman 53 10, 5 28 8, 9 Toplam 505 100, 0 315 100, 0
Konum Ölçüleri Çeyrekler Dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, 1. Çeyrek (Ç1) Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür. 2. Çeyrek (Ç2) 3. Çeyrek (Ç3) Değerlerin %75’i Değerlerin %50’si Ç3’e eşit ya da Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır.
Örnek 6: 15 kişinin yaşları aşağıdaki gibidir. 6 2 3 5 5 7 10 9 7 3 5 8 7 5 5 Yüzdelikleri bulurken dağılımdaki değerler küçükten büyüğe sıraya dizilir 2 3 3 5 5 5 6 7 7 7 8 9 10 1. Çeyrek (25. Yüzdelik)=0, 25 x 15=3, 75. gözlemin değeridir. 1. Çeyrek 3. İle 4. arasında 4. ’ değere daha yakındır. Bu durumda Ç1=3. Değer + (4. Değer – 3. Değer)0. 75 3. Çeyrek (75. Yüzdelik)=0, 75 x 15=11, 25. Gözlemin değeridir. 3. Çeyrek 11. Ve 12. Değerler arasındadır. Örneğimizde 11. ve 12. değer aynı olduğundan Ç3=7
Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler. Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y 30) eşit ya da ondan küçüktür.
Örnek 7: 24 bebeğe ait doğum ağırlıkları aşağıdaki gibidir Gözlem Ağırlık 1 2850 7 3150 13 3250 19 3700 2 2900 8 3200 14 3400 20 3800 3 2930 9 3200 15 3450 21 3900 4 2980 10 3200 16 3500 22 4100 5 3000 11 3250 17 3500 23 4400 6 3100 12 3250 18 3600 24 4500
24 bebeğin doğum ağırlığına ilişkin 30. Yüzdelik(Y 30) bulunmak istenirse, Sıraya dizilmiş bebek ağırlığı değerlerinde 24 x 0. 30 = 7. 2 olduğundan Y 30, 7. ve 8. değerler arasındadır. 7. gözlem=3150 gr 8. gözlem=3200 gr 50 x 0. 20=10 gr Y 30 = 3150+10=3160 gr
24 bebeğin doğum ağırlığına ilişkin 60. Yüzdelik(Y 60) bulunmak istenirse, Sıraya dizilmiş bebek ağırlığı değerlerinde 24 x 0. 60 = 14. 4 olduğundan Y 60, 14. ve 15. değerler arasındadır. 14. gözlem=3400 gr 15. gözlem=3450 gr 50 x 0. 40=20 gr Y 60 = 3400+20=3420 gr
Kaynak: Kronik Hastalığın Önlenmesi ve Sağlığın Geliştirilmesi İçin Ulusal Merkez ile birlikte Sağlık İstatistikleri İçin Ulusal Merkez tarafından geliştirilmiştir. Yayınlanma: 30 Mayıs 2010 (ABD)
Yaygınlık Ölçüleri ØBir dağılımdaki değerlerin, birbirlerine ya da kendi ortalamalarına göre farklılıklarını gösterir. ØBu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir.
Dağılım I 6 15 6 2 Dağılım II 3 7 6 5 6 9 Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I, dağılım II’ye göre daha yaygındır.
Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler ; ØDağılım (Değişim) Aralığı ØStandart Sapma ØVaryans ØÇeyreklikler Arası Genişlik ØÇeyrek Sapma ØDeğişim Katsayısı
Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür. Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur. R ile gösterilir R= En Büyük Değer-En Küçük Değer
ØDağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. ØDağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür. ØGözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez.
Standart Sapma ØBir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. ØDağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır. ØDağılımın yaygınlığı arttıkça standart sapma büyür. ØDağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır.
Standart Sapma ØStandart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. ØStandart sapma, aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılır. ØÇarpık dağılımlarda kullanılması önerilmez!
Standart Sapma N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Kitle S. Sapması Örneklem S. Sapması
Örnek Dağılım I için Standart Sapma Eşitliğine göre standart sapma hesaplanması 6 15 6 2 0 -5 0 25 0 9 0 81 0 -4 0 16 122
Örnek Dağılım II için Standart Sapma Eşitliğine göre standart sapma hesaplanması 3 -3 1 9 1 7 6 5 0 -1 0 1 6 9 0 3 0 9 20
Varyans Standart sapmanın karesine varyans denir (s 2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz.
Çeyreklikler Arası Genişlik Dağılımdaki verilerin ortadaki 0. 50 ‘sinin yer aldığı aralığı belirlemek için kullanılır. ÇAG = Ç3 – Ç1 Örnek 6’da Ç1=4, 5 ve Ç3=7 bulunmuştu. ÇAG = 7 – 4, 5 = 2, 5 Değerlerin yarısı 2, 5 birimlik bir aralık içindedir.
ØÇeyreklikler arası genişlik aşırı uç değerlerden etkilenmez. ØÇünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir. ØÖzellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır. ØEğer incelenen dağılım simetrikse 25. ve 75. Yüzdelikler ortancadan eşit uzaklıktadır.
Çeyrek Sapma ØBu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür. ØÇeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. ØÖzellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.
Örnek 8: Örnek 6’da Ç1=4, 5 ve Ç3=7 bulunmuştu. Bu değer, Ç1 ve Ç3’ün ortanca dan ortalama olarak 1, 25 birim farklı olduğunu gösterir.
Değişim Katsayısı v. Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir. v. Aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. v. Standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak her zaman doğru değildir. İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız.
Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısını hesaplamalıyız. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir.
DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım II Dağılım I’deki değerler ortalamaya göre %82, 3’lük bir değişim gösterirken, dağılım II’deki değerler %33, 3’lük bir değişim göstermektedir.
Örnek 9: 10 bireyin boy ölçüleri cm. ve m. cinsinden aşağıda verilmiştir: SS DK 160 180 165 174 190 182 155 165 171 160 170. 2 1. 702 11. 23 0. 1123 6. 6 Standart sapmalar farklı olmasına rağmen değişim katsayıları aynıdır.
- Slides: 58