lmeyle lgili Temel statistikler Bir eitimci olarak niin
Ölçmeyle İlgili Temel İstatistikler
Bir eğitimci olarak niçin belli düzeyde istatistik bilmeliyiz? • Günlük hayatta çevremizde olup anlayabilmek ve yorumlayabilmek için bitenleri izleyebilmek, • Borsa düşünce dolara ne oluyor? • Seçimleri kim kazanacak? • Şampiyon kim olacak? • Sınıftaki en başarılı öğrenci kim? • Sınavda ilk yüzde elliye kimler giriyor? • Elde ettiğimiz verilerle ilişkiler kurar, sonuçlar çıkarmaya çalışırız! 10/31/2020 2
İstatistik Nedir? • İstatistik, belli amaçlar için veri toplama, toplanan verileri düzenleme, çözümlemenin yanı sıra yorumlama teknik ve yöntemleri olarak tanımlanabilir. • Nitel ve nicel değerlerle ilgilenir. • Nicel verilerin ve bilgilerin düzenlenmesi, özetlenmesi ve açıklanması betimsel (descriptive) istatistiğin uğraştığı alandır. • Nitel verilerin yorumlanması ve betimsel istatistik sonuçları kullanılarak bir olay veya olgu hakkında varsayımda bulunmak, genellemeler yapmak sonuç çıkarıcı (inferential) istatistiktir. 10/31/2020 3
• • Bir çalışma sonunda toplanan veriler ham verilerdir. Verileri anlamlı hâle getirmek için toplanan veriler; 1. 2. 3. 4. 5. Sözel ifadelerle açıklanır. Tablolar oluşturularak sunulur. Grafiklerle ifade edilir. Veriler üzerinde bazı istatistiksel hesaplamalar yapılır. Bu sayılan yöntemlerden birkaçı birden kullanılır. Yukarıda sayılan yöntemlerden hangisinin kullanılacağı; ne tür ölçek kullanıldığına ve ne tür veri elde edildiğine bağlıdır. 10/31/2020 4
• Evren-Genel Uzay • Araştırmanın yapıldığı, verilerin toplanıldığı, gözlemlerin yapıldığı alandaki tüm nesneler veya bireyler evreni oluşturur. • Örneklem • Evrenin içinden ayrıntılı olarak üzerinde çalışmak amacıyla seçilen bir grup nesne veya birey, çalışmanın örneklemini oluşturur. Örneklem evrenin bütün özelliklerini yansıtmalıdır. • Örneklem seçimi çeşitli tekniklerle yapılır. Bütün bu teknikler araştırmanın türüne ve amacına bağlıdır. • Ölçmede kesinlik • Kullanılan ölçeklerin hassasiyetine bağlı olarak yapılan ölçümlerin kesinlik dereceleri de değişmektedir. 10/31/2020 5
Verilerin Özetlenmesi ve Grafikle Gösterilmesi • Frekans Dağılımları – Basit Frekans Dağılımı – Gruplandırılmış Frekans Dağılımı • Verilerin Grafikle Gösterilmesi – Bar Grafik – Histogram – Frekans Poligonu – Çizgi Grafiği – Pasta ya da Daire Grafiği 10/31/2020 6
Frekans Dağılımları • Gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığını “ham veri” olarak kabul edilir. • Ham verilerin düzenlenmesinde, özetlenmesinde, anlamlı ve anlaşılır hale getirilmesinde en sık kullanılan yöntemlerden biri, bu verilerin frekans dağılımlarının verilmesidir. • Frekans dağılımlarının verilmesi ile karışık halde bulunan puanlamalar derlenir, puanlar yüksekten düşüğe ya da tersi biçimde sıralanabilir ve puanlar hakkında yorumlar yapılabilir. 10/31/2020 7
Frekans Dağılımları • Ham Puanlar • Sıralanmış Puanlar 10/31/2020 8
Basit Frekans Dağılımı • Basit frekans dağılımı, her puan değerinin kaç sefer tekrarlandığını gösterir. Frekans “f” harfi ile gösterilir. • Frekans tablosu hazırlanırken; tüm puanlar gösterilir. İstenirse öğrencilerin almadıkları diğer puanlar da verilebilir. • Toplamalı frekans, frekans değerlerinin arda toplanması ile elde edilir. 10/31/2020 9
10/31/2020 10
Gruplandırılmış Frekans Dağılımı • Gruplandırılmış frekans dağılımında, belirli puan kategorilerinin oluşturulması için puanlar arasındaki ranjlar ya da aralıklar dikkate alınır. • Burada grup ya da kategorilerin aralığını gösteren “aralık katsayısı”nın bulunması önemlidir. 10/31/2020 11
Gruplandırılmış Frekans Dağılımı • Gruplandırılmış frekans dağılımını belirlemede “aralık katsayısı”nı bulmak için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini grup sayısına bölünür. Grup ya da kategori sayısı 5, 8, 10, 12 ya da 15 olarak alınabilir. • Az sayıda kategori oluşturma veri kaybına, çok sayıda kategori oluşturma ise işlemlerin güçleşmesine yol açabilir. 10/31/2020 12
10/31/2020 13
10/31/2020 14
10/31/2020 15
Temel Kavramlar 10/31/2020 16
Temel Kavramlar 10/31/2020 17
Bar Grafik İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. Bar diyagram, birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır. 10/31/2020 18
Histogram bar grafiğe benzer. Ancak, bar grafik kategorik ya da kesikli grup aralıklarıyla çizildiği halde, histogram sürekli grup aralıklarıyla çizilir. Histogramda dikey eksen her zaman sıfır değeriyle başlarken, yatay eksen sıfır ya da büyük bir değerden başlayabilir. 10/31/2020 19
Frekans Poligonu Histogramda verilen puan aralıklarının orta noktalarının birleştirilmesiyle oluşur. Puan aralıkları ve orta noktalar 10/31/2020 20
Çizgi Grafiği Frekans poligonunun iki ucu yatay eksene değmediği zaman çizgi grafiği oluşur. Çizgi grafiği sürekli verilere uygulanabilir. Puanlar ya da puan aralıkları yatay eksende, bunlara ait frekanslar dikey eksende yer alır. 10/31/2020 22
Pasta ya da Daire Grafiği Özellikle değişkenlerin yüzdelik değerlerini göstermede sıklıkla kullanılan bir grafik türüdür. 10/31/2020 23
Merkezi Eğilim (Yığılma) Ölçüleri • Aritmetik Ortalama • Mod (Tepe Değer) • Medyan (Ortanca) 10/31/2020 24
Aritmetik Ortalama Puan toplamlarının veri sayısına bölümüdür. Örnek: 95, 88, 73, 67, 59, 46, 35, 26, 23 Ortalama: 56. 88 10/31/2020 25
Mod (Tepe Değer) • Mod ya da tepe değer, bir puan dağılımında en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Örnek: 60, 72, 82, 72, 61, 81, 72 ise Mod=72’dir. • Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. 10/31/2020 30
10/31/2020 31
Tepe Değer (Mod) ile ilgili bazı önemli noktalar 1) Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1, 1, 1, 5, 5, 5, 7, 7, 7 puan dağılımının modu yoktur. 2) Bir dizi puan dağılımında ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2, 2, 3, 3, 3, 5, 5, 5, 9, 9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur. Dizinin modu 4’tür. 3) Bir dizi puan dağılımında frekansı eşit fakat ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2, 3, 3, 3, 4, 5, 6, 6, 6, 7 puan dağılımının 3 ve 6 olmak üzere iki modu (bimodal) bulunmaktadır. 32 10/31/2020 32
Medyan (Ortanca) Büyüklük sırasına göre dizilmiş puanlar dizisinin tam ortasına düşen puandır. Örnek: 95, 88, 73, 67, 59, 46, 35, 26, 23 Medyan: 59 Puanların sayısı çift ise: ‘inci değerin ortalaması alınır Örnek: 95, 88, 73, 67, 59, 46, 35, 26, 23, 12 Medyan: 52. 5 10/31/2020 33
Medyan (Ortanca) • Örnek: 4, 7, 8, 11, 12, 15, 19 ise Medyan=(n+1)/2=(7+1)/2=8/2=4. sıradaki 11’dir. • Örnek: 3, 5, 7, 9 ise Medyan=n/2=4/2=2. sıradaki (5+7)/2=6’dır. 10/31/2020 34
Medyan (Ortanca) • Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. • Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir. 10/31/2020 35
10/31/2020 39
10/31/2020 40
Dağılım (Değişim, Yayılma) Ölçüleri Yayılma Ölçüleri: Verilerin yığılma gösterdikleri noktadan ne kadar uzakta olduklarını, yani: merkeze yığılma ölçüsüne göre ne kadar dağıldıklarını belirler Ranj (dizi genişliği) Çeyrek Sapma Standart Sapma 10/31/2020 41
Ranj (Dizi Genişliği) Bir veri grubunda en yüksek puan ile, en düşük puan arasındaki farktır. Puanların sıralanmış olması gerekmez Grubun homojen ya da heterojen bir dağılım gösterdiği hakkında bilgi verir. Örnek: 78, 89, 56, 36, 48, 92, 59, 60 Ranj: 92 -36=56 10/31/2020 42
Ranj (Dizi Genişliği) • Örnek Birinci Dağılım: 59, 59, 60, 61, 61 ise Ranj=? 61 -59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? 90 -30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar. 10/31/2020 43
Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75. yüzdelik) ile birinci çeyrek (25. yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur. 10/31/2020 44
Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: 15, 17, 20, 21, 25, 30, 33, 40, 43, 47, 50, 55, 57, 60, 65, 70, 73, 77, 80, 84 25 65 25. yüzdelik için (Y 25)= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y 75)= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma (65 -25)/2=20 olur. 10/31/2020 45
Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir. 10/31/2020 46
Örnek: Çeyrek Sapma 10/31/2020 Puan Aralığı f Toplamalı Frekans Aralığın Gerçek Sınırı 21, 00 -25, 00 1 1 20, 50 -25, 50 26, 00 -30, 00 1 2 25, 50 -30, 50 31, 00 -35, 00 2 4 30, 50 -35, 50 36, 00 -40, 00 6 10 35, 50 -40, 50 41, 00 -45, 00 6 16 40, 50 -45, 50 46, 00 -50, 00 7 23 45, 50 -50, 50 51, 00 -55, 00 1 24 50, 50 -55, 50 47
48 10/31/2020 48
49 10/31/2020 49
Standart Sapma (SS) Bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının ölçüsüdür. Puanların ortalamadan olan farklarının, kareleri toplamının ortalamasının (Varyans), kareköküne eşittir. Varyans standart sapmanın karesine eşittir. Örnek: 78, 89, 56, 36, 48, 92, 59, 60 S=19. 8 10/31/2020 50
Standart sapma • Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır. q ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. q SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir. 10/31/2020 51
• Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır: 10/31/2020 52
Standart Sapmanın Özellikleri • SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. • Negatif değerler almaz. • Veri grubundaki tüm değerler aynı ise SS sıfırdır. • SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir. 10/31/2020 55
Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki Aritmetik ortalama ile standart Heterojen yapı oluşur ve grup sapmanın arası büyürse, başarısı düşer. Aritmetik ortalama ile standart Homojen yapı oluşur ve grup sapmanın arası küçülürse, başarısı artar. Bir puan dağılımında puanlar Standart sapmada büyür. arası fark (ranj) büyüdükçe, Bir testten elde edilen puanların standart sapması büyüdükçe, 10/31/2020 Testin güvenirliği artar. 56
Standart Hata • Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. 10/31/2020 57
Standart Puanlar Standart puan, gözlenen puanların ortalamadan farklarının standart sapmaya bölünmesiyle standart sapma birimi cinsinden elde edilen bir puandır. “Z” ve “T” puanları olmak üzere iki türlüdür. Aritmetik ortalaması 0, 00 ve standart sapması 1, 00 olan dağılıma birim normal dağılım ya da standart normal dağılım denir. Uygulanan bir testten elde edilen sonuçların standart normal dağılıma dönüştürülmesi ile elde edilen puanlara Z puanları adı verilir
• Z puanı, farklı test sonuçlarının karşılaştırılmasında ve matematiksel işlemlerde kolaylık sağlar. Farklı test sonuçlarının karşılaştırılmasına yönelik olarak aşağıdaki soruyu inceleyelim. • Soru 2: Tabloya göre Ali hangi testte daha başarılıdır? Hangi iki testteki başarısı birbirine eşittir? • 1. test için Z puanı = -1 • 2. test için Z puanı = 0 • 3. test için Z puanı = +1 • 4. test için Z puanı = +1 • 5. test için Z puanı = +2 olarak bulunur. • Buna göre Ali, 5. testte daha başarılıdır ve 3. ve 4. testlerdeki başarıları birbirine eşittir
T puanı • T puanı, aritmetik ortalaması 50 ve standart sapması 10 olan diğer bir standart dağılımdır.
Normal Dağılım Eğrisi %34, 13 (Simetrik Dağılım) %13, 59 %2, 14 Sx -3 -2 %2, 14 -1 0 +1 +2 +3 60 70 80 %68 Z -3 -2 -1 0 %95 T 10/31/2020 20 30 40 50 %99 61
Normal Dağılım • Birçok değişkene ait ölçümlerin frekans dağılımı, çan eğrisi şeklinde simetrik bir frekans eğrisiyse bu eğri, normal dağılım eğrisi olarak adlandırılır. • İstatistikte çok önemli bir yeri olan normal dağılım eğrisi aslında bir matematiksel eğridir. Eğrinin tepe noktası aritmetik ortalamaya karşılık gelir. • Normal dağılımda standart sapma, eğrinin genişliğini belirler. Standart sapma büyüdükçe değişkenin alacağı en küçük değer ile en büyük değer arasındaki açıklık büyür. • Ortalamanın üstünde ve altında eşit sayıda puan (%50’si) bulunmaktadır. • Hiçbir puan dağılımı, normal dağılımı tam olarak karşılamaz. Bu nedenle, normal dağılım eğrisinin yüzdelik karşılıkları tahmini olarak belirtilir.
Soru: • Aritmetik Ort: 60, SS=8 olan bir testten 70 puan alan bir öğrencinin başarısı hakkında yorum yapılacak olursa; • AO ve SS dikkate alınarak grubun genel dağılımının bulunması gerekir. • -3 S -2 S -1 S AO +1 S +2 S +3 S • 36 44 52 60 68 76 84 • Öğrenci puanları 36 ile 84 arasında değiştiği söylenebilir • 70 puan +2 S puan diliminde yer alır. Yani öğrencinin sınıfın % 84’ünden daha fazla puan aldığı söylenebilir.
KPSS Soru Örneği Aritmetik Mod Medyan Standart Leyla’nın Ortalama (Tepe Değer) (Ortanca) Sapma notu Türkçe 68 75 70 5 55 Matematik 70 65 60 10 60 Tarih 80 80 80 7 73 Fizik 65 75 70 4 72 Coğrafya 60 70 65 3 69 • Hangi derste dağılım normaldir? Normal Dağılım: Aritmetik ortalama, mod ve medyanın eşit olduğu dağılımdır. 10/31/2020 64
Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 70 65 60 10 60 Tarih 80 80 80 7 73 Fizik 65 75 70 4 72 Coğrafya 60 70 65 3 69 • Hangi derste grup homojendir ya da farklılaşma en düşük ya da öğrencilerin öğrenme düzeyi birbirine en yakındır? • Hangi derste grup heterojendir ya da farklılaşma en yüksek ya da öğrencilerin öğrenme düzeyi birbirine en uzaktır? 10/31/2020 65
Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 70 65 60 10 60 Tarih 80 80 80 7 73 Fizik 65 75 70 4 72 Coğrafya 60 70 65 3 69 • • 10/31/2020 Grup olarak en başarılı ve en başarısız olunan ders hangisidir? Ortalama öğrenme düzeyi ya da grup başarı düzeyi en yüksek ve en düşük olan ders hangisidir? Coğrafya (SS-min)ve Matematik(SS-max) dersi; Tarih (AO-max) ve Coğrafya (AO-min) 66
Leyla’nın en başarılı ve en başarısız olduğu dersler hangisidir ? -2 -1 53 55 58 63 Matematik 40 50 Tarih 60 Fizik Coğrafya Sx Türkçe +1 +2 68 73 78 83 60 70 80 90 100 67 73 80 87 94 100 53 57 61 65 69 72 73 77 51 54 57 60 63 69 -3 66 +3 67
KPSS Soru Örneği Ders Türkçe Ham Puan SS Z-Puanı T-Puanı 50+(10. 1, 15)= 61, 5 90 75 (90 -75)/13= 13 +1, 15 Fen. Teknoloji 55 65 16 (55 -65)/16= -0, 63 50+(10. -0, 63)= 43, 7 Sosyal Bilgiler 45 40 12 (45 -40)/12= +0, 42 50+(10. 0, 42)= 54, 2 85 60 14 (85 -60)/14= +1, 79 50+(10. 1, 79)= 67, 9 Matematik 1. Matematik, 2. Türkçe, 3. Sosyal Bilgiler, 4. Fen-Teknoloji. 68
10/31/2020 69
Dağılımda Çarpıklık: Negatif Çarpık Dağılım Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama<Medyan<Mod. Sorular ve test kolaydır. 10/31/2020 70
Dağılımda Çarpıklık: Pozitif Çarpık Dağılım Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod<Medyan<Ortalama. Sorular ve test zordur. 10/31/2020 71
Çarpıklık Katsayısı • Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. • Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir. 10/31/2020 73
Dağılımın Basıklığı
Korelâsyon • Korelasyon, X ve Y gibi iki değişken arasında bir ilişki olup olmadığı eğer ilişkili ise bu ilişkinin derecesini belirlemeye yarayan istatistiksel bir tekniktir. Değişkenler arasındaki ilişkinin derecesini veren katsayıya ise korelasyon katsayısı denilmektedir. Korelasyon katsayısı “r” ile gösterilir ve +1 ile -1 arasında değerler alır
Pearson Momentler Çarpımı Korelasyon Katsayısı • Bu korelasyon katsayısı, aralıklı ya da oranlı ölçek düzeyinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir. Pearson korelasyon katsayısı “r” ile gösterilmektedir ve değeri -1 ile +1 arasında değişmektedir. Pearson momentler çarpımı korelâsyon katsayısı aşağıdaki formüller kullanılarak hesaplanabilir
Sperman Sıra Farkları Korelasyonu (Spearman Rho) • Bu korelasyon katsayısı, sıralama ölçeğinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir (Baykul, 2000). Sperman Rho, Pearson korelasyon katsayısı ile aynı şekilde yorumlanmaktadır. Bunun yanı sıra, değişkenlerden biri sıralama diğeri ise aralıklı ya da oranlı ölçek düzeyinde ise, bu korelasyon katsayısının kullanılabilmesi için, aralıklı ya da oranlı ölçek düzeyindeki değişkenin sıralama ölçeğine dönüştürülmesi gerekir.
• 5 A sınıfındaki öğrencilerin 25 soruluk matematik testinden aldıkları puanlar gruplanarak aşağıdaki frekans grafiğinde gösterilmiştir. (KPSS-2007) • • • 3. 5 A sınıfının mevcudu kaçtır? A) 5 B) 7 C) 8 D) 20 E) 25 4. 5 A sınıfının matematik testi puanlarının aritmetik ortalaması kaçtır? A) 5, 7 B) 7, 4 C) 14, 5 D) 18, 6 E) 20 5. 5 A sınıfının matematik testi puanlarının tepe değeri (mod) kaçtır? A) 5 B) 7 C) 8 D) 18 E) 25
• 7. Mehmet Öğretmen, öğrencilerine uyguladığı bir test sonucunda elde ettiği puanlardan bazı istatistikleri hesaplamıştır. Daha sonra, öğrencilerden birinin puanını yanlış yazdığını fark etmiş ve gerekli düzeltmeyi yaparak istatistikleri tekrar hesaplamıştır. • Buna göre, Mehmet Öğretmen’in düzeltmesi sonucunda aşağıdaki istatistiklerden hangisi kesin olarak değişmiştir? (KPSS-2008) • A) Ortalama B) Ortanca C) Mod • D) Ranj E) Yığmalı frekans
- Slides: 84