lme Aralarnda Gvenirlik ve Geerlilik GVENRLK Bir lme
Ölçme Araçlarında Güvenirlik ve Geçerlilik
GÜVENİRLİK Bir ölçme aracının ölçmeye çalıştığı bir özelliği her defasında aynı sonucu verecek şekilde ölçebilmesi (Sabancı, 2000). Bir ölçme aracı her uygulanışında aynı sonucu veriyorsa güvenilirdir.
GÜVENİRLİK Güvenirlik ile ölçme hatası arasında ters bir ilişki vardır; yani güvenirlik arttıkça ölçme işleminde yapılan hata oranı da o derece düşer (Sabancı , 2000). Bir ölçme aracı ne kadar çok hatalı sonuç veriyorsa o kadar az güvenilirdir.
GÜVENİRLİK Ölçme aracının kararlı, tutarlı ve duyarlı sonuçlar veriyor olması.
Güvenilirlik, hem kullandığımız ölçme araçları hem de bu araçlarla elde edilen ölçümlerin kalitesiyle ilgili olan bir kavramdır. Güvenirlik, hesaplanmış bir korelasyon katsayısı (r) ile belirlenir ve sıfır ile bir arasında değişen değerler alır. Değer bir (1. 00)'e yaklaştıkça güvenirliğin yüksek olduğu kabul edilir.
Güvenirliği düşük olan bir ölçmenin hiç bir bilimsel değeri olmadığı gibi, güvenirliğin yüksek olması da, yapılan ölçmenin amaca uygunluğunun garantisi değildir. O halde, güvenirlik, zorunlu fakat yeterli bir koşul değildir (Küçükahmet, 2003).
Güvenirlikte Hata Kaynakları Denek Hatası : Sözgelimi, çalışanların işlerine bağlılık ve istek derecelerini ölçmeye yönelik bir anket uygulanıyor olsun. Eğer, anket haftanın değişik günlerinde doldurulmuşsa farklı cevapların verileceği açıktır. Pazartesi sabahı ile Cuma öğlen sonrası verilecek cevaplar değişik olur. Böyle bir çalışma için araştırmacı, mümkün olduğunca nötr bir zaman seçmelidir.
Gözlemci Hatası: Güvenilirliği tehdit eden bir diğer unsurdur. Örneğin, araştırmacı veri toplama metodu olarak mülakatı seçmiş olsun. Böyle bir çalışmada ne kadar değişik sayıda mülakatçı varsa o kadar değişik cevap almak mümkündür. Bu tehdidi ortadan kaldırmak için, ya mülakatçı sayısını en aza indirmek veya mülakatları mümkün olduğunca biçimselleştirmek gerekir. Gözlemci Önyargısı: Araştırmacının elde ettiği cevapları deneğin kastettiğinden farklı şekilde yorumlamasından kaynaklanır.
GEÇERLİK • Ölçülmek istenen şeyin başka şeylerle karıştırılmadan ölçülebilmiş olma derecesidir. (Karasar: 2003: 151) • Bir testin kullanış amacına uygunluk derecesi yani bir testin ölçmek istediği niteliği gerçekten ölçme derecesidir (Sönmez, 2003; 418) • Ölçme aracının, geliştirilmiş bulunduğu konuda maksada hizmet etmesidir (Tekin: 2007: 42) . .
Bir ölçme aracının geçerli sayılabilmesinin ilk koşulu, onun güvenilir olmasıdır. Bir ölçme aracının veya o araçla elde edilen puanların geçerliği için ön koşul onun güvenilir olmasıdır. Güvenirliği konusunda kanıt gösterilemeyen araçların geçerliğini tartışmak yeterince anlamlı değildir. O nedenle, aracın güvenirliği ile ilgili çalışmalar öncelikli olarak ele alınmalıdır. 10
• Ölçme aracı belli bir amaç ve belli durumlar için geçerlidir. Başka bir amaç için geçerli sayılmaz. Örneğin bir grup öğrenciye uygulandığında geçerli olan test diğer öğrenci grubuna uygulandığında geçerli olmayabilir (Karasar: 2003; 151). • Örneğin Türkçe dersinde yazılı anlatım becerisini ölçen bir test bu amaca hizmet ettiği sürece geçerlidir. Aynı testi beden eğitimi dersi için kullanamayız. Çünkü o dersin amaçları için hazırlanmamıştır (Sönmez: 2003; 418). 11
GEÇERLİK TÜRLERİ • İÇERİK (KAPSAM) GEÇERLİĞİ • ÖLÇÜT GEÇERLİĞİ • YORDAMA GEÇERLİĞİ • YAPI GEÇERLİĞİ • GÖRÜNÜŞ GEÇERLİĞİ • SONUÇSAL GEÇERLİK 12
KAPSAM GEÇERLİĞİ Kapsam geçerliği, bir bütün olarak testin ve testteki her bir maddenin maksada ne derece hizmet ettiğidir (Tekin: 2008; 45). 13
ÖLÇÜT GEÇERLİĞİ • Bir ölçme aracının amaçlar doğrultusunda puanlar verip vermediğinin anlaşılması için başvurulan yöntemlerden bir diğeri, araçla elde edilen puanları ilgili başka ölçütlerle karşılaştırmaktır. Bir ölçme aracının geçerliği konusunda kanıt aramak amacıyla karşılaştırılacak ölçütün geçerli bir ölçüt olması zorunludur. Eğer ölçme aracı, geçerli olduğu bilinen bir ölçütle karşılaştırıldığında ölçütle uyumlu sonuçlar veriyorsa, aracın geçerliğinden söz edilebilir. Değilse, ölçme aracının geçerliği düşüktür. 14
YORDAMA GEÇERLİĞİ • Yordama, bir tahmindir. Ne var ki, her tahmin bir yordama değildir. Bir tahminin yordama olabilmesi için, onun geleceğe dönük olması ve belli bilgiler temelinde bazı teknikler kullanılarak yapılmış olması gerekir. Yordama; istatistiksel teknikler kullanılarak ve bilinenlerden yararlanılarak bilinmeyen durumlar hakkında yapılan geleceğe yönelik tahminlerde bulunma işlemidir. 15
YAPI GEÇERLİĞİ Birçok ölçme kitabında yapı geçerliği, sadece psikolojik ölçmelerle ilgili görülmüş, eğitimsel ölçmelerde bu tür geçerlik pek söz konusu edilmemiştir. Bazı yazarlar ise, daha önce sözü edilen geçerlik türlerinin bir maksada bağlı olduğunu bu yüzden yapı geçerliğinin, geçerliğin tamamı olarak görülebileceğini öne sürmüşlerdir (Tekin: 2007). 16
GÖRÜNÜŞ GEÇERLİĞİ Bir ölçme aracının ölçmek istediği niteliği, ölçüyor görünmesi olarak tanımlanabilir. Sözgelişi müşteri memnuniyetini ölçmek için hazırlanan bir ölçeğin bu niteliği ölçüyor görünmesi gerekir. (Sönmez: 2003; 419). 17
Geçerlik ve Güvenirlik Arasındaki İlişki Güvenirlik sabit ve sistemli hatalardan etkilenmeyip sadece rasgele hatalardan etkilenir. Bir ölçmenin kararlılığı güvenirliğe, kararsızlığı ise rasgele ve geçici hatalara karşılık gelir. Bir testin geçerliğini, onun güvenirliği sınırlar. Güvenirlik, geçerlik için gerekli koşuldur, fakat yeterli koşul değildir. Bir testin güvenirliği düşük ise geçerliği de düşüktür. Fakat güvenirliği yüksek olan bir testin geçerliği yüksek olmayabilir, hatta düşük olabilir. Güvenirliği düşük bir testin geçerliği ne denli uğraşılırsa uğraşılsın belli bir sınırın üstüne çıkarılamaz. Bir testin güvenirliğini etkileyen tüm etkenler, doğrudan ya da dolaylı biçimde o testin geçerliğini de etkiler ( Tekin, 2007).
Kaynaklar Baykul, Y. (2000) “Eğitimde ve Psikolojide Ölçme” ÖSYM Yayınları, Ankara. Bruning, J. L, Kintz, B. L. (1997) “İstatistik” Çev: Prof. Dr. . Ali Dönmez, Gündoğan Yayınları, Ankara. Büyüköztürk, Ş. (2003) “Sosyal Bilimler İçin Veri Analizi El Kitabı” Pegem A Yayınları, 3. Baskı, Ankara. Demircioğlu, G. (2007) “Ölçme ve Değerlendirme” Editör: Emin Karip, Pegem A Yayıncılık, Ankara. Demirel, Ö. (2007) “Öğretim İlke ve Yöntemleri, Öğretme Sanatı” Pegem A Yayıncılık, 12. Baskı, Ankara. İşman, A. (1998), “Türk Eğitim Sisteminde Ölçme Değerlendirme”, Değişim Yayınları, 1. Baskı, Adapazarı. Ergin, D. A. (1995) “Ölçeklerde Geçerlik ve Güvenirlik” Eğitim Bilimleri Dergisi M. Ü. Yayınları, Sayı: 7, İstanbul. İşman, A. , Eskicumalı, A. (2003), “Eğitimde Planlama ve Değerlendirme” Değişim Yayınları, 4. Baskı, İstanbul. Karaca, E. , ve Diğerleri, (2008), Eğitimde Öçme Değerlendirme, Nobel Yayınları, Ankara. Karasar, N. (2000) “Bilimsel Araştırma Yöntemleri” Nobel Yayın Dağıtım 10. Baskı. Ankara. Kasap, H. , Karagözoğlu, C. , ve Kemertaş, İ. , Eğitim ve Spor Eğitiminde Ölçme ve Değerlendirme. Özdamar K. (1999) Paket Programlarla İstatistiksel Veri Analizi-1. Özçelik, DA. (1998) “Ölçme ve Değerlendirme” ÖSYM Yayınları , 3. Baskı, Ankara. Tekin, H. (2007) “Eğitimde Ölçme ve Değerlendirme” Yargı Yayınları, 18. Baskı, Ankara. Saban, A. (2000) “Öğrenme Öğretme Süreci, Yeni Teori ve Yaklaşımlar” Nobel Yayın Dağıtım, Ankara. Sönmez, V. , (2003), Program Geliştirmede Öğretmen El Kitabı, 10. baskı, Anı Yayıncılık, Ankara Tekin, H. , (2007), Eğitimde Ölçme Ve Değerlendirme, 18. baskı, Yargı Yayınları, Ankara. Yılmaz, H. (2007), “Eğitimde Ölçme ve Değerlendirme” Çizgi Kitabevi Yayınları, 7. Baskı, Konya. . Geçerlik Analizi, http: //www. istatistikanaliz. com
- Slides: 19