T C ORMAN VE SU LER BAKANLII STRATEJ
T. C. ORMAN VE SU İŞLERİ BAKANLIĞI STRATEJİ GELİŞTİRME BAŞKANLIĞI İSTATİSTİKİ DEĞERLENDİRMELER Ziya Erdem BİNAT Orman ve Su İşleri Uzman Yardımcısı
PROJENİN GAYESİ Bakanlık birim ve üst yöneticilerinin; Ø Kararlarında ihtiyaç duyacağı istatistiki veri ve raporların dinamik olarak üretilmesi, Ø Karar vermede fayda sağlayacak karar destek modellerinin hazırlanması, Ø İstatistik altyapısının oluşturulması. Ham Veriler Veri Analizi İstatistik Raporlama 26. 11. 2020 Yönetici 2
VERİ DATA İngilizce ve Latince DATUM Çoğul Veri 26. 11. 2020 3
VERİ VERİ: Bir ham (işlenmemiş) gerçek ya da bilgi parçacığına verilen addır. 26. 11. 2020 4
VERİ Ø İşlenmemiş, bir sonuca varabilmek için gerekli olan ilk değer, ham gerçeklerdir. Ø Yalnız başına anlam ifade etmezler. Ø Karar vermede faydalı olacak şekilde verinin düzenlenmesi ve analiz edilmesi ile anlamlı hale gelir. 26. 11. 2020 5
VERİ TOPLAMA KAPSAM BAKIMINDAN Tamsayım 26. 11. 2020 Örnekleme 6
VERİ TOPLAMA TAMSAYIM: İlgilen özellik bakımından anakütledeki her birimin gözlendiği veya ölçüldüğü istatistiksel tekniktir. 26. 11. 2020 7
VERİ TOPLAMA ÖRNEKLEME: İlgilen özellik bakımından anakütledeki birimlerden belirli kurallara göre seçilen birimlerin gözlendiği veya ölçüldüğü istatistiksel tekniktir. 26. 11. 2020 8
Veri Toplama Yöntemleri ANKET Posta İDARİ KAYIT DENEY GÖZLEM Resmi Evrak Hasta Çizelgesi Rapor Telefon Sistem kayıtları Laboratuvar Bulguları Psikolojik Testler ve Görüşmeler Yüzyüze Ölçüm ve Bildirimler İnternet 26. 11. 2020 Maç İstatistikleri 9
Veri Tipleri ZAMAN SERİLERİ (TİME-SERİES): Verilerin aynı birimden farklı zaman veya dönemlerde toplanmasıyla oluşturulur. 26. 11. 2020 Yıl Sıcaklık 06. 2000 30 06. 2001 32 06. 2002 35 06. 2003 29 06. 2004 31 06. 2005 33 10
Veri Tipleri KESİT VERİLERİ (CROSS-SECTİONAL): Verilerin farklı birimlerden aynı anda veya aynı dönemde toplanmasıdır. 02. 2015 tarihli kur değerleri 26. 11. 2020 Değişken Değer 1 dolar 2, 00 tl 1 euro 2, 50 tl 1 frank 2, 30 tl 1 yen 0, 35 tl 1 sterlin 4, 00 tl 11
Veri Tipleri KARMA (PANEL) VERİ: Veriler farklı birimlerden farklı zaman veya dönemlerde toplanmasıyla oluşturulur. 26. 11. 2020 Kişi Yıl Gelir(TL) Ali 2000 1000 Ali 2001 1500 Ali 2002 2000 Ayşe 2001 3000 Ayşe 2002 4000 12
Temel Kavramlar İstatistik üretmek istiyorsa öncelikle istatistiğin temel kavramları hakkında fikir sahibi olmalıyız 26. 11. 2020
Temel Kavramlar BİRİM: Verilerin toplandığı insan, hayvan, bitki, eşya, öğrenci, seçmen, masa, ağaç vb. canlı, cansız nesne veya olayların herbiridir. ANAKÜTLE (YIĞIN): Üzerinde inceleme yapılan, benzer özellikler taşıyan birimlerin meydana getirdiği kümedir. 26. 11. 2020
Temel Kavramlar ÖRNEKLEM: Belli bir anakütleden belli kurallara göre seçilmiş ve seçildiği anakütleyi temsil yeterliliğine sahip olduğu kabul edilen alt kümedir. 26. 11. 2020
PARAMETRE: Bir anakütledeki tüm birimlerden elde edilmiş, sayısal veya oransal olarak gösterilen ve söz konusu anakütlenin araştırma konusu özelliğini simgeleyen ortalama, varyans, görülme sıklığı, korelasyon katsayısı gibi tanımlayıcı değerlerdir. 26. 11. 2020
Temel Kavramlar İSTATİSTİK: Anakütlenin seçilmiş birimlerinden (Örneklemden) elde edilen verilere göre hesaplanan ve anakütlenin özelliklerini taşıdığı kabul edilen aritmetik ortalama, tepe değeri, ortanca, varyans, standart sapma gibi tanımlayıcı değerlerdir. 26. 11. 2020
Temel Kavramlar Tanımlayıcı ölçüt Örneklemde (istatistik) Evrende (parametre) Ortalama X Oran p P Standart sapma S Varyans S 2 2 26. 11. 2020
Temel Kavramlar DEĞİŞKEN: Gözlemden gözleme değişik değerler alabilen nesnelere, özelliklere veya durumlara denir. 26. 11. 2020
Temel Kavramlar ü Nitel değişken: Değişkenin aldığı değerler sözel olarak ifade edilebiliyorsa bu değişkene “nitel değişken” denir. ü Sınıflama ölçme düzeyi: Değişkenler arasında matematiksel ve mantıksal bir ilişki olmayan veri türleri için kullanılır. (Örneğin; cinsiyet, medeni hal, meslekler vb. ) ü Sıralama ölçme düzeyi: Değişkenler arasında mantıksal bir ilişki olup matematiksel bir ilişki olmayan veri türleri için kullanılır. (Örneğin; tarih, memnuniyet düzeyi, eğitim düzeyi vb. ). 26. 11. 2020 20
Temel Kavramlar ü Nicel Değişken: Değişkenin aldığı değerler sayısal olarak ifade edilebiliyorsa bu değişkene “nicel değişken” denir. ü Aralık ölçme düzeyi: Değişkenler arasında hem matematiksel (toplama, çıkarma) hemde mantıksal bir ilişki olan veri türleri için kullanılır. ‘ 0’ değeri anlamsızdır. Başlangıç noktası gerçek yoğunluğu ifade etmez. Örneğin; sıcaklık, zeka vb. ü Oranlama ölçme düzeyi: Değişkenler arasında hem matematiksel (tüm işlemler) hemde mantıksal bir ilişki olan veri türleri için kullanılır. ‘ 0’ değeri anlamlıdır ve başlangıç noktasını ifade eder. Örneğin; uzunluk, ağırlık, fiyat, yaş, arazi büyüklüğü vb. 26. 11. 2020
ÖRNEK Değişken Ölçüm Düzeyi p. H ? Rakım ? Tansiyon ? Bakanlık Bölge Müd. (1. , 2. , 3. Bölge. . . ) ? Akademik ünvan ? Zaman ? 26. 11. 2020
İSTATİSTİK İstatistik nedir? İstatistik, belirli amaçlar için planlı ve sistemli olarak veriler toplama, sınıflama, analiz etme ve yorumlama teknik ve yöntemlerine ait bir disiplindir. 26. 11. 2020 23
İstatistik ü Betimsel (Tanımlayıcı) istatistik Verilerin toplanması, tablolar ve grafiklerle gösterilmesi, özet değerlerin hesaplanması ve sunulması ile ilgili yöntemleri içerir. ü Çıkarımsal İstatistik Verilerin analizi için gerekli varsayımların kurulması ve test edilmesi, verilerden uygun sonuçlar elde edilmesi, verilerin uyduğu teorik modellerin belirlenmesi ve uygun kararlara varılması ile ilgili yöntemleri içerir. 26. 11. 2020 24
İstatistik Betimsel İstatistik Çıkarımsal İstatistik • Verileri düzenler, tablolar. • Anakütle birimleri arasından bir • Verilerin grafiklerini çizer. örneklem seçer. • Özet değerleri (merkezi eğilim ve • Hipotez testleri değişkenlik ölçütleri) hesaplar. • Kestirimler, Öngörüler • Deney Tasarımları • Regresyon analizi • Yapılan çıkarımların güvenirliğinin ölçülmesi ile ilgilenir. 26. 11. 2020
Betimleyici İstatistikler Değişken Nitel Tablo • Frekans Dağılımı • Oransal Frekans dağılımı 26. 11. 2020 Nicel Grafik • Çubuk gr. • Daire gr. • Çizgi gr. Tablo • Frekans Dağılımı • Oransal Frekans dağılımı Grafik • Histogram
Betimleyici İstatistikler Betimsel İstatistikler Merkezi Eğilim Ölçüleri • Aritmetik ortalama • Mod • Medyan 26. 11. 2020 Dağılış Ölçüleri • Varyans • Standart Sapma • Değişkenlik Katsayısı • Çarpıklık • Basıklık
Betimleyici İstatistikler Merkezi Eğilim Ölçüleri Aritmetik Ortalama • Genel olarak aritmetik ortalama tüm veri dizisinin toplanması ve bu toplamın veri sayısına bölünmesi ile elde edilen bir sayıdır. • Uç değerlere duyarlıdır. 26. 11. 2020
Frekans Dağılımı 26. 11. 2020 Yaban hayvanı türü Avlanma sayısı Yaban keçisi 2000 Yaban domuzu 16000 Karaca 229 Kızıl geyik 316 Kurt 6 Ayı 2
Çubuk Grafiği 6000 5000 4000 3000 2000 1000 0 Yaban keçisi 26. 11. 2020 Yaban domuzu Karaca Kızıl geyik Kurt Ayı
Çizgi Grafiği YILLARA GÖRE AVCI SAYISI 2 000 1 800 1 600 1 400 1 200 Toplam Yabancı 1 000 800 Yerli 600 400 200 26. 11. 2020 01 3 13 -2 01 4 20 12 -2 01 2 20 20 11 -2 01 1 01 0 10 -2 20 09 -2 00 9 20 20 08 -2 00 8 00 7 07 -2 20 06 -2 00 6 20 20 05 -2 00 5 00 4 20 04 -2 03 -2 00 3 20 02 -2 20 20 01 -2 00 2
Betimleyici İstatistikler Aritmetik Ortalama 26. 11. 2020 Sınıflama ölçme düzeyi Anlamsız Sıralama ölçme düzeyi Anlamsız Eşit Aralıklı ölçme düzeyi Anlamlı Oransal ölçme düzeyi Anlamlı Uç değer var Anlamsız
Betimleyici İstatistikler Merkezi Eğilim Ölçüleri Ortanca (Medyan) • Büyükten küçüğe sıralı değerleri eşit sayıda gözleme sahip iki gruba ayıran gözlemdir. Sağdan ve soldan eşit uzaklıktaki değerdir. • Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir. 26. 11. 2020
Betimleyici İstatistikler Medyan 26. 11. 2020 Sınıflama ölçme düzeyi Anlamsız Sıralama ölçme düzeyi Anlamlı Eşit Aralıklı ölçme düzeyi Anlamlı Oransal ölçme düzeyi Anlamlı Uç değer var Anlamlı
Betimleyici İstatistikler Merkezi Eğilim Ölçüleri Tepe Değeri (Mod) • En sık gerçekleşen değerdir. • Dağılımın nerede yığıldığını gösterir. • Uç değerlerden etkilenmez. • Bazı örneklemlerde bir tepe değer yerine iki ya da daha çok tepe değer olabilir. 26. 11. 2020
Betimleyici İstatistikler Mod 26. 11. 2020 Sınıflama ölçme düzeyi Anlamlı Sıralama ölçme düzeyi Anlamlı Eşit Aralıklı ölçme düzeyi Anlamlı Oransal ölçme düzeyi Anlamlı Uç değer var Anlamlı
ÖRNEK • 50, 51, 49, 48, 55, 47, 102, 54, 56, 52, 53, 46, 93, 98, 45 • 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 93, 98, 102 7 gözlem 7 gözlem • A. O. = 59, 9 • Medyan= 52 • Mod Yok 26. 11. 2020
Betimleyici İstatistikler Dağılım Ölçüleri Ölçme Sınıflama Ölçme Dağılış Düzeyi ölçüsü Varyans Standart Sapma Değişim katsayısı Çarpıklık Basıklık 26. 11. 2020 Sıralama Ölçme Düzeyi Eşit Aralıklı Ölçme Düzeyi Oransal Ölçme Düzeyi
Betimleyici İstatistikler Dağılım Ölçüleri Varyans: Verilerin genel dağılımı hakkında bilgi veren bir değerdir. Dizideki verilerin ortalama etrafında nasıl bir dağılım gösterdiğini, yayılış ve serpilmenin durumunu belirtir. Standart Sapma: Varyans’ın kareköküne eşit bir dağılım ölçüsüdür. Ölçü birimi değişkenin ölçü birimi ile aynıdır. Varyans’dan daha çok kullanılan bir dağılım ölçüsüdür. Değişim Katsayısı: Değişken dağılımının, homojenliğini belirlerken farklı ölçü birimlerini karşılaştırmada kullanılır. 26. 11. 2020
Betimleyici İstatistikler Dağılım Ölçüleri Çarpıklık: Bir dağılımın normal dağılıma göre çarpık olup olmadığını belirlemede kullanılır. Simetrik dağılımlarda ortalama, ortanca ve tepe değeri birbirine eşittir. Sağa ve sola çarpık dağılımlara ilişkin eğri aşağıdaki gibidir: Sola çarpık dağılım (Ortalama<Ortanca<Tepe değeri) 26. 11. 2020 Sağa çarpık dağılım (Ortalama>Ortanca>Tepe değeri)
Betimleyici İstatistikler Örnek • • Başarı yüksektir. Öğretim yeterlidir. Sorular ve test kolaydır. Puanların çoğu dağılımın sağında toplanmıştır. 26. 11. 2020
Betimleyici İstatistikler Sola Çarpık(kayışlı)dağılım • • • Başarı yüksektir. Öğretim yeterlidir. Sorular ve test kolaydır. Puanların çoğu dağılımın sağında toplanmıştır. Öğrenciler hedef davranışları kazanmışlardır. 26. 11. 2020
Betimleyici İstatistikler Dağılım Ölçüleri Basıklık: Bir dağılımın normal dağılıma göre basık olup olmadığını belirlemede kullanılır. Basıklık katsayısı sıfırdan büyükse normal dağılıma göre daha sivridir. 26. 11. 2020
ÖRNEK • İllere göre m 2 başına düşen ortalama ormanlık alanların karşılaştırmasını yapmak isteyelim. 26. 11. 2020 İL m 2 başına düşen ortalama ormanlık alan Standart Sapma Değişim katsayısı Ankara 0, 5 0, 4 0, 8 Konya 0, 5 0, 6 0, 12 Iğdır 0, 5 0, 8 0, 16
Kalite İlkeleri 26. 11. 2020 45
Kaynakların yeterliliği • İstatistik üretim ve koordinasyon süreçlerinden sorumlu birim mevcudiyeti • İstatistik üretim süreçlerinde kullanılan bilgi işlem kaynaklarının yeterliliği • İstatistik üretim ve koordinasyon süreçlerindeki insan kaynaklarının niceliksel yeterliliği 26. 11. 2020
Kaynakların yeterliliği • İstatistik üretim süreçleri için ayrılan mali kaynakların yeterliliği • İdari kayıtlardan istatistik üretme potansiyelini geliştirmeye yönelik yasal düzenleme durumu 26. 11. 2020
İstatistiksel Gizlilik • İstatistiğin veri gizliliğine tabii olma ve uygulanma durumu • İstatistik üretim süreçlerinde veri güvenliğinin sağlanması durumu 26. 11. 2020
Tarafsızlık ve Nesnellik • İstatistik metaverisinin kullanıcıya sunulması durumu • İstatistiğin yayımlama takviminin kurum web sayfasında yayımlanması durumu • Kullanıcıların istatistiğe eşit erişebilme durumu 26. 11. 2020
Tarafsızlık ve Nesnellik • Yayımlanmış istatistiklerde hata ve düzeltmelerin kullanıcıya bilgilendirilmesi durumu • Revizyon politikası mevcudiyeti ve kullanıcılarla paylaşımı 26. 11. 2020
Güvenilir Metodoloji • İstatistiğin üretiminde kullanılan yöntemlerin ulusal ve uluslararası standartlara uygunluğu • Temel değişkenlerin kavram, tanım, sınıflama ve kodlama uygunluğu • İstatistik üretim ve koordinasyon süreçlerindeki insan kaynaklarının niteliksel yeterliliği 26. 11. 2020
Güvenilir Metodoloji • Metodolojiyi geliştirmek amacıyla ulusal ve uluslararası bilim çevreleri ile yapılan işbirliği düzeyi • İstatistiğin ulusal ve uluslararası uygunluğunun sağlanması için personelin aldığı eğitimlerin yeterliliği 26. 11. 2020
Uygun İstatistiksel İşlemler • Mikro ve makro kontrollerin uygunluğu • İstatistik üretim süreçlerinin dokümantasyonunun yeterliliği • Veri toplama, işleme, analiz ve dağıtım süreçlerinde bilgi ve iletişim teknolojilerini kullanma düzeyi 26. 11. 2020
Uygun İstatistiksel İşlemler • Veri kaynaklarındaki eksiklikleri gidermek için yapılan işbirliği faaliyetlerinin yeterliliği • İmputasyon uygulanma durumu • Revizyonların uygunluğu 26. 11. 2020
Kullanıcı Odaklılık • İstatistiğin kullanıcı ihtiyaçlarını karşılaması durumu • Kullanıcı ihtiyaçlarının düzenli olarak izlenmesi ve değerlendirilmesi durumu • Kullanıcı ihtiyaçlarının stratejik plan, çalışma programı ya da faaliyet planına yansıtılma durumu • Kullanıcı ihtiyaçlarının karşılanması için kurum/kuruluşlarla işbirliği yapma düzeyi 26. 11. 2020
Doğruluk ve Güvenilirlik • Veri kaynağının istatistiksel kullanıma uygunluğu • Kontrol sonrası veri kaynağında düzeltme yapılma durumu 26. 11. 2020
Zamanlılık • İstatistiğin yayımlanma dönemi ile verinin referans dönemi arasında geçen sürenin uygunluğu • İstatistik yayımlama zamanının kullanıcı ihtiyaçlarını karşılaması durumu • İstatistiğin UVYT'ye uygun yayımlanması durumu 26. 11. 2020
Tutarlılık ve Karşılaştırılabilirlik • İstatistiksel verinin içsel tutarlılığı • Farklı veri kaynaklarında kullanılan tanım, kavram, sınıflama ve kodlamaların tutarlılığı • Karşılaştırılabilir zaman serisi mevcudiyeti ve tutarlılığı 26. 11. 2020
Erişilebilirlik ve Açıklık • İstatistiğin kullanıcıya bilgi teknolojilerinden yararlanılarak sunulması durumu • Kullanıcıların istatistiğe kolay erişebilme durumu • Metaveri dokümantasyonu mevcudiyeti ve güncelliği • Kullanıcının metaveriye erişebilme durumu • Metaverinin standartlara uygunluğu 26. 11. 2020
TEŞEKKÜRLER.
- Slides: 60