STATSTK I 1 Cenk zler Blm 1 Temel
İSTATİSTİK I 1 Cenk Özler
Bölüm 1 Temel Terimler ve Tanımlar 2
İSTATİSTİKLER… Herhangi bir konu ile ilgili veriler…
4 Neden İstatistik Öğreniyoruz? İstatistik, sayıları karar vericiler için faydalı bilgilere dönüştüren matematik dalıdır. İstatistikler, iş dünyasında karar verme ilişkili riskleri bilmenizi sağlar ve karar verme sürecindeki varyasyonu anlamanıza ve azaltmanıza olanak tanır. En başta istatistikler, dünyayı daha iyi anlamanıza yardımcı olur. İkincisi, istatistikler daha iyi iş kararları vermenize yardımcı olur.
5 Neden İstatistik Öğreniyoruz? İstatistikler, yaşadığımız dünyayı tanımlamak veya analiz etmek için her gün kullanılan sayıları daha iyi anlamamız için yöntemler sunar. "Tweetleri izle" (H. Rui, A. Whinston ve E. Winkler, The Wall Street Journal, 30 Kasım 2009, s. 44). Bu çalışmada, yazarlar, satış eğilimlerinin doğru tahminlerini yapmak için belirli ürünlerden bahseden tweet sayısını kullandılar.
6 İş Dünyasında İstatistik İş dünyasında, istatistiklerin bu önemli özel kullanımları vardır: • İş verilerini özetlemek • Bu verilerden sonuç çıkarmak • Ticari faaliyetler hakkında güvenilir tahminler yapmak • İş süreçlerini iyileştirmek
7 İSTATİSTİKSEL YÖNTEMLER TANIMLAYICI İSTATİSTİKLER YORUMLAYICI İSTATİSTİKLER
8 İstatistiksel Yöntemler Tanımlayıcı İstatistikler Verilerin toplanması, tanımlanması ve temel analizler Yorumlayıcı İstatistikler Örnekten elde edilen istatistikler kullanılarak, bilinmeyen parametreler hakkında tahminde bulunma, karar verme.
9 Yorumlayıcı İstatistikler Genel olarak araştırmalarda, büyük veri gruplarının içinden daha küçük veri grupları seçilerek büyük veri gruplarının hakkında bilgi edinmek amaçlanır. Örneğin; • Pazar araştırmaları, • Kamuoyu yoklamaları, • TÜİK’in yaptığı hanehalkı araştırmaları.
10 Tanımlar v Değişken: Bir parçanın veya bireyin bir özelliğidir. v Veri: Veriler bir değişkenle ilişkili farklı değerlerdir. Ölçüm sonuçları, cinsiyet, araştırma çıktıları gibi çeşitli çalışmalardan elde edilmiş gözlemlerdir.
11 Anakütle (Populasyon) Hakkında belirli bir veya daha fazla özellik (DEĞİŞKEN) açısından araştırma yapılmak istenen tüm elemanların içinde bulunduğu kümedir. İstatistik açısından iki temel kavram tanımlanmalıdır: Araştırılacak topluluğun sınırları, Topluluk içindeki incelenecek değişken veya değişkenler.
Tanımlar 12 v. Sayım anakütlenin her biriminin sayılması vÖrnek anakütleden çekilen alt küme
13 Örnek Anakütleden seçilen ve ilgilen değişken açısından anakütlenin özelliklerini yansıtma özelliğine sahip alt kümedir. Örneğin en önemli amacı; zaman ve maliyet kaybını minimuma düşürmek, (optimum örnek hacmi)
14 Örnekte olması gereken en önemli özellikler vÖrnek veri uygun bir yolla rassal olarak toplanmalıdır. v Anakütleyi iyi bir şekilde temsil edebilmelidir. NOT: Eğer veri uygun yolla toplanmazsa, veri hiçbir istatistik yöntemle kurtarılamaz ve tamamen kullanışsız olur.
Parametre 15 Anakütlenin sayısal olarak ölçülebilen herhangi bir özelliği o anakütlenin parametresi olarak tanımlanabilir. Bir anakütle birden fazla parametreye sahip olabilir. Parametre, ilgili anakütle için, değişmeyen sayısal bir sabittir. NOT: Parametreyi belirlemek için anakütledeki tüm elemanların incelenmesi gerekir.
PARAMETREYE İLİŞKİN ÖRNEKLER: 16 Bir tekstil fabrikasında bir haftada kullanılan ortalama boya miktarı, D. E. Ü. İ. İ. B. F’de okuyan öğrencilerin sigara içme oranı, Amerikan Doları’nın ($’) Euro (€) karşısında son 2 yıllık değişim yüzdesinin ortalaması.
17 Örnek İstatistiği Anakütlenin belirli bir parametresinin hesaplanmasının zorluğundan dolayı alınan örnek yardımıyla bulunan parametre tahminine örnek istatistiği (istatistik / tahminleyici) adı verilir. Örnek: İzmir’de üniversitede okuyan öğrencilerin aylık harcamalarının ortalamasını tahmin etmek amacıyla 150 öğrencilik bir örnek alınarak aylık harcama miktarlarının ortalamasının bulunması.
Parametre-Örnek İstatistiği İlişkisi 18 Anakütle Parametreleri ve Tahminleyicileri Anakütle Parametresi Örnek İstatistiği (Anakütle Ortalaması ) (Örnek Ortalaması ) s 2 (Anakütle Varyansı ) s 2 (Örnek Varyansı) p (Anakütle Oranı )
Anakütle-Örnek İlişkisi 19 Anakütle N Anakütle parametresi Örnekten elde edilen örnek istatistiği x anakütle parametresi ’ ye ne kadar yakın ise yapılan çalışma o kadar iyidir. Anakütle için yapılacak yorumlar o kadar tutarlı olacaktır. n Örnek verilerinin analizi x Örnek İstatistiği
20 Tanım: İstatistik Verilerin toplanması, analizi ve yorumlanması için gerekli yöntemlerin geliştirilip uygulanması ile uğraşan ve sonuçta verilerden gidilerek bulunan olasılık deyimleri ile objektif karar vermede önemli rol oynayan bir yöntemler bilimidir.
21 Değişken Tipleri Kategorik değişkenler (nitel değişkenler olarak da bilinir) yalnızca evet ve hayır gibi kategorilere yerleştirilebilen değerleri içerir. "Şu an kendi tahviliniz var mı? " (Evet veya hayır) ve tahvil fonunun risk seviyesi (ortalama, ortalama veya ortalamanın altında) kategorik değişkenlere örnektir. Sayısal değişkenler (nicel değişkenler olarak da bilinir) miktarları temsil eden değerlere sahiptir. Sayısal değişkenler ayrıca kesikli veya sürekli değişkenler olarak tanımlanır.
22 Değişken Tipleri Kesikli değişkenlerin sayım işleminden kaynaklanan sayısal değerleri vardır. "Abone olunan birinci sınıf kablo kanallarının sayısı" "satın alınan ürünlerin sayısı " Sürekli değişkenler, bir ölçüm sürecinden kaynaklanan sayısal değerler üretir. Bir bankada çalışanların hizmetini beklediğiniz süre, bekleme süreniz kullanılan ölçüm cihazının hassasiyetine bağlı olarak 1 dakika, 1. 11 dakika veya 1. 113 dakika olabilir.
23
24 Şans Değişkeni Tanımlı olduğu aralıktaki belirli değerleri alma olasılıkları belirli olasılık (matematiksel) fonksiyonları ile hesaplanabilen değişkenlerdir. Örnekler: Bir madeni para belirli sayıda havaya atıldığında üst yüzüne gelen yazı ya da tura sayısı Bir zarda 6 gelinceye kadar yapılan atış sayısı
25 Ölçümlerin Ölçekleri Değişkenler için olan değerler, ölçüm ölçeğine göre sınıflandırılabilir. Kategorik bir değişkenin değerlerini tanımlamak için nominal ölçek ve sıralı ölçek terimlerini kullanır. Sayısal değerleri tanımlamak için aralık ölçeği ve oran ölçeği terimlerini kullanır.
26 Nominal Ölçek Anakütleden veya örnekten elde edilen her birimi basitçe kategorilere ayırır. Verilerin sırası anlamsızdır. Örneğin; 50 yöneticiden alınan örnekte her bireyin siyasi parti bağlantısı (demokrat, sosyalist, cumhuriyetçi). İstatistik dersi alan her bir öğrencinin cinsiyeti (kadın, erkek) 2011 yılında maksimum satış gelirine sahip olan 100 Türk firmasının bulunduğu il. (İzmir, Kayseri, vb. )
27 Nominal Ölçek Kategoriler, demokrat: 1, cumhuriyetçi: 2 , sosyalist: 3 olacak şekilde kodlanabilir. Ancak bu sayılar sadece her bir kategorinin kodudur, sayısal anlamda bir önem arz etmezler.
Sıralı Ölçek 28 Anakütle ya da örnekten alınan her birimin ilgilen özelliğine göre sıralanmasına olanak sağlayan ölçümlerdir. Örneğin; Seyahate çıkan 30 kişiden her birinin kiraladıkları arabaların boyutları: küçük, orta ölçekli, büyük ölçekli. Piyasadaki 4 ayrı markada üretilen makarnanın tadına bakan kişi tarafından sıralanması. Alınan 20 işçinin çalışma performanslarının müdür tarafından 1’den 10’a kadar sıralanması.
Aralık Ölçeği 29 Bir anakütleden ya da örnekten alınan birimin sahip olduğu ölçülebilen özelliklerinin bir diğerinden ne kadar az ya da çok olduğunu karşılaştırma imkanı sağlar. Örneğin; Erimeye başlayan ısıya dayanıklı plastiğin her 20 parçasında bir ölçülmüş sıcaklık değerleri, Ülke genelinde yapılan bir araştırmada üniversiteye giriş sınavından alınan puanlar, Bir ürünün kalitesine 1 (çok kötü) ile 5 (çok iyi) arasında puan vermek,
30 Aralık Ölçeği Aralık veri ile ölçülen özellik bakımından birimler arasındaki fark tanımlanabilir. Verilerin birbirlerinden farkları anlamlıdır. Aralık veride ekleme çıkarma yapılabilmesine rağmen, veriyi çoğaltmak ya da bölmek doğru değildir. Çünkü bu tür veriler için 0 değeri anlamlı değildir.
Oran Ölçeği 31 Bir örnek ya da anakütleden alınan birimin ilgilen özelliğinin diğerine oranını belirlemeye olanak sağlayan bir ölçektir. Oran verileri her zaman sayısaldır. Örneğin; 100 Türk firmasının satış gelirleri, Türkiye’nin son 5 yıl içindeki her bir ayı için işsizlik oranları,
Oran Ölçeği Dikkat edilmesi gereken husus, sahip olunan satış gelirleri, işsizlik oranları veya çalışan yönetici bayan sayısı gibi özellikler birimin bütün özelliklerini yansıtır. Sonuç olarak, bu da iki birim arasındaki ölçümü anlamlı kılar. Örneğin; 100 milyon $ satış gelirine sahip bir firma, 50 milyon $ satış gelirine sahip olan bir firmadan iki kat daha fazla gelire sahiptir yorumunu yapabiliriz. .
33 Verilerin Toplanması Veri topladığınızda, birincil veri kaynağı veya ikincil bir veri kaynağı kullanırsınız. Analiz için kendi verilerinizi topladığınızda birincil veri kaynağı kullanıyorsunuzdur. Veriler başkaları tarafından toplanmışsa, ikincil bir kaynak kullanıyorsunuz demektir. Veri kaynakları dört yoldan biriyle oluşturulur: • Bir organizasyon ya da birey tarafından dağıtılan verilere göre • Tasarlanmış bir deneyin sonuçları olarak • Bir anketin yanıtları • Gözlemsel bir çalışmanın sonucunda
34 İstatistik Analizlerde Bilgisayar Kullanımı SPSS Minitab SAS R Programlama Dili Excel
- Slides: 34