DESKRIPSI DATA STATISTIKA DESKRIPTIF Outline Penyajian Data Teknik

  • Slides: 24
Download presentation
DESKRIPSI DATA (STATISTIKA DESKRIPTIF)

DESKRIPSI DATA (STATISTIKA DESKRIPTIF)

Outline �Penyajian Data : - Teknik Grafis (Graphical Technique) - Teknik Numeris (Numerical Technique)

Outline �Penyajian Data : - Teknik Grafis (Graphical Technique) - Teknik Numeris (Numerical Technique)

Teknik Grafis (Graphical Techniques) �Peringkasan data secara visual atau grafis yang menggunakan gambar berdasarkan

Teknik Grafis (Graphical Techniques) �Peringkasan data secara visual atau grafis yang menggunakan gambar berdasarkan tabel data yang telah ada sebelumnya �Teknik Grafis : - Pie Chart - Bar Chart - Histogram Frekuensi - Ogive - Stem and Leaf Plot - Box Plot

Pie Chart (Diagram Pia) �Data digambarkan dengan suatu lingkaran yang sektor-sektornya menggambarkan proporsi variabel

Pie Chart (Diagram Pia) �Data digambarkan dengan suatu lingkaran yang sektor-sektornya menggambarkan proporsi variabel yang berbeda

Bar Chart (Diagram Batang) �Data digambarkan menggunakan sumbu X dan Y dimana sumbu X

Bar Chart (Diagram Batang) �Data digambarkan menggunakan sumbu X dan Y dimana sumbu X menunjukkan variabel yang digunakan sedangkan sumbu Y menunjukkan banyaknya kejadian

Histogram & Poligon Frekuensi �Data diringkas dalam bentuk grafik yang mencerminkan distribusi frekuensi. Diperlukan

Histogram & Poligon Frekuensi �Data diringkas dalam bentuk grafik yang mencerminkan distribusi frekuensi. Diperlukan sumbu X untuk menyatakan interval kelas dan sumbu Y untuk menyatakan frekuensi kelas

Ogive (Poligon Frekuensi Kumulatif) �Data diringkas dalam bentuk grafik yang merupakan grafik dari distribusi

Ogive (Poligon Frekuensi Kumulatif) �Data diringkas dalam bentuk grafik yang merupakan grafik dari distribusi frekuensi kumulatif lebih dari atau kurang dari.

Stem and Leaf Plot (Diagram Batang dan Daun) �Diperkenalkan oleh John Tuckey (1977) �Data

Stem and Leaf Plot (Diagram Batang dan Daun) �Diperkenalkan oleh John Tuckey (1977) �Data dirangkum dalam bentuk batang dan daun (stem and leaf). �Jika ukuran data besar maka stem dapat dibuat menjadi dua baris

Box Plot (Diagram Kotak – Box and Whisker plot) �Peringkasan data menggunakan diagram kotak

Box Plot (Diagram Kotak – Box and Whisker plot) �Peringkasan data menggunakan diagram kotak untuk menggambarkan apakah data mempunyai outlier (data ekstrim) atau tidak

�Untuk membuat Box Plot, ada beberapa hal yang harus diketahui : - Nilai minimum

�Untuk membuat Box Plot, ada beberapa hal yang harus diketahui : - Nilai minimum - Nilai maksimum - Median (Q 2 = kuartil ke-2) - Lower Quartile (Q 1 = kuartil ke-1) - Upper Quartile (Q 3 = kuartil ke-3) - IQR (Inter Quartile Range ) = Q 3 -Q 1 - LIF (Lower Inner Fence) = Q 1 – 1, 5 IQR - UIF (Upper Inner Fence) = Q 3 + 1, 5 IQR - LOF (Lower Outer Fence) = Q 1 – 3 IQR - UOF (Upper Outer Fence) = Q 3 + 3 IQR

Contoh �Misalkan dimiliki data berikut : 5, 3 4, 0 12, 5 3, 0

Contoh �Misalkan dimiliki data berikut : 5, 3 4, 0 12, 5 3, 0 3, 9 6, 4 5, 2 2, 6 15, 8, 6, 2 4, 0 7, 1 3, 4 4, 4 3, 5 3, 4 3, 2 5, 6 3, 2 3, 4 8, 6 3, 1 n = 22, nilai minimum = 2, 6, nilai maksimum = 15, 8 Data terurut : 2, 6 3, 0 3, 1 3, 2 3, 4 3, 5 3, 7 3, 9 4, 0 4, 4 5, 2 5, 3 5, 6 6, 2 6, 4 7, 1 8, 6 12, 5 15, 8

�Lokasi Median : (n+1)/2 = 23/2 = 11, 5 �Median (4, 0 + 4,

�Lokasi Median : (n+1)/2 = 23/2 = 11, 5 �Median (4, 0 + 4, 0)/2 = 4, 0 �Mean = 5, 4 �Lokasi Q 1 : (lokasi median dibulatkan ke bawah + 1)/2 yaitu lokasi ke 6 dari nilai minimum Q 1 = 3, 4 �Lokasi Q 3 : (lokasi median dibulatkan ke bawah + 1)/2 yaitu lokasi ke 6 dari nilai maksimum

�IQR = Q 3 -Q 1 = 6, 2 – 3, 4 = 2,

�IQR = Q 3 -Q 1 = 6, 2 – 3, 4 = 2, 8 �LIF = Q 1 - 1, 5 IQR = 3, 4 – 1, 5 (2, 8) = - 0, 8 �UIF = Q 3 + 1, 5 IQR = 6, 2 + 1, 5 (2, 8) = 10, 4 �LOF = Q 1 - 3 IQR = 3, 4 – 3 (2, 8) = - 5 �UOF = Q 3 + 3 IQR = 6, 2 + 3 (2, 8) = 14, 6 Data yang terletak antara LIF dan UIF bukan outlier Data yang terletak di luar LIF dan UIF adalah outlier yang dibedakan menjadi 2 yaitu mild outlier dan extrem outlier

Boxplot - Contoh � Bila semua data terletak antara LIF dan UIF maka data

Boxplot - Contoh � Bila semua data terletak antara LIF dan UIF maka data tidak memiliki outlier � Data terletak antara IF dan OF disebut mild outlier (tanda bulat) � Data terletak di luar OF disebut extreme outlier (tanda bintang)

Penyusunan distribusi frekuensi 1. Interval kelas harus dipilih dengan ketentuan : - seluruh data

Penyusunan distribusi frekuensi 1. Interval kelas harus dipilih dengan ketentuan : - seluruh data harus disertakan - data harus dimasukkan sekali, hanya di satu kelas. 2. Umumnya banyaknya kelas interval antara 5 sampai 20. 3. Lebar interval kelas dianjurkan sama (biasanya kelipatan angka 5). Sebagai perkiraan awal lebar interval kelas digunakan rumus : c = R/k dengan c = lebar interval kelas, R = kisaran data (range)

�Interval kelas dapat dihitung dengan rumus Sturge : k = 1 + 3, 3

�Interval kelas dapat dihitung dengan rumus Sturge : k = 1 + 3, 3 log(n) dengan k = banyaknya kelas dan n = ukuran sampel data (sample size) Range : Nilai maks – nilai min 4. Dihindari interval kelas terbuka karena untuk keperluan analisis tidak bisa digunakan 5. Jika mungkin, interval kelas dipilih sedemikian rupa sehingga nilai tengah kelasnya bersesuaian dengan nilai dimana data aktual terkonsentrasi

Contoh Distribusi Frekuensi �Diketahui data nilai ujian statistika untuk 80 orang mahasiswa sebagai berikut:

Contoh Distribusi Frekuensi �Diketahui data nilai ujian statistika untuk 80 orang mahasiswa sebagai berikut: 79 79 48 74 81 98 87 80 80 84 90 70 91 93 82 78 70 71 92 38 56 81 74 73 68 72 85 51 65 93 83 86 90 35 83 73 74 43 86 88 92 93 76 71 90 72 67 75 80 91 61 72 97 91 88 81 70 74 99 95 80 59 71 77 63 60 83 82 60 67 89 63 76 63 88 70 66 67 79 75

�Data terbesar = 99; Data terkecil = 35 Rentang = 99 -35 = 64

�Data terbesar = 99; Data terkecil = 35 Rentang = 99 -35 = 64 �Banyak kelas = 1 + 3, 3 log(n) = 1 + 3, 3 log(80) = 1 + 3, 3 (1, 9031) = 7, 2 (7 atau 8) �P=rentang/banyak kelas = 64/7 = 9, 14 (Gunakan 9 atau 10)

�Pilih batas bawah kelas interval pertama. Bisa diambil sama dengan data terkecil atau nilai

�Pilih batas bawah kelas interval pertama. Bisa diambil sama dengan data terkecil atau nilai data yang lebih kecil dari data terkecil tetapi selisihnya harus kurang dari panjang/lebar kelas yang telah ditentukan. �Dengan p=9 dan mulai dengan data yang lebih kecil dari data terkecil, dipilih 31 maka kelas interval pertama 31 -40, 41 -50 dst. �Buatlah tabel untuk memasukkan kelas-kelas interval yang sudah

Nilai Ujian Mahasiswa

Nilai Ujian Mahasiswa

�Interval kelas (Class interval) : interval yang mendefinisikan sebuah kelas, sebagai contoh pada tabel

�Interval kelas (Class interval) : interval yang mendefinisikan sebuah kelas, sebagai contoh pada tabel adalah 31 -40, 4150, . . . , dst. �Batas kelas (class limit) : angka-angka pada ujung interval kelas , sebagai contoh 31, 40, 41, 50 , dst. �Batas kelas bawah (lower class limit) : batas kelas untuk angka yang lebih kecil dibandingkan batas kelas lain pada interval kelas yang sama, sebagai contoh 31, 41, 51, dst.

�Batas kelas atas (upper class limit) : batas kelas untuk angka yang lebih besar

�Batas kelas atas (upper class limit) : batas kelas untuk angka yang lebih besar dibandingkan batas kelas lain pada interval kelas yang sama, sebagai contoh 40, 50, 60, dst. �Batas Nyata kelas (class boundary) : batas kelas atas suatu interval ditambah batas kelas bawah interval kelas berikutnya dibagi dua, sebagai contoh 30, 5 dan 40, 5, dst. �Lebar Interval Kelas (width of interval class) : selisih antara batas nyata kelas dengan batas bawah nyata kelas, sebagai contoh c = 40, 5 -30, 5 = 10.

�Nilai Tengah Kelas (Class Midpoint/Class Mark) : nilai yang diperoleh dengan membagi dua jumlah

�Nilai Tengah Kelas (Class Midpoint/Class Mark) : nilai yang diperoleh dengan membagi dua jumlah dari batas kelas bawah dan batas kelas atas suatu interval kelas, sebagai contoh untuk interval kelas 3140 nilai tengah kelasnya adalah (31+40)/2=35, 5.

�Dari tabel distribusi frekuensi tersebut dapat juga dibuat : - Histogram frekuensi - Poligon

�Dari tabel distribusi frekuensi tersebut dapat juga dibuat : - Histogram frekuensi - Poligon frekuensi - Distribusi frekuensi kumulatif : * Kurang dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih kecil dari pada batas nyata interval kelas. * Lebih dari disusun dengan menjumlahkan seluruh frekuensi dari semua nilai yang lebih besar dari pada atau sama dengan batas bawah nyata interval kelas.