UKURAN PENYEBARAN VARIABILITAS PENGUKURAN DISPERSI KEMIRINGAN DAN KERUNCINGAN

UKURAN PENYEBARAN (VARIABILITAS)

PENGUKURAN DISPERSI, KEMIRINGAN, DAN KERUNCINGAN DATA • DISPERSI DATA Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu kelompok data terhadap pusat data. • Ukuran Dispersi yang akan dipelajari: q. Jangkauan (Range) q. Simpangan rata – rata (mean deviation) q. Variansi (variance) q. Standar Deviasi (Standard Deviation) q. Simpangan Kuartil (quartile deviation) q. Koefisien variasi (coeficient of variation) Dispersi multak Dispersi relatif

RANGE/ JANGKAUAN DATA (r) • Range: Selisih nilai maksimum dan nilai minimum Rumus: Range (r) = Nilai max – nilai min • Range untuk kelompok data dalam bentuk distribusi frekuensi diambil dari selisih antara nilai tengah kelas maksimum – nilai tengah kelas minimum

Simpangan Rata 2/ Mean Deviation (SR) • Simpangan rata – rata: jumlah nilai mutlak dari selisih semua nilai dengan nilai rata – rata, dibagi banyaknya data. • Rumus • Untuk data tidak berkelompok Dimana: X = nilai data = rata – rata hitung n = banyaknya data

• Untuk data berkelompok Dimana: X = nilai data = rata – rata hitung n = Σf = jumlah frekuensi VARIANSI/ VARIANCE • Variansi adalah rata – rata kuadrat selisih atau kuadrat simpangan dari semua nilai data terhadap rata – rata hitung. = simbol untuk sample = simbol untuk populasi

• Rumus untuk data tidak berkelompok • Untuk data berkelompok

STANDAR DEVIASI/ STANDARD DEVIATION (S) • Standar deviasi: akar pangkat dua dari variansi • Rumus: Untuk data tidak berkelompok Untuk data berkelompok

Contoh Soal • Data tidak berkelompok Diketahui sebuah data berikut: 20, 50, 30, 70, 80 Tentukanlah: a. Range (r) b. Simpangan Rata – rata (SR) c. Variansi d. Standar Deviasi

• Jawab: a. Range (r) = nilai terbesar – nilai terkecil = 80 – 20 = 60 b. Simpangan Rata – rata (SR): n=5

• Variansi • Standar Deviasi (S)

Contoh Soal • Data Berkelompok Diketahui data pada tabel dibawah ini: Modal Frekuensi 112 - 120 4 121 - 129 5 130 - 138 8 139 - 147 12 148 -156 5 157 -165 4 166 - 174 2 40 Tentukan: a. Range (r) b. Simpangan rata – rata (SR) c. Variansi d. Standar Deviasi

JAWAB • Range (r)= (nilai tengah tertinggi – nilai tengah terendah)/2 • Simpangan rata – rata • Variansi • Standar Deviasi n = jml frekuensi

• Untuk memudahkan mencari jawaban, maka dibuat tabel sesuai dengan keperluan jawaban Modal f Nilai Tengah (X) 112 - 120 4 116 24, 525 98, 100 601, 476 2405, 902 121 - 129 5 125 15, 525 77, 625 241, 026 1205, 128 130 - 138 8 134 6, 525 52, 200 42, 576 340, 605 139 - 147 12 143 2, 475 29, 700 6, 126 73, 507 148 -156 5 152 11, 475 57, 375 131, 676 658, 378 157 -165 4 161 20, 475 81, 900 419, 226 1676, 902 166 - 174 2 170 29, 475 58, 950 868, 776 1737, 551 Jumlah 40 455, 850 8097, 974

Maka dapat dijawab: • Range (r) = 170 – 116 = 54 • Simpangan rata – rata • Variansi • Standar Deviasi

JANGKAUAN QUARTIL DAN JANGKAUAN PERSENTIL 10 -90 • Jangkauan kuartil disebut juga simpangan kuartil, rentang semi antar kuartil, deviasi kuartil. Jangkauan persentil 10 -90 disebut juga rentang persentil 10 -90 • Jangkauan kuartil dan jangkauan persentil lebih baik daripada jangkauan (range) yang memakai selisih antara nilai maksimum dan nilai minimun suatu kelompok data • Rumus: Jangkauan Kuartil: Ket: JK: jangkauan kuartil Q 1: kuartil bawah/ pertama Q 3: kuartil atas/ ketiga

• Rumus Jangkauan Persentil • KOEFISIEN VARIASI/ DISPERSI RELATIF q Untuk mengatasi dispersi data yang sifatnya mutlak, seperti simpangan baku, variansi, standar deviasi, jangkauan kuartil, dll q Untuk membandingkan variasi antara nilai – nilai bersar dengan nilai – nilai kecil. q Untuk mengatasi jangkauan data yang lebih dari 2 kelompok data. Rumus: Ket: KV: Koefisien variasi S : Standar deviasi X : Rata – rata hitung

KOEFISIEN VARIASI KUARTIL • Alternatif lain untuk dispersi relatif yang bisa digunakan jika suatu kelompok data tidak diketahui nilai rata – rata hitungnya dan nilai standar deviasinya. • Rumus: atau

NILAI BAKU • Nilai baku atau skor baku adalah hasil transformasi antara nilai rata – rata hitung dengan standar deviasi • Rumus: Nilai i = 1, 2, 3, …, n

Contoh Soal untuk Koefisien Variasi dan Simpangan Baku • Koefisien Variasi Ada dua jenis bola lampu. Lampu jenis A secara rata – rata mampu menyala selama 1500 jam dengan simpangan baku (standar deviasi) S 1 = 275 jam, sedangkan lampu jenis B secara rata – rata dapat menyala selama 1. 750 jam dengan simpangan baku S 2 = 300 jam. Lampu mana yang kualitasnya paling baik? Jawab: Lampu jenis A: Lampu jenis B:

• Nilai rata – rata ujian akhir semester mata kuliah Statistika dengan 45 mahasiswa adalah 78 dan simpangan baku/standar deviasi (S) = 10. Sedangkan untuk mata kuliah Bahasa Inggris di Kelas itu mempunyai nilai rata – rata 84 dan simpangan bakunya (S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk kalkulus adalah 86 dan untuk bahasa Inggris adalah 92, bagaimana posisi/ prestasi Desi di kelas itu? • Jawab • Untuk mengetahui posisi/ prestasi Desi, maka harus dicari nilai baku (Z) dari kedua mata kuliah tersebut. dengan nilai X adalah nilai UAS yang diperoleh Desi

• Untuk Mata Kuliah Statistika X = 86 Maka: S = 10 • Untuk Mata Kuliah Bahasa Inggris X = 92 S = 18 Maka: Karena nilai baku (Z) untuk mata kuliah Statistika lebih besar dari B. Inggris, maka posisi Desi lebih baik pada mata kuliah Statistika dari pada B. Inggris

KEMIRINGAN DATA • Kemiringan: derajat/ ukuran dari ketidaksimetrian (asimetri) suatu distribusi data • 3 pola kemiringan distribusi data, sbb: – Distribusi simetri (kemiringan 0) – Distribusi miring ke kiri (kemiringan negatif) – Distribusi miring ke kanan (kemiringan positif)


• Beberapa metoda yang bisa dipakai untuk menghitung kemiringan data, yaitu: – Rumus Pearson – Rumus Momen – Rumus Bowley • Rumus Pearson (α) atau

• Rumus tersebut dipakai untuk data tidak berkelompok maupun data berkelompok. – Bila α = 0 atau mendekati nol, maka dikatakan distribusi data simetri. – Bila α bertanda negatif, maka dikatakan distribusi data miring ke kiri. – Bila α bertanda positif, maka dikatakan distribusi data miring ke kanan. – Semakin besar α, maka distribusi data akan semakin miring atau tidak simetri

RUMUS MOMEN • Cara lain yang dipakai untuk menghitung derajat kemiringan adalah rumus momen derajat tiga, yaitu • Untuk data tidak berkelompok: • Untuk data berkelompok

• Khusus untuk data berkelompok dalam bentuk tabel distribusi frekuensi , derajat kemiringan α 3 dapat dihitung dengan cara transformasi sebabai berikut: – Jika α 3 = 0, maka distribusi data simetri – Jika α 3 < 0, maka distribusi data miring ke kiri – Jika α 3 > 0, maka distribusi data miring ke kanan

– Untuk mencari nilai Standar menggunakan variabel U: – Variabel U = 0, ± 1, ± 2, ± 3, dst. • RUMUS BOWLEY deviasi (S)

KERUNCINGAN DISTRIBUSI DATA • Keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya. • Keruncingan data disebut juga kurtosis, ada 3 jenis yaitu: – Leptokurtis – Mesokurtis – Platikurtis

KERUNCINGAN DISTRIBUSI DATA

• Keruncingan distribusi data (α 4) dihitung dengan rumus: • Data tidak berkelompok • Data Berkelompok

• Khusus untuk transformasi • Keterangan – α 4 = 3, distribusi data mesokurtis – α 4 > 3, distribusi data leptokurtis – α 4 < 3, distribusi data platikurtis

• Selain cara di atas, untuk mencari keruncingan data, dapat dicari dengan menggunakan rumus: K= Koefisien Kurtorsis Persentil • Keterangan – K = 0, 263 maka keruncingan distribusi data mesokurtis – K > 0, 263 maka keruncingan distribusi data leptokurtis – K < 0, 263 maka keruncingan distribusi data platikurtis

REGRESI DAN KORELASI • Pada bab ini akan membahas dua bagian yang saling berhubungan, khususnya dua kejadian yang dapat diukur secara matematis. • Dalam hal dua kejadian yang saling berhubungan, ada dua hal yang perlu diukur dan dianalisis, yaitu: – Bagaimana hubungan fungsional (persamaan matematis) antara dua kejadian tersebut -> analisis regresi – Bagaimana kekuatan (keeratan) hubungan dua kejadian itu -> analisis korelasi

REGRESI LINEAR SEDERHANA • Garis regresi/ regresi: garis lurus/ garis linear yang merupakan garis taksiran atau perkiraan untuk mewakili pola hubungan antara variabel X dan variabel Y. • Cara untuk mencari persamaan garis regresi: Dimana Y = variabel terikat X = variabel bebas a = intersep (pintasan) bilamana X=0 b = koefisien arah (slope) dari garis regresi

• Koefisien regresi a dan b dapat dicari dengan rumus:

Rumus lain untuk menghitung koefisien a dan b adalah:

• Kita dapat membuat garis regresi lebih dari satu dari suatu data. Lalu garis regresi manakah yang paling baik? ? • Garis regresi yang paling baik adalah garis regresi yang mempunyai total kuadrat kesalahan/ total kuadrat selisih/ total kuadrat eror yang paling minimum. • Total kuadrat eror dapat dihitung dengan:

Selanjutnya bila diambil akarnya, maka diperoleh: Bentuk terakhir ini disebut Kesalahan baku dari penafsiran Atau disebut juga Standard error of estimate Rumus di atas dapat di jabarkan menjadi:

Nih…. . Contoh Soal Regresi…… Berat Badan 2 3 4 5 6 7 8 Tinggi Badan 4 5 2 3 9 6 7 Tentukanlah persamaan regresi dan kesalahan baku penafsirannya! Jawab: Persamaan regresi adalah: Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b. Cara mencari nilai a dan b adalah:

Untuk mempermudah mencari nilai – nilai yang diperlukan, maka akan digunakan tabel. Berat Badan (X) 2 3 4 5 6 7 8 ∑X = 35 Tinggi Badan (Y) 4 5 2 3 9 6 7 ∑Y = 36 X 4 9 16 25 36 49 64 ∑X = 203 XY 8 15 54 42 56 ∑XY = 198 Masukan nilai – nilai yang telah diketahui, ke dalam rumus untuk mencari nilai a dan b: (∑X) = 1225

Setelah diketahui, nilai a dan b, maka masukan nilai a dan b ke dalam persamaan regresi. Hasilnya adalah: Ini persamaan regresi / hubungan dari variabel X dan Y tadi…. Ngerti kan? ? b. Mencari nilai kesalahan baku dari penafsiran.

Masukan nilai X ke dalam persamaan regresi untuk mencari nilai Y regresi Berat Badan (X) 2 3 4 5 6 7 8 Tinggi Badan (Y) 4 5 2 3 9 6 7 3. 21 3, 85 4, 49 5, 13 5, 77 6, 41 7, 05 0, 79 1, 15 -2, 49 -2, 13 3, 33 -0, 41 -0, 05 0, 6241 1, 3225 6, 2001 4, 5369 11, 0889 0, 1681 0, 0025 23, 9431 Cara mencari nilai Y regresi, masukan nilai masing – masing X ke dalam persamaan regresi.


Maka nilai kesalahan baku dari taksiran regresi adalah: Akhirnya…. Terjawab semuanya…. Mudah kan? ^^ Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan linear, yaitu: 1. Parabola kuadrat Sekedar buat 2. Parabola kubik pengetahuan aja, , , ga 3. Eksponen dipelajari di bab ini…. . 4. Geometrik Tapi kalo mau, , 5. Logistik otodidak aja ya… 6. Hiperbola 7. Gompertz

KOEFISIEN KORELASI • Perumusan koefisien korelasi dilakukan dengan memakai perbandingan antara variasi yang dijelaskan dengan variasi total. • Variasi total dari Y terhadap dirumuskan oleh • Variasi yang tidak dijelaskan Variasi yang dijelaskan

• Perbandingan antara variasi yang dijelaskan dengan variasi total, yaitu: adalah koefisien determinasi • Koefisien korelasi (r) adalah akar dari koefisien determinasi Rumus r pertama

Keterangan: 1. Nilai r = -1 disebut korelasi linear negatif (berlawanan arah); artinya terdapat hubungan negatif yang sempurna antara variabel X dan Y 2. Nilai r = 1 disebut korelasi linear positif (searah); artinya terdapat hubungan positif yang sempurna antara variable X dengan variabel Y 3. Nilai r = 0 disebut tidak berkorelasi secara linear, artinya tidak ada hubungan antara variabel X dan Y

Koefisien korelasi dapat juga dicari dengan rumus berikut: Dimana: = kuadrat dari kesalahan baku Rumus r kedua = variansi Y Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah menjadi: Dimana: Disebut juga koefisien korelasi produk momen

Dari rumus terakhir, yaitu koefisien korelasi produk momen (product momen formula) Apabila kita ambil: Merupakan kovarians dari X dan Y Merupakan simpangan baku dari X Merupakan simpangan baku dari Y Merupakan variansi dari X

Dengan demikian, maka rumus koefisien korelasi dapat juga ditulis: Gmana? ? ? Bingung rumus mana yang harus digunakan? ? ? Ga usah khawatir… sesuaikan aja sama data yang diketahui…. . OK? !!

• Arti dari koefisien korelasi r adalah: 1. Bila 0, 90 < r < 1, 00 atau -1, 00 < r < -0, 90: artinya hubungan yang sangat kuat 2. Bila 0, 70 < r < 0, 90 atau -0, 90 < r < -0, 70: artinya hubungan yang kuat 3. Bila 0, 50 < r < 0, 70 atau -0, 70 < r < -0, 50: artinya hubungan yang moderat 4. Bila 0, 30 < r < 0, 50 atau -0, 50 < r < -0, 30: artinya hubungan yang lemah 5. Bila 0, 0 < r < 0, 30 atau -0, 30 < r < 0, 0: artinya hubungan yang sangat lemah

Contoh soalnya nih…. Biar lebih ngerti……. Soalnya sama aja dengan yang regresi ya…. Berat Badan 2 3 4 5 6 7 8 Tinggi Badan 4 5 2 3 9 6 7 Tentukanlah: 1. Koefisien korelasi (r) dan artinya 2. Koefisien determinasi dan artinya Jawab:

Berat Badan (X) 2 3 4 5 6 7 8 ∑X = 35 Tinggi Badan (Y) 4 5 2 3 9 6 7 ∑Y = 36 X 4 9 16 25 36 49 64 ∑X = 203 XY 8 15 54 42 56 ∑XY = 198 Y 16 25 4 9 81 36 49 ∑Y = 220 Koefisien korelasi adalah: (∑X) = 1225 (∑Y) = 1296

Truz….

Kesimpulannya…. ? ? Oleh karena, nilai r = 0, 49 terletak antara 0, 30 dan 0, 50 maka terdapat hubungan positif yang lemah antara tinggi badan berat badan. Koefisien determinasi, yaitu Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X) Mahasiswa oleh persamaan regresi adalah Sebesar 24, 01 %. Sisanya 75, 99% dipengaruhi oleh faktor lain.

TUGAS 2 • Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini. Kecepatan mesin permenit 8 9 10 11 12 13 15 16 Jumlah kerusakan kertas (lembar) 6 7 8 5 7 10 12 9

• Tentukanlah: 1. Persamaan regresi linear 2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 18? 3. Tentukan kesalahan baku yang diberikan oleh persamaan regresi! 4. Tentukanlah koefisien korelasi dan koefisien determinasi data tersebut serta berikan artinya masing – masing! Deadline… Next week… Don’t be late OK!!!!


STATISTIKA SEMESTER 4 QUIZ 3 Selasa, 2 Juni 2009 • Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini. Kecepatan mesin permenit 7 8 9 10 11 12 14 15 Jumlah kerusakan kertas (lembar) 5 6 7 4 6 9 11 8 • Tentukanlah: 1. Persamaan regresi linear 2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 20?
- Slides: 60