Metode Statistika STK 211 Pertemuan II Statistika Dasar

  • Slides: 48
Download presentation
Metode Statistika (STK 211) Pertemuan II Statistika Dasar (Basic Statistic) 1

Metode Statistika (STK 211) Pertemuan II Statistika Dasar (Basic Statistic) 1

Konsep Peubah • Definisi – Peubah (variable) merupakan karakteristik dari objek yang sedang diamati,

Konsep Peubah • Definisi – Peubah (variable) merupakan karakteristik dari objek yang sedang diamati, seperti tinggi tanaman, produksi, dll • Skala pengukuran peubah – Nominal : mengklasifikasikan – Ordinal : mengklasifikasikan dan mengurutkan – Interval : mengklasifikasikan, mengurutkan dan membedakan – Rasio : mengklasifikasikan, mengurutkan, membedakan dan membandingkan 2

Statistika Deskripsi dan Eksplorasi • Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi

Statistika Deskripsi dan Eksplorasi • Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. • Penyajian data dapat dilakukan melalui: – Tabel – Gambar (histogram, plot, stem-leaf, box-plot) • Peringkasan data dinyatakan dalam dua ukuran yaitu: – Pemusatan (Median, Modus, Kuartil, Mean, dll) – Penyebaran (Range, Interquartile Range, Ragam) 3

Tabular and Graphical Procedures Data Qualitative Data Quantitative Data Tabular Methods Graphical Methods Tabular

Tabular and Graphical Procedures Data Qualitative Data Quantitative Data Tabular Methods Graphical Methods Tabular Methods • Frequency Distribution • Rel. Freq. Dist. • Percent Freq. Distribution • Crosstabulation • Bar Graph • Pie Chart • Frequency Distribution • Rel. Freq. Dist. • Cum. Rel. Freq. Distribution • Stem-and-Leaf Display • Crosstabulation Graphical Methods • Dot Plot • Histogram • Scatter Diagram 4

No Sex Tinggi Berat Agama 1 1 167 63 Islam 2 1 172 74

No Sex Tinggi Berat Agama 1 1 167 63 Islam 2 1 172 74 Islam 3 0 161 53 Kristen 4 0 157 47 Hindu 5 1 165 58 Islam 6 0 167 60 Islam 7 1 162 52 Budha 8 0 151 45 Katholik 9 0 158 54 Kristen 10 1 162 63 Islam 11 1 176 82 Islam 12 1 167 69 Islam 13 0 163 57 Kristen 14 0 158 60 Islam 15 1 164 58 Katholik 16 0 161 50 Islam 17 1 159 61 Kristen 18 1 163 65 Islam 19 1 165 62 Islam 20 0 169 59 Islam 21 1 173 70 Islam Ilustrasi I 5

Penyajian Tabel Rekapitulasi menurut Agama Rekapitulasi menurut Sex Frekuensi Persen 13 61. 90 Sex

Penyajian Tabel Rekapitulasi menurut Agama Rekapitulasi menurut Sex Frekuensi Persen 13 61. 90 Sex Kristen 4 19. 05 Laki-laki Katholik 2 9. 52 Hindu 1 4. 76 Budha 1 4. 76 Islam Frek. Persen 12 57. 14 9 42. 86 Perempuan Rata-rata Tinggi & Berat Tinggi Berat Laki-laki 166. 25 64. 75 Perempuan 160. 56 53. 89 Gabungan 163. 81 60. 10 6

Penyajian Grafik 7

Penyajian Grafik 7

Ilustrasi II Data Pengamatan Tanaman Penyajian Dengan Tabel Tinggi Pohon (m) Diameter Pohon (m)

Ilustrasi II Data Pengamatan Tanaman Penyajian Dengan Tabel Tinggi Pohon (m) Diameter Pohon (m) Varietas 1 3. 5 0. 25 A 2 4. 0 0. 40 A 3 2. 8 0. 20 B 4 3. 2 0. 21 C 5 3. 6 0. 30 C 6 4. 2 0. 35 C 7 2. 9 0. 22 B 8 2. 5 0. 18 B 9 3. 8 0. 38 A 10 4. 6 0. 41 A 11 2. 2 0. 15 A 12 3. 4 0. 28 D 13 4. 2 0. 37 D 14 4. 8 0. 39 D 15 5. 0 0. 40 D Obs Varietas A B C D Count 5 3 3 4 Cum. Cnt 5 8 11 15 Percent 33. 33 20. 00 26. 67 Cum. Pct 33. 33 53. 33 73. 33 100. 00 8

Penyajian Dengan Gambar 9

Penyajian Dengan Gambar 9

10

10

Penyajian Dengan Stem-Leaf 11

Penyajian Dengan Stem-Leaf 11

12

12

Penyajian Dengan Stem-Leaf Stem-and-Leaf Display: Tinggi Pohon (m), Diameter Pohon (m) Stem-and-leaf of Tinggi

Penyajian Dengan Stem-Leaf Stem-and-Leaf Display: Tinggi Pohon (m), Diameter Pohon (m) Stem-and-leaf of Tinggi Pohon (m) N = 15, Leaf Unit = 0. 10 2 2 2 589 3 24 3 568 4 022 4 68 5 0 Stem-and-leaf of Diameter Pohon (m) N = 15, Leaf Unit = 0. 010 1 58 2 012 2 58 3 0 3 5789 4 001 13

Example: Hudson Auto Repair n Sample of Parts Cost for 50 Tune-ups 14

Example: Hudson Auto Repair n Sample of Parts Cost for 50 Tune-ups 14

5 6 7 8 9 10 a stem 2 7 2 2 5 6

5 6 7 8 9 10 a stem 2 7 2 2 5 6 7 8 8 8 9 9 9 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 0 0 2 3 5 8 9 1 3 7 7 7 8 9 1 4 5 5 9 a leaf 15

Penyajian Dengan Box-plot 16

Penyajian Dengan Box-plot 16

Peringkasan Data (Pemusatan dan Penyebaran) Beberapa ukuran pemusatan, yaitu: 1. Modus: Nilai pengamatan yang

Peringkasan Data (Pemusatan dan Penyebaran) Beberapa ukuran pemusatan, yaitu: 1. Modus: Nilai pengamatan yang paling sering muncul 2. Median: Pengamatan yang ditengah-tengah dari data terurut 3. Quartil: Nilai-nilai yang membagi data terurut menjadi 4 bagian yang sama 4. Mean: merupakan pusat massa (centroid) sehingga simpangan kiri dan simpangan kanan sama besar 17

Beberapa ukuran penyebaran, yaitu: 1. Range: besarnya penyebaran data dari data terkecil sampai data

Beberapa ukuran penyebaran, yaitu: 1. Range: besarnya penyebaran data dari data terkecil sampai data terbesar 2. Interquartile Range: besarnya penyebaran data yang diukur mulai quartile satu sampai quartile tiga atau besarnya penyebaran data dari 50% pengamatan ditengah 3. Ragam: merupakan rata-rata jarak kuadrat setiap titik pengataman terhadap nilai mean (rata-rata) 18

Langkah-langkah teknis Median ◦ Urutkan data dari kecil ke besar ◦ Cari posisi median

Langkah-langkah teknis Median ◦ Urutkan data dari kecil ke besar ◦ Cari posisi median (nmed=(n+1)/2) ◦ Nilai median Jika nmed bulat, maka Median=X(n+1)/2 Jika nmed pecahan, maka Median=(X(n)/2+1)/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median) 19

 Kuartil (Quartile) Metode Belah dua ◦ Urutkan data dari kecil ke besar ◦

Kuartil (Quartile) Metode Belah dua ◦ Urutkan data dari kecil ke besar ◦ Cari posisi kuartil nq 2=(n+1)/2 nq 1=(nq 2*+1)/2= nq 3, nq 2* posisi kuartil dua terpangkas (pecahan dibuang) ◦ Nilai kuartil 2 ditentukan sama seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan. 20

 Quartiles divide the sorted data into quarters. Hence, for the first quartile (Q

Quartiles divide the sorted data into quarters. Hence, for the first quartile (Q 1) 25% of the data is below it and 75% above it The second quartile (Q 2)-this is also the median) has 50% of the data below it and 50% above it Finally, 75% of the observations are below Q 3 while 25% are above 21

22

22

Metode Interpolasi ◦ Urutkan data dari kecil ke besar ◦ Cari posisi kuartil nq

Metode Interpolasi ◦ Urutkan data dari kecil ke besar ◦ Cari posisi kuartil nq 1=(1/4)(n+1) nq 2=(2/4)(n+1) nq 3=(3/4)(n+1) ◦ Nilai kuartil dihitung sebagai berikut: Xqi=Xa, i + hi (Xb, i-Xa, i) Xa, i = pengamatan sebelum posisi kuartil ke-i, Xb, i = pengamatan setelah posisi kuartil ke-i dan hi adalah nilai pecahan dari posisi kuartil 23

 Rata-rata (Mean) ◦ Populasi: ◦ Sampel: 24

Rata-rata (Mean) ◦ Populasi: ◦ Sampel: 24

 Wilayah (Range) W=Xmax-Xmin Jarak Antar Kuartil (Interquartile range) JAK=q 3 -q 1 25

Wilayah (Range) W=Xmax-Xmin Jarak Antar Kuartil (Interquartile range) JAK=q 3 -q 1 25

 Ragam (Variance) ◦ Populasi : ◦ Sampel: 26

Ragam (Variance) ◦ Populasi : ◦ Sampel: 26

 Simpangan deviation) baku (standard ◦ Merupakan akar dari ragam yaitu simpangan baku populasi

Simpangan deviation) baku (standard ◦ Merupakan akar dari ragam yaitu simpangan baku populasi atau s simpangan baku sampel 27

Data pada ilustrasi II diolah menggunakan MINITAB Descriptive Statistics: Tinggi Pohon (m), Diameter Pohon

Data pada ilustrasi II diolah menggunakan MINITAB Descriptive Statistics: Tinggi Pohon (m), Diameter Pohon (m) Variable Tinggi Pohon (m) Diameter Pohon ( N 15 15 N* 0 0 Variable Tinggi Pohon (m) Diameter Pohon ( Q 3 4. 200 0. 3900 Mean 3. 647 0. 2993 Maximum 5. 000 0. 4100 St. Dev 0. 837 0. 0919 Range 2. 800 0. 2600 Variance 0. 700 0. 00845 Minimum 2. 200 0. 1500 Q 1 2. 900 0. 2100 Median 3. 600 0. 3000 IQR 1. 300 0. 1800 Descriptive Statistics: Tinggi Pohon (m) Variable Tinggi Pohon (m) Varietas A B C D N 5 3 3 4 N* 0 0 Variable Tinggi Pohon (m) Varietas A B C D Median 3. 800 2. 800 3. 600 4. 500 Mean 3. 620 2. 733 3. 667 4. 350 Q 3 4. 300 2. 900 4. 200 4. 950 St. Dev 0. 890 0. 208 0. 503 0. 719 Variance 0. 792 0. 0433 0. 253 0. 517 Maximum 4. 600 2. 900 4. 200 5. 000 Range 2. 400 0. 400 1. 000 1. 600 Minimum 2. 200 2. 500 3. 200 3. 400 Q 1 2. 850 2. 500 3. 200 3. 600 IQR 1. 450 0. 400 1. 000 1. 350 28

Modus Contoh: Data hasil pengamatan jumlah sumbangan perorangan (dalam Rp 1000, -): 9, 10,

Modus Contoh: Data hasil pengamatan jumlah sumbangan perorangan (dalam Rp 1000, -): 9, 10, 5, 9, 9, 7, 8, 6, 10 dan 11 Nilai yang terjadi dengan frekuensi paling tinggi (modus) = Rp 9. 000, Contoh: Data hasil pengamatan frekuensi mahasiswa nonton film per bulan: 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1 dan 4 Dalam kasus ini terdapat 2 modus, yaitu 2 dan 4 (sebaran demikian dikatakan bimodus) 29

Median Contoh: Hasil pengamatan (telah diurutkan): 1, 2, 3, 4, dan 5 Amatan yang

Median Contoh: Hasil pengamatan (telah diurutkan): 1, 2, 3, 4, dan 5 Amatan yang ditengah (median) = 3 Contoh: Hasil pengamatan (setelah dirutkan): 1, 2, 3 dan 4 Amatan yang ditengah (median) = (2+3)/2 = 2, 5 30

 For example, suppose you want to find the median for the following set

For example, suppose you want to find the median for the following set of data: 74, 66, 69, 68, 73, 70 First we arrange the data in an ordered array: 66, 68, 69, 73, 70, 74 Since there is an even number of data, the average of the middle two numbers (i. e. 69 and 73) is the median (142/2=71) 31

 Generally the median provides a better measure of location than the mean when

Generally the median provides a better measure of location than the mean when there are extremely large or small observations (i. e. , when the data are skewed to the right or to the left ◦ If the median is less than the mean, the data set is skewed to the right ◦ If the median is greater than the mean, the data is skewed to the left 32

The median is less than the mean The median is greater than the mean

The median is less than the mean The median is greater than the mean 33

Quartil Contoh: Data hasil pengamatan (setelah diurutkan) adalah: 48, 49, 57, 61, 79, 80,

Quartil Contoh: Data hasil pengamatan (setelah diurutkan) adalah: 48, 49, 57, 61, 79, 80, 81, 83 dan 90 Q 1= 57 Q 2=79, 5 Q 2 tidak lain adalah median Q 3=81 Jangkauan antar kuartil (JAK)=Q 3 -Q 1 = 81 -57 = 24 34

Contoh: Sample 1 97 98 99 100 101 102 103 Sample 2 49 50

Contoh: Sample 1 97 98 99 100 101 102 103 Sample 2 49 50 51 100 149 150 151 Sample 3 1 2 3 100 197 198 199 35

 IQ (Interquartile) range for sample 1: The median is the 4 th largest

IQ (Interquartile) range for sample 1: The median is the 4 th largest observation which is 100 There are three data points below our median (97, 98, 99) The median of these values is 98 There are three data points above our median (101, 102, 103) The median of these values is 102 Hence, our IQ range is 102 -98=4 36

Mean (Rata-rata) Contoh: Data hasil pengamatan (setelah diurutkan) adalah: 48, 49, 57, 61, 79,

Mean (Rata-rata) Contoh: Data hasil pengamatan (setelah diurutkan) adalah: 48, 49, 57, 61, 79, 80, 81, 83 dan 90 Rata-rata sampel, = 708/10 = 70, 8 Wilayah (Range), = 90 – 48 = 42 37

Varian (Ragam) Varian sampel, No. = 2. 140/(10 -1)= 238 Standar Devisasi (simpangan baku),

Varian (Ragam) Varian sampel, No. = 2. 140/(10 -1)= 238 Standar Devisasi (simpangan baku), s = akar dari ragam = 15, 43 Xi X-bar (Xi-X-bar)^2 1 48 70, 8 -22, 8 519, 84 2 49 70, 8 -21, 8 475, 24 3 57 70, 8 -13, 8 190, 44 4 61 70, 8 -9, 8 96, 04 5 79 70, 8 8, 2 67, 24 6 80 70, 8 9, 2 84, 64 7 80 70, 8 9, 2 84, 64 8 81 70, 8 10, 2 104, 04 9 83 70, 8 12, 2 148, 84 10 90 70, 8 19, 2 368, 64 Rata-rata 70, 8 Jumlah 708 2. 140 38

The Empirical Rule The Empirical Rule is applicable for approximately mound-shaped distributions and relates

The Empirical Rule The Empirical Rule is applicable for approximately mound-shaped distributions and relates X and s as follows: (figures are “rule of thumb”) 67% of all values within X s 95% of all values within X 2 s 99% of all values within X 3 s Values outside this latter range are often considered unusual. 39

Box-plot Memberi informasi visual tentang lokasi, pencaran, kemenjuluran, dan informasi tentang ekor sebaran contoh

Box-plot Memberi informasi visual tentang lokasi, pencaran, kemenjuluran, dan informasi tentang ekor sebaran contoh IQR Q 1 Me-dian Q 3 40

3, 0. IQR 1, 5. IQR Lower adjacent value IQR Q 1 Median 1,

3, 0. IQR 1, 5. IQR Lower adjacent value IQR Q 1 Median 1, 5. IQR Q 3 Upper adjacent value 3, 0. IQR Minor outlier Extrem Outlier (pencilan) 41

50 Days of Photocopier Usage Day Usage Day Usage 18 360 19 310 20

50 Days of Photocopier Usage Day Usage Day Usage 18 360 19 310 20 320 21 290 22 290 23 270 24 250 25 240 26 250 27 250 28 230 29 240 30 220 31 190 32 150 33 170 34 120 35 150 36 140 37 130 38 150 39 130 40 110 41 90 42 80 43 90 44 70 45 20 46 50 47 40 48 20 49 30 50 30 ----------------------------------------------------------------------- 1 500 2 420 3 440 4 480 5 450 6 460 7 450 8 420 9 410 405 11 380 12 360 13 360 14 370 15 350 16 320 17 350 42

Box-and-Whisker Plots Ø Most commonly called boxplots. Ø Consist of a “five-number summary” and

Box-and-Whisker Plots Ø Most commonly called boxplots. Ø Consist of a “five-number summary” and four “outlier points” Ø min, Q 1, Q 2, Q 3, max Ø Inner LOP = Q 1 -1. 5(IQR) Outer LOP = Q 1 -3(IQR) Ø Inner UOP = Q 3+1. 5(IQR) Outer UOP = Q 3+3(IQR) (L=Lower, O=outlier, P=Point, IQR=Inter Quartile Range) Ø min = 20 max = 500 Ø Q 1 = 127. 5 Q 2 = 250 Q 3 = 362. 5 Ø Inner LOP = 127. 5 - 1. 5(235) = -225. 5 copies (N/A) Outer LOP= 127. 5 - 3. 0(235) = -577. 5 copies (N/A) Ø Inner UOP = 362. 5 + 1. 5(235) = 615 copies Outer UOP= 362. 5 + 3. 0(235) = 1, 067. 5 copies NO OUTLIERS BY THESE MEASURES! 43

Soal Latihan Dari hasil pengukuran ini: 0. 0, 0. 8, 1. 0, 1. 2,

Soal Latihan Dari hasil pengukuran ini: 0. 0, 0. 8, 1. 0, 1. 2, 1. 3, 1. 4, 2. 4, dan 4. 6, ◦ Tentukan median, modus, mean, varian, simpangan baku, jangkauan kuartil ◦ Buat diagram stem-leaf ◦ Buat diagrm box-plot, dan jelaskan bentuk sebarannya terutama dalam kaitan dengan pencilannya. 44

 Buat diagram box-plot daata berikut: 12, 14, 10, 17, 23 dan 4. Jelaskan!

Buat diagram box-plot daata berikut: 12, 14, 10, 17, 23 dan 4. Jelaskan! 45

Referensi: 1. Koopmans, L. H. 1987. Introduction to Contemporary Statistical Methods 2 nd ed.

Referensi: 1. Koopmans, L. H. 1987. Introduction to Contemporary Statistical Methods 2 nd ed. Duxbury, Press. Boston. 46

 Data Pengamatan Tanaman Diameter Pohon Obs Tinggi Pohon (m) 1 3, 5 0,

Data Pengamatan Tanaman Diameter Pohon Obs Tinggi Pohon (m) 1 3, 5 0, 25 2 4, 0 0, 40 3 2, 8 0, 20 4 3, 2 0, 21 5 3, 6 0, 30 6 4, 2 0, 35 7 2, 9 0, 22 8 2, 5 0, 18 9 3, 8 0, 38 10 4, 6 0, 41 11 2, 2 0, 15 12 3, 4 0, 28 13 4, 2 0, 37 14 4, 8 0, 39 5, 0 0, 40 Ukuran Pemusatan: Ukuran Penyebaran: Modus Median Mean (Rata-rata) Min. Max. Range q 1 q 2 q 3 15 Varietas A B C C C B B A A A D D A 0, 40 0, 30 47

 Data Pengamatan Tanaman Diameter Pohon Ukuran Pemusatan: Ukuran Penyebaran: Obs Tinggi Pohon (m)

Data Pengamatan Tanaman Diameter Pohon Ukuran Pemusatan: Ukuran Penyebaran: Obs Tinggi Pohon (m) 3, 5 4, 0 2, 8 3, 2 3, 6 4, 2 2, 9 2, 5 3, 8 4, 6 2, 2 3, 4 4, 2 4, 8 5, 0 Modus Median Mean (Rata-rata) Min. Max. Range q 1 q 2 q 3 JAK atau IQR Varian (Ragam) Standar Deviasi (m) 0, 25 0, 40 0, 21 0, 30 0, 35 0, 22 0, 18 0, 38 0, 41 0, 15 0, 28 0, 37 0, 39 0, 40 0, 30 48