MATERI PERKULIAHAN MACHINE LEARNING Pemrosesan Data 2 Kelompok































- Slides: 31
MATERI PERKULIAHAN MACHINE LEARNING Pemrosesan Data 2 Kelompok Keilmuan Computer Science
Tujuan ü Memahami jenis-jenis data masukan yang dapat diproses ü Memahami dan menerapkan teknik pemrosesan data
Data di ML
DATA
Pengertian Data adalah hasil pengukuran atau pengamatan
Jenis Data Berdasarkan Media - Teks Gambar Suara / Bunyi Sinyal lainnya
Jenis Data Berdasarkan bentuk data - Kuantitatif (angka) Ø Diskrit (hasil mencacah) Ø Kontinu (hasil mengukur) - Kualitatif (bukan angka)
Jenis Data Berdasarkan Skala Pengukuran NOMINAL KUALITATIF ORDINAL DATA KUANTITATI F INTERVAL RATIO
Jenis Data Berdasarkan Skala Pengukuran Nominal • Data hanya dapat dibedakan & tidak dapat diurutkan Ordinal • Data yang dapat diurutkan & tidak dapat dioperasikan Interval • Memiliki jarak sama antara satu data dengan data yang lain, dapat digunakan operator matematis Rasio • Memiliki jarak yang sama, dapat menggunakan operator matematis dan memiliki nilai nol mutlak
Jenis Data Berdasarkan Skala Pengukuran
Jenis Data Berdasarkan Skala Pengukuran
Jenis Data Berdasarkan Skala Pengukuran
INTERVAL
RATI O
Contoh data No Nama Usia 1 2 3 4 Nur Budi Dewi Andi 18 tahun 20 tahun 21 tahun 17 tahun NOMINAL Ukuran Baju L XL XS L Ukuran Sepatu 38 42 35 40 ORDINAL Tinggi Berat Jenis IP Badan Kelamin 150 cm 48 kg Perempuan 2, 75 180 cm 60 kg Laki-laki 3, 1 120 cm 38 kg Perempuan 2, 5 160 cm 62 kg Laki-laki 3, 4 INTERVAL RATIO
FITUR
Pengertian Fitur adalah karakteristik yang akan digunakan sebagai masukan untuk membuat sebuah model FITUR = IBU R T A T VARIABEL DIMENS I
Contoh Fitur No Nama Usia 1 2 3 4 Nur Budi Dewi Andi 18 tahun 20 tahun 21 tahun 17 tahun x FITUR 1 Ukuran Baju L XL XS L Ukuran Sepatu 38 42 35 40 y FITUR 2 Tinggi Berat Jenis IP Badan Kelamin 150 cm 48 kg Perempuan 2, 75 180 cm 60 kg Laki-laki 3, 1 120 cm 38 kg Perempuan 2, 5 160 cm 62 kg Laki-laki 3, 4 ? TARGET
PEMROSESAN DATA
Pemrosesan Data - Binerisasi - Normalisasi - Diskritisasi
BINERISASI •
Contoh Binerisasi NILAI AMBANG BATAS = 150 cm 0 180 cm 1 120 cm 0 160 cm 1
NORMALISASI Pengubahan Data ke dalam rentang nilai yang dibutuhkan MIN - MAX PENSKALAAN DESIMAL Z–SCORE
MIN-MAX •
Contoh MIN-MAX 150 cm 0 180 cm 1 120 cm -1 160 cm 0. 33
SKALA DESIMAL •
Contoh Skala Desimal 150 cm 0. 15 180 cm 0. 18 120 cm 0. 12 160 cm 0. 16
Z-SCORE •
Contoh Z-Score 150 cm -0. 17 180 cm 1. 83 120 cm -2. 17 160 cm 0. 5
REFERENSI. . . 1. https: //medium. com/warung-pintar/beberapa-cara-untuk-preprocessingdata-dalam-machine-learning-13 cef 4294614 2. http: //www. uta. fi/sis/tie/tl/index/Datamining 4. pdf 3. https: //towardsdatascience. com/data-pre-processing-techniques-youshould-know-8954662716 d 6 4. https: //becominghuman. ai/effective-data-preprocessing-and-featureengineering-452 d 3 a 948262 5. https: //www. analyticsvidhya. com/blog/2016/12/introduction-to-featureselection-methods-with-an-example-or-how-to-select-the-right-variables/ 6. https: //www. intechopen. com/books/from-natural-to-artificial-intelligence -algorithms-and-applications/some-commonly-used-speech-featureextraction-algorithms 7. https: //sebastianraschka. com/faq/docs/feature_sele_categories. html
TUGAS KELOMPOK Tips : Pelajari Referensi 3 Buat Makalah : - Cari 3 (tiga) buah dataset awal (dapat diambil dari UCI Machine Learning atau Data Kota Bandung) - Jelaskan proses Binerisasi atau Normalisasi sesuai dengan karakteristik data yang dipilih (tuliskan perhitungannya) - Buat Program Binerisasi atau Normalisasi sederhana sesuai data yang diperoleh (berikan screenshot di setiap tahapannya)