MATERI PERKULIAHAN MACHINE LEARNING Pemrosesan Data 2 Kelompok

  • Slides: 31
Download presentation
MATERI PERKULIAHAN MACHINE LEARNING Pemrosesan Data 2 Kelompok Keilmuan Computer Science

MATERI PERKULIAHAN MACHINE LEARNING Pemrosesan Data 2 Kelompok Keilmuan Computer Science

Tujuan ü Memahami jenis-jenis data masukan yang dapat diproses ü Memahami dan menerapkan teknik

Tujuan ü Memahami jenis-jenis data masukan yang dapat diproses ü Memahami dan menerapkan teknik pemrosesan data

Data di ML

Data di ML

DATA

DATA

Pengertian Data adalah hasil pengukuran atau pengamatan

Pengertian Data adalah hasil pengukuran atau pengamatan

Jenis Data Berdasarkan Media - Teks Gambar Suara / Bunyi Sinyal lainnya

Jenis Data Berdasarkan Media - Teks Gambar Suara / Bunyi Sinyal lainnya

Jenis Data Berdasarkan bentuk data - Kuantitatif (angka) Ø Diskrit (hasil mencacah) Ø Kontinu

Jenis Data Berdasarkan bentuk data - Kuantitatif (angka) Ø Diskrit (hasil mencacah) Ø Kontinu (hasil mengukur) - Kualitatif (bukan angka)

Jenis Data Berdasarkan Skala Pengukuran NOMINAL KUALITATIF ORDINAL DATA KUANTITATI F INTERVAL RATIO

Jenis Data Berdasarkan Skala Pengukuran NOMINAL KUALITATIF ORDINAL DATA KUANTITATI F INTERVAL RATIO

Jenis Data Berdasarkan Skala Pengukuran Nominal • Data hanya dapat dibedakan & tidak dapat

Jenis Data Berdasarkan Skala Pengukuran Nominal • Data hanya dapat dibedakan & tidak dapat diurutkan Ordinal • Data yang dapat diurutkan & tidak dapat dioperasikan Interval • Memiliki jarak sama antara satu data dengan data yang lain, dapat digunakan operator matematis Rasio • Memiliki jarak yang sama, dapat menggunakan operator matematis dan memiliki nilai nol mutlak

Jenis Data Berdasarkan Skala Pengukuran

Jenis Data Berdasarkan Skala Pengukuran

Jenis Data Berdasarkan Skala Pengukuran

Jenis Data Berdasarkan Skala Pengukuran

Jenis Data Berdasarkan Skala Pengukuran

Jenis Data Berdasarkan Skala Pengukuran

INTERVAL

INTERVAL

RATI O

RATI O

Contoh data No Nama Usia 1 2 3 4 Nur Budi Dewi Andi 18

Contoh data No Nama Usia 1 2 3 4 Nur Budi Dewi Andi 18 tahun 20 tahun 21 tahun 17 tahun NOMINAL Ukuran Baju L XL XS L Ukuran Sepatu 38 42 35 40 ORDINAL Tinggi Berat Jenis IP Badan Kelamin 150 cm 48 kg Perempuan 2, 75 180 cm 60 kg Laki-laki 3, 1 120 cm 38 kg Perempuan 2, 5 160 cm 62 kg Laki-laki 3, 4 INTERVAL RATIO

FITUR

FITUR

Pengertian Fitur adalah karakteristik yang akan digunakan sebagai masukan untuk membuat sebuah model FITUR

Pengertian Fitur adalah karakteristik yang akan digunakan sebagai masukan untuk membuat sebuah model FITUR = IBU R T A T VARIABEL DIMENS I

Contoh Fitur No Nama Usia 1 2 3 4 Nur Budi Dewi Andi 18

Contoh Fitur No Nama Usia 1 2 3 4 Nur Budi Dewi Andi 18 tahun 20 tahun 21 tahun 17 tahun x FITUR 1 Ukuran Baju L XL XS L Ukuran Sepatu 38 42 35 40 y FITUR 2 Tinggi Berat Jenis IP Badan Kelamin 150 cm 48 kg Perempuan 2, 75 180 cm 60 kg Laki-laki 3, 1 120 cm 38 kg Perempuan 2, 5 160 cm 62 kg Laki-laki 3, 4 ? TARGET

PEMROSESAN DATA

PEMROSESAN DATA

Pemrosesan Data - Binerisasi - Normalisasi - Diskritisasi

Pemrosesan Data - Binerisasi - Normalisasi - Diskritisasi

BINERISASI •

BINERISASI •

Contoh Binerisasi NILAI AMBANG BATAS = 150 cm 0 180 cm 1 120 cm

Contoh Binerisasi NILAI AMBANG BATAS = 150 cm 0 180 cm 1 120 cm 0 160 cm 1

NORMALISASI Pengubahan Data ke dalam rentang nilai yang dibutuhkan MIN - MAX PENSKALAAN DESIMAL

NORMALISASI Pengubahan Data ke dalam rentang nilai yang dibutuhkan MIN - MAX PENSKALAAN DESIMAL Z–SCORE

MIN-MAX •

MIN-MAX •

Contoh MIN-MAX 150 cm 0 180 cm 1 120 cm -1 160 cm 0.

Contoh MIN-MAX 150 cm 0 180 cm 1 120 cm -1 160 cm 0. 33

SKALA DESIMAL •

SKALA DESIMAL •

Contoh Skala Desimal 150 cm 0. 15 180 cm 0. 18 120 cm 0.

Contoh Skala Desimal 150 cm 0. 15 180 cm 0. 18 120 cm 0. 12 160 cm 0. 16

Z-SCORE •

Z-SCORE •

Contoh Z-Score 150 cm -0. 17 180 cm 1. 83 120 cm -2. 17

Contoh Z-Score 150 cm -0. 17 180 cm 1. 83 120 cm -2. 17 160 cm 0. 5

REFERENSI. . . 1. https: //medium. com/warung-pintar/beberapa-cara-untuk-preprocessingdata-dalam-machine-learning-13 cef 4294614 2. http: //www. uta. fi/sis/tie/tl/index/Datamining

REFERENSI. . . 1. https: //medium. com/warung-pintar/beberapa-cara-untuk-preprocessingdata-dalam-machine-learning-13 cef 4294614 2. http: //www. uta. fi/sis/tie/tl/index/Datamining 4. pdf 3. https: //towardsdatascience. com/data-pre-processing-techniques-youshould-know-8954662716 d 6 4. https: //becominghuman. ai/effective-data-preprocessing-and-featureengineering-452 d 3 a 948262 5. https: //www. analyticsvidhya. com/blog/2016/12/introduction-to-featureselection-methods-with-an-example-or-how-to-select-the-right-variables/ 6. https: //www. intechopen. com/books/from-natural-to-artificial-intelligence -algorithms-and-applications/some-commonly-used-speech-featureextraction-algorithms 7. https: //sebastianraschka. com/faq/docs/feature_sele_categories. html

TUGAS KELOMPOK Tips : Pelajari Referensi 3 Buat Makalah : - Cari 3 (tiga)

TUGAS KELOMPOK Tips : Pelajari Referensi 3 Buat Makalah : - Cari 3 (tiga) buah dataset awal (dapat diambil dari UCI Machine Learning atau Data Kota Bandung) - Jelaskan proses Binerisasi atau Normalisasi sesuai dengan karakteristik data yang dipilih (tuliskan perhitungannya) - Buat Program Binerisasi atau Normalisasi sederhana sesuai data yang diperoleh (berikan screenshot di setiap tahapannya)