EKSPLORASI DATA DATA WAREHOUSE PERTEMUAN 2 NOVIANDI PRODI
- Slides: 17
EKSPLORASI DATA & DATA WAREHOUSE PERTEMUAN - 2 NOVIANDI PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
KEMAMPUAN AKHIR YANG DIHARAPKAN Mahasiswa mampu mengeksplorasi data, mengetahui adanya missing data values, dan data noisy serta dapat mengatasinya
EKSPLORASI DATA Eksplorasi data merupakan langkah untuk memahami data sebelum dilakukan praproses. Tujuan dari ekplorasi data adalah menyeleksi teknik pemrosesan dan analisis data yang sesuai dengan dataset yang dimiliki. Hal-hal yang harus diperhatikan: a. Tipe data b. Kualitas data c. Statistika ringkasan d. Visualisasi
TIPE DATA KATEGORIK(KUALITATIF ) Nominal Ordinal NUMERIK(KUANTITATIF) Interval Rasio
TIPE DATA
TIPE DATA
KUALITAS DATA Noise Outliers Missing Value Duplicate
KUALITAS DATA NOISE Modifikasi dari nilai sebenernya Ex: ‘Snow’ pada tv
KUALITAS DATA OUTLIER Objek data yang memiliki karakteristik berbeda dengan data lainnya Outlier dapat dipandang sebagai noise tetapi berguna dalam fraud detection, rare event analysis
KUALITAS DATA ü Informasi tidak terkumpul ü Atribut tidak dapat diterapkan untuk semua kasus Missing Value Objek data yang memiliki karakteristik berbeda dengan data lainnya Handling; Menghapus objek data Mengestimasi nilai missing value Mengabaikan atribut missing value
KUALITAS DATA Masalah utama ketika menggabungkan data dari berbagai sumber Duplicate data Data Cleaning Menghilangkan noise dan data yang tidak konsisten
STATISTIKA RINGKASAN Statistika ringkasan adalah sejumlah ringkasan property dari data. FREKUENSI MODUS Presentase nilai atribut tersebut muncul pada dataset Nilai atribut yang paling sering muncul RANGE Jarak antara nilai maks dan min MEDIAN MEAN VARIANCE
VISUALISASI DATA Visualisasi data adalah satu teknik dalam eksplorasi data. Manfaat visualisasi data: § Dapat mendeteksi general pola dan trends § Dapat mendeteksi outlier atau unusual trends Boxplots Histogram Scatter plot
VISUALISASI DATA • BOXPLOTS Bagian-bagian dari boxplots Boxplots dapat digunakan untuk membandingkan atribut
VISUALISASI DATA • HISTOGRAM q Histogram mendisribusikan nilai -nilai suatu atribut q Membagi nilai menjadi bin-bin dan barplot menunjukan jumlah objek pada setiap bin q Tinggi dari setiap bar mengidentifikasikan jumlah objek
VISUALISASI DATA • SCATTER PLOT v Nilai atribut menentukan posisi v Atribut ditunjukan dengan warna maupun bentuk yang berbeda dengan atribut lainnya v Dapat melihat hubungan beberapa pasangan atribut
TERIMA KASIH
- Perbedaan cdm dan pdm
- Kkni level 8 prodi magister
- Dokter sp kklp
- Program kerja prodi pgsd
- Akreditasi prodi di ipb
- Pembatasan budaya terhadap kecukupan gizi
- Praproses data
- Latihan soal struktur data pertemuan 4
- Diketahui suatu array segitiga memiliki 5 baris dan kolom
- Tipe data int memiliki nilai jangkauan antara
- Aset eksplorasi dan evaluasi
- Eksplorasi bakat secara mandiri
- Alat bor eksplorasi
- Eksplorasi potensi diri
- Psak 64
- Contoh fase eksplorasi
- Geofisika
- Tugas pertemuan 9 metode perancangan program