Sistem Penunjang Keputusan 1 Arsitektur Aplikasi SPK 2

  • Slides: 73
Download presentation
Sistem Penunjang Keputusan 1

Sistem Penunjang Keputusan 1

Arsitektur Aplikasi SPK 2

Arsitektur Aplikasi SPK 2

ARSITEKTUR SPK

ARSITEKTUR SPK

PENGANTAR Aplikasi SPK bisa terdiri dari beberapa subsistem, yaitu ; 1. Subsistem manajemen data

PENGANTAR Aplikasi SPK bisa terdiri dari beberapa subsistem, yaitu ; 1. Subsistem manajemen data 2. Subsistem manajemen model 3. Subsistem antarmuka pengguna 4. Subsistem manajemen berbasis pengetahuan

ARSITEKTUR SPK

ARSITEKTUR SPK

Subsistem Pembentukan SPK Data Management terdiri dari elemen: • DSS Database – Database Management

Subsistem Pembentukan SPK Data Management terdiri dari elemen: • DSS Database – Database Management System – Data Directory – Query Directory • Model Management – Model Base Management System – Modeling Language – Model Directory – Model Execution, Integration, and Command – User Interface (Dialog Management)

Knowledge Management DSS Database • User biasanya membuat atau memperbaiki model pada personal komputer

Knowledge Management DSS Database • User biasanya membuat atau memperbaiki model pada personal komputer dan mengembalikannya pada mainframe. Banyak user menyimpan data penunjang keputusannya pada PC, dalam bentuk spreadsheet. • Persyaratan akses dari DSS database sangat berbeda dengan database untuk komputerisasi rutin. DSS database diperlukan untuk menangani data multi dimensi secara efisien dan memungkinkan fleksibilitas penuh atas operasi relasional seperti pencarian, proyeksi, dan menggabungkan relasi. Variasi mekanisme dapat digunakan untuk memfasilitasi pencarian dan penggabungan data dan meningkatkan kompleksitas dari data.

Knowledge Management DSS Database

Knowledge Management DSS Database

Kategori Data dalam SPK terdiri dari : • Internal Data yang diperoleh dari dalam

Kategori Data dalam SPK terdiri dari : • Internal Data yang diperoleh dari dalam organisasi seperti data karyawan dan gaji, data mesin. Data transaksi adalah sumber utama dari internal data. • External Data dari luar organisasi seperti data industri, riset pemasaran, peraturan pemerintah, Dow Jones Information System dan lain. • Private Data Dapat berisi “rule of thumb” yang digunakan oleh pengambil keputusan dan penilaian dari data atau situasi spesifik.

Data Management Subsystem

Data Management Subsystem

Kemampuan DBMS dalam SPK q Capture / extract data untuk dimasukkan dalam SPK Database

Kemampuan DBMS dalam SPK q Capture / extract data untuk dimasukkan dalam SPK Database q Perubahan (add, delete, update) record dan file yang cepat q Hubungan data dengan sumber berbeda q Retrieve data yang cepat dari database untuk query dan report q Menyediakan keamanan data (proteksi dari unathorized access, kemampuan recovery) q Menangani data pribadi yang dapat dipergunakan untuk alternative pemecahan masalah q Melakukan query pencarian yang komplek dan manipulasi data q Tracks usage of data

Peran DBMS

Peran DBMS

Contoh SPK Database

Contoh SPK Database

Subsistem Pembentukan SPK Model Management : q Model Base Management System q Modeling Language

Subsistem Pembentukan SPK Model Management : q Model Base Management System q Modeling Language q Model Directory q Model Execution, Integration, and Command q User Interface (Dialog Management) q Knowledge Management

MANAJEMEN MODEL Model Merupakan abstraksi dunia nyata menjadi simbolik dengan tujuan menyederhanakan, meminimalkan biaya,

MANAJEMEN MODEL Model Merupakan abstraksi dunia nyata menjadi simbolik dengan tujuan menyederhanakan, meminimalkan biaya, dan meminimalkan risiko agar lebih efektif

MODEL Sebuah model akan sangat tergantung pada: q Variabel waktu (tetap/tidak) q Hasil (acak/terdistribusi/pola)

MODEL Sebuah model akan sangat tergantung pada: q Variabel waktu (tetap/tidak) q Hasil (acak/terdistribusi/pola) q Nilai awal (ada/tidak ada)

MODEL Bentuk Model 1. Model Ikonik 2. Model Analog (Model Diagramatik) 3. Model Simbolik

MODEL Bentuk Model 1. Model Ikonik 2. Model Analog (Model Diagramatik) 3. Model Simbolik (Model Matematik)

MODEL Model Ikonik Perwakilan fisik dari beberapa hal, baik dalam bentuk ideal ataupun dalam

MODEL Model Ikonik Perwakilan fisik dari beberapa hal, baik dalam bentuk ideal ataupun dalam skala berbeda. Contoh : Foto, Peta , Prototipe mesin

MODEL Model Analog (Model Diagramatik) Model yang bisa mewakili situasi dinamik, yaitu keadaan yang

MODEL Model Analog (Model Diagramatik) Model yang bisa mewakili situasi dinamik, yaitu keadaan yang berubah menurut waktu. Contoh : - Kurva permintaan - Kurva distibusi frekuensi pada statistik dan bagan alir Model Simbolik (Model Matematik) Model berupa angka, simbol, dan rumus.

MODEL Langkah-langkah Pemodelan DSS 1. Studi Kelayakan 2. Perancangan 3. Pemilihan 4. Membuat DSS

MODEL Langkah-langkah Pemodelan DSS 1. Studi Kelayakan 2. Perancangan 3. Pemilihan 4. Membuat DSS

MANAJEMEN DATA Subsistem manajemen data terdiri dari elemen berikut : 1. Database system pendukung

MANAJEMEN DATA Subsistem manajemen data terdiri dari elemen berikut : 1. Database system pendukung keputusan 2. Database Manajemen System (DBMS) 3. Direktori Data 4. Fasilitas Query

DATABASE Kumpulan data yang saling terkait yang diorganisasi untuk memenuhi kebutuhan sebuah organisasi serta

DATABASE Kumpulan data yang saling terkait yang diorganisasi untuk memenuhi kebutuhan sebuah organisasi serta bisa digunakan oleh lebih dari satu orang dan lebih dari satu aplikasi.

DATABASE Sumber Data Dalam DSS 1. Data Internal 2. Data Eksternal 3. Data Privat/Personal

DATABASE Sumber Data Dalam DSS 1. Data Internal 2. Data Eksternal 3. Data Privat/Personal

DATA INTERNAL Data Internal Data yang sudah ada dalam satu organisasi Contoh : -

DATA INTERNAL Data Internal Data yang sudah ada dalam satu organisasi Contoh : - Data tentang pegawai - Data Tentang peralatan dan mesin - Data penjualan - Data penjadwalan produksi

DATA EKSTERNAL Data Eksternal Data yang tidak bisa dikendalikan oleh organisasi, data tersebut berasal

DATA EKSTERNAL Data Eksternal Data yang tidak bisa dikendalikan oleh organisasi, data tersebut berasal dari luar sistem. Contoh : - Peraturan Perundangan - Harga Pasar - Keadaan Pesaing - Kurs Dolar

Data Privat/Personal Data mengenai kepakaran/naluri dari user terhadap masalah yang akan diselesaikan. Ekstraksi Proses

Data Privat/Personal Data mengenai kepakaran/naluri dari user terhadap masalah yang akan diselesaikan. Ekstraksi Proses pemindahan data-data dari database operasional ke dalam datawarehouse atau database khusus digunakan untuk analisis.

SISTEM MANAJEMEN DATABASE (DBMS) q Sistem Manajemen Database (DBMS) q DBMS yang dimaksud adalah

SISTEM MANAJEMEN DATABASE (DBMS) q Sistem Manajemen Database (DBMS) q DBMS yang dimaksud adalah perangkat lunak pengelola database seperti : - Microsoft SQL Server Microsoft Access Oracle My SQL dll

DBMS Hal yang perlu diperhatikan dalam memilih dan menentukan DBMS ; 1. Arsitektur sistemnya.

DBMS Hal yang perlu diperhatikan dalam memilih dan menentukan DBMS ; 1. Arsitektur sistemnya. 2. Platform sistem operasi yang digunakan 3. Besarnya data 4. Pentingnya dukungan keamanan.

DBMS Fasilitas Query Fasilitas untuk menyediakan akses data ke database serta memanipulasi data dalam

DBMS Fasilitas Query Fasilitas untuk menyediakan akses data ke database serta memanipulasi data dalam database. Direktori Data Merupakan sebuah katalog dari semua data yang ada dalam database.

Definisi Query Facility • Query facility menyediakan dasar untuk mengakses data • Query facility

Definisi Query Facility • Query facility menyediakan dasar untuk mengakses data • Query facility menerima permintaan akan data (dari komponen SPK lainnya), menentukan bagaimana Query ini dapat dipenuhi (jika perlu diperiksa di Data Directory), memformulasikan detail permintaan dan mengembalikan atau mengirimkan hasilnya kepada peminta • Dengan suatu fasilitas query, para pengambilan keputusan dapat menambah data yang diinginkan dari sebuah database dalam waktu singkat.

Database Queries Dapat diklasifikasikan menjadi 4 tipe: 1. Primary - Key queries. Suatu record

Database Queries Dapat diklasifikasikan menjadi 4 tipe: 1. Primary - Key queries. Suatu record diakses dari primary key. Ini dapat dilakukan cepat dan menggunakan peredaran mesin yang sedikit 2. Single - secondary - key queries. Tipe query ini menampilkan suatu diagram data model sebagai secondary - key path. Memerlukan peredaran mesin yang lebih dari primary key queries.

Database Queries 3. Multiple - secondary - key queries. Tipe ini memerlukan suatu akses

Database Queries 3. Multiple - secondary - key queries. Tipe ini memerlukan suatu akses secondary-key. Penggunaan lebih komplek dan mahal 4. Unanticipated search queries. Secondary-key queries memakan waktu relatif cepat jika ada secondary index yang cocok. Jika tidak ada maka diperlukan pencarian record dengan meminta suatu record pada saat bersamaan.

Definisi Data Directory/ Dictionary q Data Directory (DD) adalah sebuah katalog dari seluruh data

Definisi Data Directory/ Dictionary q Data Directory (DD) adalah sebuah katalog dari seluruh data yang ada dalam database q DD berisi definisi data dan fungsi utamanya adalah untuk menjawab pernyataan tentang ketersediaan data item, sumbernya, atau arti tepatnya q DD mendukung fase intelligence dari proses pengambilan keputusan dengan membantu mencari data dan identifikasi problem area atau kesempatan q DD berisi semua informasi tentang data entity dan hubungan(relationship) yang ada, q Sehingga dapat dikatakan DD itu sendiri adalah suatu database yang kompleks q DD dapat diorganisir menggunakan hierarchical network atau relationship data model

SUB-SISTEM MODEL SPK

SUB-SISTEM MODEL SPK

MODEL DALAM SPK q. Terdapat beberapa tipe model dalam SPK. q. Untuk memilih model

MODEL DALAM SPK q. Terdapat beberapa tipe model dalam SPK. q. Untuk memilih model yang tepat: 1. Identifikasi masalah dan analisis lingkungan masalah 2. Identifikasi variabel-variabel yang terlibat dalam pengambilan keputusan q. Kadang tipe model yang tepat bisa berupa kombinasi dari beberapa tipe sekaligus.

MODEL DALAM SPK • Model dalam SPK bisa statis atau dinamis. • Model statis:

MODEL DALAM SPK • Model dalam SPK bisa statis atau dinamis. • Model statis: – Memodelkan situasi pada satu saat tertentu. – Contoh: SPK untuk menentukan buat atau beli produk • Model dinamis: – Memodelkan keadaan yang berubah seturut waktu. – Contoh: SPK untuk memproyeksikan keuntungan perusahaan selama 5 tahun ke depan.

TIPE-TIPE MODEL SPK 1. Kategori masalah optimisasi dengan beberapa alternatif solusi: – Mencari solusi

TIPE-TIPE MODEL SPK 1. Kategori masalah optimisasi dengan beberapa alternatif solusi: – Mencari solusi terbaik dari sejumlah kecil alternatif – Teknik: tabel keputusan, pohon keputusan – Contoh: • SPK Pemilihan Program Studi di Universitas (Diana & Marisca, 2006) • SPK Penentuan Menu bagi Penderita Diabetes (Joseph, 2006) • SPK Pemilihan Tipe Rumah (Agnes, 2007)

TIPE-TIPE MODEL SPK 2. Kategori optimisasi menggunakan algoritma: – Mencari solusi terbaik dari sejumlah

TIPE-TIPE MODEL SPK 2. Kategori optimisasi menggunakan algoritma: – Mencari solusi terbaik dari sejumlah besar atau bahkan tak berhingga alternatif, menggunakan proses bertahap – Teknik: model pemrograman linear, AHP, algoritma genetika, atau model matematis lain – Contoh: • SPK penentuan jalur pemasangan kabel listrik • SPK penentuan jadwal kuliah • SPK Penentuan Lokasi KKN (Dance, 2006)

TIPE-TIPE MODEL SPK 3. Kategori optimisasi menggunakan formula analitis: – Mencari solusi terbaik dalam

TIPE-TIPE MODEL SPK 3. Kategori optimisasi menggunakan formula analitis: – Mencari solusi terbaik dalam satu langkah dengan menggunakan rumus (formula) – Teknik: beberapa model inventori, dll – Contoh: • SPK Penentuan Harga Jual Buku di Penerbit & Percetakan (Dwianti, 1999) • SPK Penggantian Armada Taksi (Sakti, 2006) • SPK Penerimaan Siswa Baru di SMA (Purwanto, 2005)

TIPE-TIPE MODEL SPK 4. Kategori simulasi: – Mencari solusi yang cukup baik (“good enough”),

TIPE-TIPE MODEL SPK 4. Kategori simulasi: – Mencari solusi yang cukup baik (“good enough”), atau solusi terbaik dari beberapa alternatif yang dicek, menggunakan eksperimen atau coba-coba – Teknik: simulasi probabilistik, simulasi tergantung waktu (time dependent), simulasi tidak tergantung waktu (time independent), simulasi visual – Tidak menjamin ditemukannya solusi terbaik – Contoh: • SPK Penentuan Jumlah Kasir di Supermarket • SPK Penentuan Jumlah Stok Barang • SPK Pemilihan Cat Tembok

TIPE-TIPE MODEL SPK 5. Kategori heuristik: – Mencari solusi yang cukup baik (“good enough”)

TIPE-TIPE MODEL SPK 5. Kategori heuristik: – Mencari solusi yang cukup baik (“good enough”) menggunakan aturan – Bermanfaat pada situasi di mana: • Persoalannya kompleks, simulasi terlalu memakan waktu • Ingin didapat solusi yg lebih cepat dan murah dibanding menggunakan algoritma (meskipun tidak se-”umum” spt jika menggunakan algoritma) – Teknik: pemrograman heuristik, sistem pakar – Contoh: • SPK Diagnosa Kerusakan Sepeda Motor

TIPE-TIPE MODEL SPK 6. Kategori model deskriptif lain: – Mencari solusi “what-if” menggunakan formula

TIPE-TIPE MODEL SPK 6. Kategori model deskriptif lain: – Mencari solusi “what-if” menggunakan formula – Teknik: pemodelan finansial – Contoh: • SPK Penentuan Investasi • SPK Penentuan Anggaran Belanja

TIPE-TIPE MODEL SPK 7. Kategori model prediktif: – Memprediksi masa mendatang untuk suatu skenario

TIPE-TIPE MODEL SPK 7. Kategori model prediktif: – Memprediksi masa mendatang untuk suatu skenario tertentu – Teknik: analisis Markov, model peramalan (forecasting) – Contoh: • SPK Pendirian Sekolah Dasar dibuat berdasar prediksi jumlah penduduk yang akan masuk SD pada suatu waktu tertentu

Basis Data Multidimensi untuk DSS

Basis Data Multidimensi untuk DSS

DSS dan OLAP • Teknologi Informasi membantu knowledge worker (executive, manager, analyst) membuat keputusan

DSS dan OLAP • Teknologi Informasi membantu knowledge worker (executive, manager, analyst) membuat keputusan lebih cepat dan lebih baik – Bagaimana volume penjualan berdasarkan wilayah dan kategori produk untuk tahun lalu? – Bagaimana harga saham produsen komputer berkorelasi dengan keuntungan setiap tiga bulan selama 10 tahun terakhir? – Yang manakah pesanan yang harus kita isi untuk memaksimalkan pendapatan? – Apakah diskon 10% cukup meningkatkan volume penjualan? – Which of two new medications will result in the best outcome: higher recovery rate & shorter hospital stay? – Manakah dari dua obat baru yang akan menghasilkan hasil yang terbaik: tingkat pemulihan yang lebih tinggi & masa tinggal di rumah sakit yang lebih pendek? • On-Line Analytical Processing (OLAP) adalah element dari decision support systems (DSS)

Business Intelligence

Business Intelligence

OLTP vs. OLAP OLTP OLAP • Clerk, IT Professional • Knowledge worker Function •

OLTP vs. OLAP OLTP OLAP • Clerk, IT Professional • Knowledge worker Function • Day to day operations • Decision support DB Design • Application-oriented (E-R based) • Subject-oriented (Star, snowflake) Data • Current, Isolated • Historical, Consolidated View • Detailed, Flat relational • Summarized, Multidimensional • Structured, Repetitive • Ad hoc • Short, Simple transaction • Complex query • Read/write • Read Mostly • Index/hash on prim. Key • Lots of Scans • Tens • Millions • Thousands • Hundreds • 100 MB-GB • 100 GB-TB • Trans. throughput • Query throughput, response User Usage Unit of work Access Operations # Records accessed #Users Db size Metric

Data Warehouse • Sebuah dukungan keputusan database yang dikelola secara terpisah dari database operasional

Data Warehouse • Sebuah dukungan keputusan database yang dikelola secara terpisah dari database operasional organisasi. • Data warehouse adalah § subject-oriented, § integrated, § time-varying (waktu bervariasi), § non-volatile (tdk mudah hilang) • Kumpulan data yang digunakan utamanya dalam membuat keputusan organisasi

Mengapa Data Warehouse terpisah? • Performance/Kinerja § Database operasional dirancang & diatur untuk beban

Mengapa Data Warehouse terpisah? • Performance/Kinerja § Database operasional dirancang & diatur untuk beban kerja yang diketahui § Query OLAP kompleks akan menurunkan kinerja, membebani operasi § Organisasi data, akses & metode implementasi khusus yang diperlukan untuk menampilkan multidimensi & query

Mengapa Data Warehouse terpisah? • Fungsi § Data yang hilang: Decision support membutuhkan data

Mengapa Data Warehouse terpisah? • Fungsi § Data yang hilang: Decision support membutuhkan data historis, yang database operasional biasanya tidak mempertahankannya § Data consolidation: Decision support membutuhkan konsolidasi (aggregation, summarization) data dari berbagai sumber yang heterogen: database operasional, sumber eksternal. § Kualitas data: Sumber yang berbeda biasanya menggunakan representasi data, kode, dan format yang tidak konsisten yang harus direkonsiliasikan

Data Warehousing Architecture

Data Warehousing Architecture

Three-Tier Architecture • Warehouse database server § Hampir selalu DBMS relasional; jarang flat files

Three-Tier Architecture • Warehouse database server § Hampir selalu DBMS relasional; jarang flat files • OLAP servers § Relational OLAP (ROLAP): DBMS relasional diperluas yang memetakan operasi pada data multidimensi untuk operasi relasional standar. § Multidimensional OLAP (MOLAP): Server dengan tujuan khusus yang langsung mengimplementasikan data multidimensi dan operasi. • Clients § Query dan reporting tools § Analysis tools § Data mining tools (misal, trend analysis, prediction)

Data Warehouse vs. Data Marts • Enterprise warehouse: mengumpulkan semua informasi tentang subyek (pelanggan,

Data Warehouse vs. Data Marts • Enterprise warehouse: mengumpulkan semua informasi tentang subyek (pelanggan, produk, penjualan, aset, personel) yang menjangkau seluruh organisasi. § Membutuhkan pemodelan bisnis yang luas § Waktu bertahun-tahun untuk merancang dan membangun • Data Marts: Subset departemen yang fokus pada subyek yang dipilih: Data mart pemasaran, pelanggan, produk, penjualan. § Berputar lebih cepat, tetapi integrasi kompleks dalam jangka panjang • Virtual warehouse: melihat melalui DB operasional § Mewujudkan beberapa pandangan ringkasan untuk pemrosesan query yang efisien § Lebih mudah dibangun § berlebihnya kapasitas yang diperlukan pada server DB operasional

OLAP untuk Decision Support • Tujuan dari OLAP adalah untuk mendukung query ad-hoc untuk

OLAP untuk Decision Support • Tujuan dari OLAP adalah untuk mendukung query ad-hoc untuk analis bisnis • analis bisnis akrab dengan spreadsheet • Memperluas model analisis spreadsheet untuk bekerja dengan data warehouse § Himpunan data yang besar § Secara semantik diperkaya untuk memahami istilah bisnis (misalnya, waktu, geografi) § Dikombinasikan dengan fitur pelaporan • Tampilan data multidimensi adalah dasar dari OLAP

Multidimensional Data Model • Database adalah sekumpulan fakta (poin) di ruang multidimensi • Fakta

Multidimensional Data Model • Database adalah sekumpulan fakta (poin) di ruang multidimensi • Fakta memiliki dimensi ukuran § kuantitas yang dianalisis, misalnya, penjualan, anggaran • Satu set dimensi pada data yang dianalisis § Misalnya, toko, produk, data yang terkait dengan jumlah penjualan • Masing-masing dimensi memiliki sekumpulan atribut § Misalnya, pemilik toko kabupaten dan kota • Atribut dimensi mungkin terkait dengan perintah parsial § Hierarchy: misal, street > county >city § Lattice: misal, date> month>year, date>week>year

Multidimensional Data NY LA ti y C Product SF Juice Cola Milk Cream 10

Multidimensional Data NY LA ti y C Product SF Juice Cola Milk Cream 10 47 30 12 3/1 3/2 3/3 3/4 Date Sales volume as a function of date, city and product

Sample Data Cube Diploma 1 st 2 nd 3 rd M. Sc. B. Sc.

Sample Data Cube Diploma 1 st 2 nd 3 rd M. Sc. B. Sc. Germany ∑ Switzerland U. S. A. ∑ ∑ ∑∑∑ Country De gr ee Term German students in the 4 th term pursuing a diploma ∑ 4 th

Operation 2 dalam Model Data Multidimensional • Aggregation (roll-up) § dimension reduction: misal, total

Operation 2 dalam Model Data Multidimensional • Aggregation (roll-up) § dimension reduction: misal, total penjualan berdasarkan kota § summarization over aggregate hierarchy: misal, total penjualan berdasarkan kota dan tahun -> total penjualan berdasarkan wilayah dan tahun • Navigasi untuk data rinci (drill-down) § contoh, (penjualan - belanja) berdasarkan kota, 3% teratas dari kota dengan pendapatan rata-rata • Selection (slice) mendefiniskan sebuah subcube § misal, penjualan dimana kota = Palo Alto dan date = 1/15/96 • Visualisasi operasi (misalnya, Pivot)

Sebuah Visual Operation: Pivot (Rotate) NY LA Juice 10 Cola 47 Milk 30 Cream

Sebuah Visual Operation: Pivot (Rotate) NY LA Juice 10 Cola 47 Milk 30 Cream 12 3/1 3/2 3/3 3/4 Region SF th n o M Product

Approaches to OLAP Servers • Relational OLAP (ROLAP) § Relasional dan relasional DBMS khusus

Approaches to OLAP Servers • Relational OLAP (ROLAP) § Relasional dan relasional DBMS khusus untuk menyimpan dan mengelola data warehouse § OLAP middleware untuk mendukung bagian yang hilang § Optimalkan untuk setiap DBMS backend § Aggregation Navigation Logic § Alat dan layanan tambahan • Multidimensional OLAP (MOLAP) § Struktur penyimpanan berbasis Array § Akses langsung ke struktur data array • Pengayaan domain spesifik

Relational DBMS sebagai Warehouse Server • Desain skema • Teknik khusus scan, indexing dan

Relational DBMS sebagai Warehouse Server • Desain skema • Teknik khusus scan, indexing dan join • Penangan penayangan agregat (query dan pelaksanaan) • Mendukung perluasan bahasa query di luar SQL • Pemrosesan query yang kompleks dan optimasi • Partisi data dan paralelisme

Skema Warehouse Database • Teknik desain ER tidak sesuai • Desain harus mencerminkan pandangan

Skema Warehouse Database • Teknik desain ER tidak sesuai • Desain harus mencerminkan pandangan multidimensi § Star Schema § Snowflake Schema § Fact Constellation Schema

Contoh Star Schema Product Order No Product. NO Order Date Prod. Name Customer No

Contoh Star Schema Product Order No Product. NO Order Date Prod. Name Customer No Fact Table Prod. Descr Order. NO Category Customer Name Salesperson. ID Category. Description Customer Address City Salesperson. ID Salesperson. Name Customer. NO Unit. Price Prod. No Date. Key City. Name Date Quantity Total Price City. Name City State Quota Country

Star Schema • Suatu tabel fakta tunggal dan satu tabel untuk setiap dimensi •

Star Schema • Suatu tabel fakta tunggal dan satu tabel untuk setiap dimensi • Setiap fakta menunjuk ke salah satu tuple di setiap dimensi dan memiliki atribut tambahan • Tidak menangkap hierarki secara langsung • Kunci yang dihasilkan digunakan untuk kinerja dan pemeliharaan alasan • Fakta konstelasi: Beberapa tabel fakta yang berbagi banyak tabel dimensi § Contoh: Proyeksi biaya dan beban yang sebenarnya, dapat berbagi tabel dimensi

Contoh Snowflake Schema Order No Product. NO Order Date Prod. Name Category. Name Prod.

Contoh Snowflake Schema Order No Product. NO Order Date Prod. Name Category. Name Prod. Descr Category. Descr Fact Table Customer No Order. NO Customer Name Salesperson. ID Customer Address City Salesperson Customer. NO Prod. No Date. Key City. Name Salesperson. ID Quantity Salesperson. Name Total Price City Quota Category Unit. Price Date. Key Date Month City Month Year State City. Name State Country Year

Snowflake Schema • Mewakili hirarki dimensi secara langsung oleh normalisasi tabel dimensi • Mudah

Snowflake Schema • Mewakili hirarki dimensi secara langsung oleh normalisasi tabel dimensi • Mudah perawatannya • Menghemat tempat penyimpanan, namun diduga bahwa hal itu mengurangi efektivitas browsing (Kimball) • Skema Galaxy: beberapa tabel fakta dengan berbagi kategori dimensi

Population & Refreshing the Warehouse • Data extraction • Data cleaning • Data transformation

Population & Refreshing the Warehouse • Data extraction • Data cleaning • Data transformation § Mengubah format legacy/host ke format warehouse • Load § Sort, summarize, consolidate, compute views, check integrity, build indexes, partition • Refresh § Menyebarkan pembaharuan dari sumber ke warehouse/gudang

Metadata Repository • Administrative metadata § Database sumber dan isinya § Deskripsi gateway §

Metadata Repository • Administrative metadata § Database sumber dan isinya § Deskripsi gateway § Skema warehouse, view & definisi data yang dihasilkan § dimensions, hierarchies § pre-defined queries dan reports § Lokasi data mart dan isinya § Partisi data § data extraction, cleansing, transformation rules, defaults § data refresh dan aturan pembersihan § user profiles, user groups § security: user authorization, access control

Metadata Repository. . 2 • Business data § Definisi dan terminologi bisnis § Kepemilikan

Metadata Repository. . 2 • Business data § Definisi dan terminologi bisnis § Kepemilikan data § Pengisian kebijakan • Metadata operasional § data lineage/keturunan: riwayat data bermigrasi dan urutan transformasi diterapkan § Data mata uang: aktif, diarsipkan, dibersihkan § monitoring information: statistik penggunaan warehouse, laporan kesalahan, jejak audit.

Alat Desain Warehouse • Menciptakan dan mengelola warehouse adalah sulit • Alat pengembangan §

Alat Desain Warehouse • Menciptakan dan mengelola warehouse adalah sulit • Alat pengembangan § Mendefinisikan & mengedit isi metadata repository (schemas, scripts, rules) § Queries dan reports § Pengiriman metadata ke dan dari katalog RDBMS (misal, Prism Warehouse Manager) • Planning & analysis tools § Dampak perubahan skema § Perencanaan kapasitas § refresh performance: mengubah refresh rates atau jendela waktu

Warehouse Management Tools • Alat pemantauan dan pelaporan (misal, HP Intelligent Warehouse Advisor) §

Warehouse Management Tools • Alat pemantauan dan pelaporan (misal, HP Intelligent Warehouse Advisor) § Partisi, tabel ringkasan, kolom mana yang digunakan § Waktu eksekusi query § Untuk tabel ringkasan, jenis & frekuensi roll downs § Penggunaan warehouse dari waktu ke waktu (mendeteksi periode puncak) • Alat manajamen sistem dan jaringan (misal, HP Open. View, IBM Net. View, Tivoli): traffic, utilization • Exception reporting/alerting tools (misal, DB 2 Event Alerters, Information Advantage Info. Agents & Info. Alert) § runaway queries • Analysis/Visualization tools: OLAP pada metadata

OLAP Tools < Existing Tools: Seagate, Brio, Cognos Fungsionalitas: < - Pemilihan tabel -

OLAP Tools < Existing Tools: Seagate, Brio, Cognos Fungsionalitas: < - Pemilihan tabel - Memungkinkan pengguna untuk menentukan hubungan keterkaitan - Penggunaan kondisi penyaringan - Membangun “cubes on the fly” Problem Utama: Biaya per license, poor semantics of aggregations across tables, performance for multiple dimension cubes • Visual OLAP Tool Tableau: http: //www. tableausoftware. com/ptour. htm