Beogradska poslovna kola Visoka kola strukovnih studija Uvod
Beogradska poslovna škola Visoka škola strukovnih studija - Uvod u BI - Skladišta podataka Stručni saradnik Arsen Lončar
Poslovna inteligencija (BI) Razlozi za uvođenje BI: Smanjenje raskoraka između količine raspoloživih podataka i informacija Pružanje novih rešenja kako bi se izborio opstanak na današnjem tržištu Osiguranje i održavanje likvidnosti kako bi se upravljalo poslovnim rezultatima Vođenje podataka o kupcima
Poslovna inteligencija (BI) Poslovna inteligencija (Business Intelligence - BI) je skup procesa za prikupljanje i analizu poslovnih informacija u cilju donošenja boljih poslovnih odluka i identifikaciju novih poslovnih mogućnosti
Sistemi poslovne inteligencije Sistem poslovne inteligencije je u osnovi sistem koji se koristi za ponalaženje obrazaca iz postojećih podataka smeštenih kroz redovno poslovanje. Sistem poslovne inteligencije integriše podatke iz različitih izvora (BP, DW, datoteke, . . . ) u jedinstveni sistem koji korisnicima omogućava da vide podatake u formatu koji je za njih najpogodniji, da vrše različite dodatne analize, itd. . .
Opšti model poslovne inteligencije Izbor podataka iz transakcione baze koji su zanimljivi za analizu Ekstrakcija, transformacija i čišćenje podataka Smeštanje podataka u skladište podataka (DW) Formiranje OLAP kocke Izrada predefinisanih izveštaja Rudarenje podataka (Data Mining)
Prednosti sistema za poslovnu inteligenciju Poboljšanje procesa upravljanja Planiranje, kontrola, merenje i/ili primena promena koje dovode do povećanja prihoda i smanjenja troškova Unapređenje poslovnog procesa Detekcija prevara, obrada narudžbenica, kupovina koja rezultuje povećanim prihodima i smanjenim troškovima Inteligencija prognoza i predviđanje budućnosti
Dominantne kompanije na svetskom tržištu na polju poslovne inteligencije Microsoft SAP IBM Oracle 70% BI tržišta
Analitičke funkcije koje sistemu za poslovnu inteligenciju isporučuju za postizanje ciljeva Parametrizovani izveštaji Produkcioni izveštaji Kontolne table/liste rezultata Upit na prečac/pretraga/kreiranje izveštaja Kretanje ka dole (Drill down) Prognoze, scenariji, modeli
Skladišta podataka (Data Warehouse - DW)
Baze podataka su razvijene sa ciljem upravljanja podacima SQL transformiše podatke u informacije Izuzetno moćan jezik, ali zahteva mnogo znanja za korišćenje
Baze podataka Odlično razvijena tehnologija Pouzdane Efektivne Odlične za operativnu podršku odličivanju NISU razvijene za analizu i stratešku podršku odlučivanju
OLTP sistem Baze podataka koriste OLTP (Online Transaction Processing) sistem OLTP sistemi su sistemi koji trenutno obrađuju podatke nastale u poslovnim transakcijama i bazirani su na relacionoj tehnologiji
Osobine OLTP sistema Visok stepen normalizacije podataka Paralelna obrada podataka (siše korisnika) Visok integritet podataka (i konzistentnost) Namenjeni za ažuriranje podataka Podržavaju operativno donošenje odluka Neefikasnost pri kreiranju složenih upita Kreiranje upita zahteva dosta znanja Pri izvršavanju kompleksnih upita narušava se konkurentna obrada
Šta je skladište podataka (DW)? Glavna arhiva istorijskih podataka kompanije, tzv. korporativna memorija. Skladište podataka sadrži sirovi materijal za sisteme za podršku menadžerskom odlučivanju Koristi OLAP sistem
Online Transaction Processing (OLAP) OLAP baze podataka omogućavaju upite poslovne inteligencije OLAP je tehnologija baze podataka koja je optimizovana za upite i pravljenje izveštaja, a ne za obradu transakcija Izvorni podaci za OLAP su OLTP (Online Transactional Processing) baze podataka koje se obično nalaze u skladištima za podatke.
OLAP karakteristike Visok stepen denormalizacije Podaci su namenjeni analizi i kompleksnim upitima Podaci su namenjeni za čitanje Podaci su konzistentni Podaci su istorijski Paralelna obrada nije ugrožena Visok stepen agregacije Bolje performanse pri rešavanju kompleksnih upita Nezavisnost od baze podataka Može da objedinjuje podatke iz različitih BP
OLTP vs. OLAP Obrada podataka Standardni SQL upiti Mb-Gb memorije Sirovi podaci Pristup: Svi korisnici Real-time podaci Čitanje podataka Kompleksni (analitički) upiti Gb-Tb Memorije Agregirani podaci Pristup: analitičar Istorijski podaci
Skladište podataka Denormalizovana baza podataka preduzeća kojma ima sledeće karakteristike (Inmon): Predmetno orijentisana Nepromenjiva Integrisana Vremenska dimenzija
Predmetno orijentisana Podaci su orijentisani oko predmeta (prodaja, ispitna prijava, telefonski poziv, . . . )
Nepromenjivost Podaci koji se jednom smeste u skladište podataka više nisu podložni promenama
Integrisanost Skladište podataka se puni sa više izvora Svi podaci sa istim značenjem MORAJU da imaju iste oznake (npr. različiti zapisi datuma)
Vremenska dimenzija U skladištu se beleže istorijski podaci Svaki upit izvršen nad skladištem podataka ima neki element vremena vezan za sebe Otvara se novi horizont dobijanjem strateških informacija na osnovu istorijskih podataka
OLAP kocka Kocka je softversko rešenje koje služi poboljšanju kasičnog načina postavljanja upita i izveštavanja Dimenzije – podaci koji čine kocku Mere – agregirani podaci po dimenzijama i članovima dimenzija
OLAP и DW Data Warehouse OLAP OLTP извори ETL Data Mart Осталии звори Kranji korisnik 24
Razvoj skladišta podataka ETL Izgradnja DW Izveštavanje
Extract-Transform-Load (ETL) Prenošenje podataka iz različitih izvora u skladište Ispravljanje grešaka Denormalizacija podataka Spajanje više izvora Agregiranje podataka Konsolidacija formata zapisa (’’ 04/29/2012’’, ’’ 2, sep 2012’’)
Izgradnja skladišta podataka Fakt tabela (tabela činjenica) Dimenzije Mere Šeme skladišta podataka
Fakt tabela Fakt tabele sadrže merljive vrednosti biznisa Numerički i aditivni Sadrži mere povezane sa specifičnim procesima poslovanja (primanje narudžbine, primanje pacijenta, . . . ) Izvedene fakt tabele
Primer fakt tabele Датум 11/02/15 11/02/16 11/02/15 11/03/15 11/03/16 Произв. 1 1 2 2 Купац Petar Milan Saša Petar Jovan Milan Saša Кол. 250 92 105 81 125 302 144 171 Цена 3, 295 1, 422 1, 750 1, 090 2, 105 3, 988 2, 675 3, 009
Dimenzije Opisivanje objekata koji učestvuju u poslovanju (zaposleni, klijent, vozilo, . . . ) Prepoznaju se po reči ’’po’’ (eng. by) Primer: prodaja PO mesecu, PO proizvodu. . . Potvrđena dimenzija – dimenzija koja se deli kroz sve poslovne procese Vremenska dimenzija – dim_date
Primer dimenzione tabele ID Регион Име региона Град Менаџер 101 Region 1 Beograd Milan 102 Region 2 Niš Saša 103 Region 3 Novi Sad Petar 104 Region 4 Subotica Jovan
Zvezdasta (star) šema
Pahulja (snowflake) šema
Star vs. Snowflase Jednostavniji problemi Manje spajanja tabela Bolje performanse vs. vs. Složeniji problemi Više spajanja tabela Lošije performanse
Granularnost Nivo detalja koje sadrži fakt tabela Visoka i niska granularnost Poželjno što manje detalja u odnosu na originalan izvor
- Slides: 35