Informacioni sistemi Prof dr Angelina Njegu Inteligentni informacioni

  • Slides: 82
Download presentation
Informacioni sistemi Prof. dr Angelina Njeguš Inteligentni informacioni sistemi II deo (OLAP, data mining,

Informacioni sistemi Prof. dr Angelina Njeguš Inteligentni informacioni sistemi II deo (OLAP, data mining, BI) v OLAP kocke v Data mining algoritmi v O BI sistemima Beograd, 2016/2017.

Informacioni sistemi Prof. dr Angelina Njeguš OLAP kocke v OLAP sistemi v OLAP arhitektura

Informacioni sistemi Prof. dr Angelina Njeguš OLAP kocke v OLAP sistemi v OLAP arhitektura v OLAP interfejsi v Studija slučaja

Informacioni sistemi Prof. dr Angelina Njeguš OLAP sistemi § OLAP (On-line Analytical Processing) rešenja

Informacioni sistemi Prof. dr Angelina Njeguš OLAP sistemi § OLAP (On-line Analytical Processing) rešenja omogućavaju korisnicima brz i fleksibilan pristup kombinovanim višedimenzionalnim podacima izvučenih iz skladišta podataka § OLAP kocke su upiti (queries) nad skladištem podataka § Poslovni podaci su uskladišteni u OLAP kocku ú Podaci se analiziraju sa različitih perspektiva ú Podaci su modelovani da odgovaraju poslovanju § OLAP kocka odgovara na pitanja, npr: ú Da li se dešava isti šablon svake godine? ú Da li se može posmatrati na drugačiji način?

Informacioni sistemi Prof. dr Angelina Njeguš OLAP arhitektura

Informacioni sistemi Prof. dr Angelina Njeguš OLAP arhitektura

Informacioni sistemi Prof. dr Angelina Njeguš OLAP: Troslojni sistem

Informacioni sistemi Prof. dr Angelina Njeguš OLAP: Troslojni sistem

Informacioni sistemi Prof. dr Angelina Njeguš Cubing servisi – OLAP analitika § MDX (Multi.

Informacioni sistemi Prof. dr Angelina Njeguš Cubing servisi – OLAP analitika § MDX (Multi. Dimensional e. Xpressions) – visoko funkionalna sintaksa za postavljanje upita nad multidimenzionalnim podacima

Informacioni sistemi Prof. dr Angelina Njeguš Virtuelne kocke

Informacioni sistemi Prof. dr Angelina Njeguš Virtuelne kocke

Informacioni sistemi Prof. dr Angelina Njeguš Različite perspektive kocke kroz studiju slučaja Novi Sad

Informacioni sistemi Prof. dr Angelina Njeguš Različite perspektive kocke kroz studiju slučaja Novi Sad zv o oi Veš mašine Frižideri Klima Televizori di Niš Q 2 Q 3 Dimenzija Vreme Q 4 m Q 1 en zi je Pr Skoplje Di Dimenzija Tržište Beograd

Informacioni sistemi Prof. dr Angelina Njeguš Pravljenje upita nad kockom Fakti o prodaji Novi

Informacioni sistemi Prof. dr Angelina Njeguš Pravljenje upita nad kockom Fakti o prodaji Novi Sad Q 1 Q 2 Q 3 Dimenzija Vreme Q 4 zv o oi Pr zi ja Skoplje en Veš mašine Frižideri Klime Televizori di Niš Di m Dimenzija Tržište Beograd

Informacioni sistemi Prof. dr Angelina Njeguš Definisanje “kriške” (engl. slice) ili podskupa kocke Novi

Informacioni sistemi Prof. dr Angelina Njeguš Definisanje “kriške” (engl. slice) ili podskupa kocke Novi Sad Dimenzija Vreme Q 4 od ja Q 3 zi Q 2 en Q 1 oi zv Skoplje Pr Veš mašine Frižideri Klime Televizori i Niš Di m Dimenzija Tržište Beograd

Informacioni sistemi Prof. dr Angelina Njeguš Izveštaj za studiju slučaja Grad Proizvod Vreme Broj

Informacioni sistemi Prof. dr Angelina Njeguš Izveštaj za studiju slučaja Grad Proizvod Vreme Broj prodatih artikala Prihod u hiljadama din. Svi Sve 113 251. 26 Novi Sad Svi Sve 64 146. 07 Novi Sad Whirlpool veš mašina Sve 38 98. 49 Novi Sad Whirlpool veš mašina Sve 13 32. 24 Novi Sad Whirlpool veš mašina Kvartal 1 3 7. 44 Novi Sad Whirlpool veš mašina Mart 3 7. 44 11

Informacioni sistemi Prof. dr Angelina Njeguš Star šema u kocki podataka

Informacioni sistemi Prof. dr Angelina Njeguš Star šema u kocki podataka

Informacioni sistemi Prof. dr Angelina Njeguš Primer

Informacioni sistemi Prof. dr Angelina Njeguš Primer

Informacioni sistemi Prof. dr Angelina Njeguš Različiti pogledi na iste podatke Mesec P Grad

Informacioni sistemi Prof. dr Angelina Njeguš Različiti pogledi na iste podatke Mesec P Grad r o i z vo d Svi gradovi i meseci za jedan proizvod Svi proizvodi i meseci za jedan grad Svi proizvodi i gradovi za jedan mesec

Informacioni sistemi Prof. dr Angelina Njeguš Prikaz OLAP-a

Informacioni sistemi Prof. dr Angelina Njeguš Prikaz OLAP-a

Informacioni sistemi Prof. dr Angelina Njeguš Rad sa dimenzijama i hijerarhijama § Dimenzije vam

Informacioni sistemi Prof. dr Angelina Njeguš Rad sa dimenzijama i hijerarhijama § Dimenzije vam dozvoljavaju ú Slice l n Dice Hijerarhije vam dozvoljavaju l l Drill Down Drill Up

Informacioni sistemi Prof. dr Angelina Njeguš Interfejsi OLAP kocke § Upiti (Query) – mogućnost

Informacioni sistemi Prof. dr Angelina Njeguš Interfejsi OLAP kocke § Upiti (Query) – mogućnost kreiranja sopstvenih izveštaja § Izveštavanje i dashboard (kontrolna tabla) – prikaz bilo kog predefinisanog izveštaja i ključnih org. podataka u realnom vremenu koji omogućavaju drill down i druge OLAP opcije § Analize – mogućnost višedimenzionalne analize, poređenja. . . § Scorecarding – metrike ključnih poslovnih indikatora, pomaže korisnicima da shvate šta se dešava, ko je odgovoran i ko preduzima akciju. . . § Upravljanje događajima (Event management)

Informacioni sistemi Prof. dr Angelina Njeguš OLAP arhitekture MOLAP ROLAP Kombinovana arhitektura

Informacioni sistemi Prof. dr Angelina Njeguš OLAP arhitekture MOLAP ROLAP Kombinovana arhitektura

Informacioni sistemi Prof. dr Angelina Njeguš HOLAP – Hibridni OLAP

Informacioni sistemi Prof. dr Angelina Njeguš HOLAP – Hibridni OLAP

Informacioni sistemi Prof. dr Angelina Njeguš Otkrivanje znanja i data mining v Data mining

Informacioni sistemi Prof. dr Angelina Njeguš Otkrivanje znanja i data mining v Data mining i otkrivanje znanja v Tradicionalni vs evolutivni pristup v Data mining proces v Data mining modeli

Informacioni sistemi Prof. dr Angelina Njeguš Data mining i otkrivanje znanja § Data mining

Informacioni sistemi Prof. dr Angelina Njeguš Data mining i otkrivanje znanja § Data mining je proces otkrivanja skrivenih veza između vrednosti atributa i pronalaženja obrazaca (šablona) ponašanja iz ogromnih količina podataka § Proces otkrivanja znanja (Knowledge Discovery in Databases - KDD) uzima sirove rezultate iz data mining-a i transformiše ih u korisne i razumljive informacije

Informacioni sistemi Prof. dr Angelina Njeguš Data mining § Tipična pitanja koja se postavljaju

Informacioni sistemi Prof. dr Angelina Njeguš Data mining § Tipična pitanja koja se postavljaju sistemu: ú Kakav je profil mojih klijenata? ú Na koje klijente treba da ciljam u promociji? ú Koje proizvode/usluge treba da promovišem? ú Ko će se od mojih klijenata sigurno odazvati promociji? ú Kako da poboljšam lojalnost kupaca? ú Koji artikal će kupci najverovatnije kupiti? ú Kako mogu da otkrijem potencijalne prevare? ú. . .

Informacioni sistemi Prof. dr Angelina Njeguš Tradicionalni pristup

Informacioni sistemi Prof. dr Angelina Njeguš Tradicionalni pristup

Informacioni sistemi Prof. dr Angelina Njeguš Data mining – evolutivni pristup

Informacioni sistemi Prof. dr Angelina Njeguš Data mining – evolutivni pristup

Informacioni sistemi Prof. dr Angelina Njeguš Data mining proces

Informacioni sistemi Prof. dr Angelina Njeguš Data mining proces

Informacioni sistemi Prof. dr Angelina Njeguš Primene Data mininga § Reklamiranje na Internetu ú

Informacioni sistemi Prof. dr Angelina Njeguš Primene Data mininga § Reklamiranje na Internetu ú Klasifikovanje grupa klijenata sa sličnim informacijama ú Praćenje kretanja klijenata na Internetu i otkrivanje njihovih želja ú Pretraživanja istih obrazaca klijenata na Internetu: “Ukoliko vam se dopada knjiga x, proverite i sledeće ponuđene knjige”. § Upravljanje kreditnim rizikom ú Predviđanje da li je klijent dobar ili rizičan za davanje kredita

Informacioni sistemi Prof. dr Angelina Njeguš Položaj data mininga

Informacioni sistemi Prof. dr Angelina Njeguš Položaj data mininga

Informacioni sistemi Prof. dr Angelina Njeguš Koraci data mining-a

Informacioni sistemi Prof. dr Angelina Njeguš Koraci data mining-a

Informacioni sistemi Prof. dr Angelina Njeguš Data mining algoritmi § Nekoliko tehnika data mininga

Informacioni sistemi Prof. dr Angelina Njeguš Data mining algoritmi § Nekoliko tehnika data mininga omogućava identifikovanje obrazaca u ogromnom broju podataka § Neki modeli su: ú Drvo odlučivanja ú Pravila asocijacije ú Naivni Bajes (Naive Bayes) ú Klastering ú Vremenske serije ú Neuronske mreže ú Text Mining ú Linearne regresije

Informacioni sistemi Prof. dr Angelina Njeguš Pravila asocijacije § Pravila asocijacije (Association Rules) –

Informacioni sistemi Prof. dr Angelina Njeguš Pravila asocijacije § Pravila asocijacije (Association Rules) – pomaže u identifikovanju relacija između različitih elemenata ú grupiše po sličnosti, odnosno koristi se za pronalaženje grupe artikala koji se najčešće zajedno događaju u jednoj transakciji ú Koji zapisi se podudaraju sa datim pravilom? (ciljani marketing) ú Koja pravila se poklapaju sa istim zapisom? (Amazon ponuda)

Informacioni sistemi Prof. dr Angelina Njeguš Naive Bayes § Naive Bayes – ovaj algoritam

Informacioni sistemi Prof. dr Angelina Njeguš Naive Bayes § Naive Bayes – ovaj algoritam se zasniva na Bayes-ovoj teoremi koji računa uslovnu verovatnoću između ulaznih i predvidljivih promenljivih i pretpostavlja da su promenljive nezavisne. Pogodna je za otkrivanje relacija između ulaznih promenljivih i predvidljivih promenljivih. ú Na primer, marketing odelenje je odlučilo da targetira potencijalne klijente slanjem flajera poštom. Žele da pošalju flajere samo onim klijentima koji će najverovatnije odreagovati. Upoređuju potencijalne klijente sa klijentima koji imaju slične karakteristike, a koji su kupili u prethodnom periodu. Naïve Bayes

Informacioni sistemi Prof. dr Angelina Njeguš Klastering § Sequence Clustering – grupiše zapise podataka

Informacioni sistemi Prof. dr Angelina Njeguš Klastering § Sequence Clustering – grupiše zapise podataka koji su slični na osnovu sekvenci prethodnih događaja ú Kom klasteru/segmentu pripada dati zapis? ú Npr. , segmentacija klijenata po sličnim karakteristikama kako se kreću kroz veb stranice jednog sajta. Ovaj algoritam može da grupiše klijente prema njihovom redosledu otvaranja stranica na sajtu kako bi pomogli u analizi korisnika i u određivanju koje su putanje profitabilnije od drugih. Ovaj algoritam se takođe može koristiti u predviđanju koju će sledeću stranicu korisnik posetiti.

Informacioni sistemi Prof. dr Angelina Njeguš Vremenske serije § Vremenske serije (Time Series) –

Informacioni sistemi Prof. dr Angelina Njeguš Vremenske serije § Vremenske serije (Time Series) – ovaj algoritam se koristi za analizu i predviđanje vremenskih trendova ú Npr. , određuje procente saobraćajnih nesreća tokom praznika na osnovu broja nesreća koje su se dogodile tokom istog perioda u protekloj godini.

Informacioni sistemi Prof. dr Angelina Njeguš Neuronske mreže § Neuronske mreže (Neural Nets) –

Informacioni sistemi Prof. dr Angelina Njeguš Neuronske mreže § Neuronske mreže (Neural Nets) – kao što čovek uči na osnovu iskustva tako može i računar. Neuronske mreže modeluju neuronske veze u ljudskom mozgu i na taj način simuliraju učenje. ú Ukoliko sastavljate podatke gde su ulazne i izlazne činjenice poznate, računar može da nauči iz tih obrazaca i postavi pravila i matematičke faktore kako bi npr. , pomogao izračunavanje ili predvideo izlaznu vrednost. ú Pretpostavimo da želite da prodate kola, nekoliko faktora utiče na prodajnu cenu kao što su godine, stanje, proizvođač, model itd. Analizirajući cene kola, neuronske mreže mogu da kreiraju seriju ulaznih i izlaznih faktora kako bi predvideli cenu prodaje. Neural Net

Informacioni sistemi Prof. dr Angelina Njeguš Text Mining § Text Mining – analizira nestruktuirane

Informacioni sistemi Prof. dr Angelina Njeguš Text Mining § Text Mining – analizira nestruktuirane tekstualne podatke § Veliki broj nestruktuiranih informacija (text) čini 80% informacija kompanije ú Beleške call centara ú Izveštaji o problemima ú Izveštaji o popravkama ú Potraživanja od osiguranja ú E-mailovi sa klijentima ú Komentari proizvoda. . . § Text mining pretvara nestruktuirane informacije u struktuirane koje se mogu analizirati zajedno sa struktuiranim § Npr. , kompanije mogu da analiziraju nestruktuirani podatak kao što je deo za komentare gde klijenti unose svoje utiske, zadovoljstvo o proizvodu i druge komentare

Informacioni sistemi Prof. dr Angelina Njeguš Linearna regresija § Regresija koristi postojeće vrednosti varijabli

Informacioni sistemi Prof. dr Angelina Njeguš Linearna regresija § Regresija koristi postojeće vrednosti varijabli da bi se na bazi njih predvidele vrednosti ostalih varijabli. ú Npr. , prema istorijskim podacima klijenata, predviđaju se klijenti koji će biti najprofitabilniji u budućnosti ú U ERP sistemima predviđaju se prodaja i prihodi, potreba za zalihama. . . ú U realnim situacijama, često ne postoji linearna međuzavisnost sadašnjih i budućih podataka. Recimo, vrednosti akcija na berzi je jako teško predvideti jer one zavise od složenih interakcija velikog broja varijabli. U tom slučaju, koriste se složene tehnike, kao što su logistička regresija, stabla odlučivanja ili neuronske mreže

Informacioni sistemi Prof. dr Angelina Njeguš Koncept modela predviđanja

Informacioni sistemi Prof. dr Angelina Njeguš Koncept modela predviđanja

Informacioni sistemi Prof. dr Angelina Njeguš Neki algoritmi Data Mining-a Decision Trees Sequence Clustering

Informacioni sistemi Prof. dr Angelina Njeguš Neki algoritmi Data Mining-a Decision Trees Sequence Clustering Association Linear Regression Time Series Neural Net Text Mining Naïve Bayes Logistic Regression

Informacioni sistemi Prof. dr Angelina Njeguš Info. Sphere Warehouse rešenje za poslovnu analitiku 39

Informacioni sistemi Prof. dr Angelina Njeguš Info. Sphere Warehouse rešenje za poslovnu analitiku 39

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja: Text mining § Lanac restorana od

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja: Text mining § Lanac restorana od svojih klijenata traži povratne informacije koristeći sledeću formu:

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Podaci će biti uskladišteni u

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Podaci će biti uskladišteni u tabelu nad kojom će se postavljati upiti koji će odrediti: ú Koja lokacija je naprofitabilnija? ú Prosečan broj godina klijenata po lokaciji. . . Međutim, šta da se radi sa kolonom komentari?

Informacioni sistemi Prof. dr Angelina Njeguš UIMA: Standard za obradu i analizu sadržaja §

Informacioni sistemi Prof. dr Angelina Njeguš UIMA: Standard za obradu i analizu sadržaja § UIMA – Unstructured Information Management Architecture

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Može se kreirati rečnik koji

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Može se kreirati rečnik koji se zasniva na ključnim rečima

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Kreira se nova kolona koja

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Kreira se nova kolona koja će pamtiti komentare klijenata § Sada se može kreirati upit zajedno sa drugim dimenzijama

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Mogu se ekstrakovati i poštanski

Informacioni sistemi Prof. dr Angelina Njeguš Studija slučaja § Mogu se ekstrakovati i poštanski brojevi klijenata kako bi se uporedile adrese klijenata sa lokacijama restorana

Informacioni sistemi Prof. dr Angelina Njeguš Uvodni primer § Koji je ključni atribut za

Informacioni sistemi Prof. dr Angelina Njeguš Uvodni primer § Koji je ključni atribut za predviđanje da li će svršeni srednjoškolci upisati fakultet ili ne? § Postavljana su im sledeća pitanja: ú ú ú § Kog su pola? Koliki je prihod njihovih roditelja? Koliki im je IQ? Da li ih roditelji ohrabruju da nastave studiranje ili ne? Da li planiraju da upišu fakultet? Da bi na osnovu prikupljenih podataka utvrdili koliko studenata će nastaviti školovanje, neophodno je da se postavi upit koji broji zapise studenata koji žele i onih koji ne žele da nastave školovanje.

Informacioni sistemi Prof. dr Angelina Njeguš Uvodni primer (nastavak) § Pretpostavimo da ste zainteresovani

Informacioni sistemi Prof. dr Angelina Njeguš Uvodni primer (nastavak) § Pretpostavimo da ste zainteresovani da odredite koji atribut ili kombinacija atributa imaju najveći uticaj da predvidi verovatnoću studenata koji će upisati fakultet. Ovo je složeniji upit i zahteva korišćenje tehnika data mininga. § Primenjujući algoritam drveta odlučivanja otkrivene su sledeće relacije: ú Najuticajniji atribut je ohrabrivanje njihovih roditelja da upišu fakultet. Oni studenti koje roditelji ohrabruju da upišu fakultet, 60 % planira da upiše fakultet i to uglavnom oni sa visokim IQ.

Informacioni sistemi Prof. dr Angelina Njeguš Drvo odlučivanja Svi studenti Upisaće fakultet: 33% Da

Informacioni sistemi Prof. dr Angelina Njeguš Drvo odlučivanja Svi studenti Upisaće fakultet: 33% Da 67% Ne Ohrabrenje roditelja = Da Podsticaj od strane roditelja ? Upisaće fakultet: 57% Da 43% Ne IQ Ohrabrenje roditelja = Ne Upisaće fakultet: 6% Da 94% Ne Visok IQ Upisaće fakultet: 18% Da 82% Ne Visok IQ Nizak IQ Upisaće fakultet: 74% Da 29% Da 26% Ne 71% Ne Srednji IQ Upisaće fakultet: 9% Da 91% Ne IQ Nizak IQ Upisaće fakultet: 4% Da 96% Ne

Informacioni sistemi Prof. dr Angelina Njeguš Uvod u scenario Platne kartice § Direktor marketinga

Informacioni sistemi Prof. dr Angelina Njeguš Uvod u scenario Platne kartice § Direktor marketinga želi da oceni trenutni program platnih kartica. Da bi zadržao postojeće klijente i ispunio njihova očekivanja, želi da identifikuje mogućnosti kako bi povećao nivo usluga kod svih kartica: zlatna, srebrna, bronzana i obična § Raspoložive informacije od klijenata su pol, bračni status, godišnji prihodi, nivo obrazovanja § Da bi predvideli faktore koji utiču na izbor odgovarajuće kartice koristićemo Data mining: ú Koristićemo tehniku drveta odlučivanja da bi pronašli obrazac za izbor platne kartice. ú Odabraćemo Klijente kao dimenziju slučaja (case dimension). ú Odabraćemo Platnu karticu kao informaciju koju će koristiti algoritam DM da bi identifikovao obrasce. ú Iskoristiće se raspoložive informacije o klijentima kako bi se pronašao obrazac. ú Ispitati drvo odlučivanja.

Informacioni sistemi Prof. dr Angelina Njeguš Izbor tehnike Data Mininga

Informacioni sistemi Prof. dr Angelina Njeguš Izbor tehnike Data Mininga

Informacioni sistemi Prof. dr Angelina Njeguš Izbor slučaja (case)

Informacioni sistemi Prof. dr Angelina Njeguš Izbor slučaja (case)

Informacioni sistemi Prof. dr Angelina Njeguš Selektovanje entiteta za predviđanje

Informacioni sistemi Prof. dr Angelina Njeguš Selektovanje entiteta za predviđanje

Informacioni sistemi Prof. dr Angelina Njeguš Selektovanje podataka za analizu (training data)

Informacioni sistemi Prof. dr Angelina Njeguš Selektovanje podataka za analizu (training data)

Informacioni sistemi Prof. dr Angelina Njeguš Kreiranje dimenzije i virtuelne kocke ¡ Ukoliko želite

Informacioni sistemi Prof. dr Angelina Njeguš Kreiranje dimenzije i virtuelne kocke ¡ Ukoliko želite na interaktivan ad-hoc način da isptujete drvo odlučivanja onda možete da uključite opciju kreiranja nove dimenzije i uključivanje iste u virtuelnu kocku. .

Informacioni sistemi Prof. dr Angelina Njeguš Ispitivanje Data Mining modela Content Detail – fokus

Informacioni sistemi Prof. dr Angelina Njeguš Ispitivanje Data Mining modela Content Detail – fokus DM modela Content Navigator – kompleta pogled DM modela; koristi se i za navigaciju kroz drvo odlučivanja i menjanja sadrža u Content Detail. Atributi – Predstavlja numeričk ili grafičke prezentacije entiteta za predviđanje za trenutno izabrani čvor. Node Path

Informacioni sistemi Prof. dr Angelina Njeguš Ispitivanje zavisnosti mreže

Informacioni sistemi Prof. dr Angelina Njeguš Ispitivanje zavisnosti mreže

Informacioni sistemi Prof. dr Angelina Njeguš Primer data mining scenarija § Data mining model

Informacioni sistemi Prof. dr Angelina Njeguš Primer data mining scenarija § Data mining model = Market Basket Analysis - Pravilo asocijacije § Model podataka koji se koristi = Movie. DB § Cilj data mininga: Uočiti asocijacije u kupovini karata za filmove ú Ukoliko je kupljeno n karata za film X, da li će se kupiti karte i za filmove Y ili Z? § Neophodni podaci: ú Kupljene karte za određene filmove ú Vreme ú Klijent ú Drugi filteri § Pretpostavke: ú Deo – kupovina karata za film ú Transakcija – koje karte je kupac kupio u periodu od 6 meseci

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis § Odrediti delove u transakcijama

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis § Odrediti delove u transakcijama

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis § Izračunati matricu zajedničkog događanja

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis § Izračunati matricu zajedničkog događanja

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis § Pravila asocijacije ú Na

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis § Pravila asocijacije ú Na primer, ukoliko su kupljene karte za film X, onda su i karte za film Y (nisu) kupljene § Faktori podrške pravila ú Procenat transakcija koja podržavaju ovo pravilo § Faktori pouzdanosti ú # transakcija podržava pravilo / # transakcija za koje pravilo važi pod nekim uslovom

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis – analiza rezultata § Rezultat

Informacioni sistemi Prof. dr Angelina Njeguš Market basket analysis – analiza rezultata § Rezultat 1: ú Primer asocijacije: Ukoliko su kupljene karte za film 1 onda su kupljene i karte za film 4 – Faktor koji podržava ovo pravilo: 40% » Dve od četiri transakcije sadrže ovo pravilo (kupovina oba filma 1 i 4) – Faktor pouzdanosti: 50% » Dve od četiri transakcije uključuje ovo pravilo (kupovina filma 1 takođe uključuje kupovinu filma 4) § Uključiti atribute i događaje u analizu: ú Na primer, period vremena kada se prodaju karte, način plaćanja, period popusta ili promocije itd.

Informacioni sistemi Prof. dr Angelina Njeguš Prediktivni Data Mining Iskren Tridas Vickie Mike Wally

Informacioni sistemi Prof. dr Angelina Njeguš Prediktivni Data Mining Iskren Tridas Vickie Mike Wally Waldo Barney Nepošten

Informacioni sistemi Prof. dr Angelina Njeguš Predviđanje Tridas Vickie Mike Iskren = ima okrugle

Informacioni sistemi Prof. dr Angelina Njeguš Predviđanje Tridas Vickie Mike Iskren = ima okrugle oči i osmeh

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja (Decision Trees) § Podaci Visina Nizak

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja (Decision Trees) § Podaci Visina Nizak Visok Visok Nizak Kosa Plava Riđa Crna Plava Oči Plave Smeđe Plave Smeđe Klasa A B B 64

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja kosa crna plava riđa nizak, plave

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja kosa crna plava riđa nizak, plave = B visok, smeđe = B {visok, plave = A} Potpuno klasifikuje tamnokose i riđokose ljude nizak, plave = A visok, smeđe = B visok, plave = A nizak, smeđe = B U potpunosti ne klasifikuje ljude sa plavom kosom. Neophodan je dalji rad.

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja kosa crna plava riđa nizak, plave

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja kosa crna plava riđa nizak, plave = B visok, smeđe = B {visok, plave = A} Stablo odlučivanja je kompletno jer: 1. Svih 8 klasa se pojavljuju u čvorovima 2. Kod svakog čvora, svi slučajevi su u istoj klasi (A ili B) nizak, plave = A visok, smeđe = B visok, plave = A nizak, smeđe = B oči plave Nizak = A Visok = A smeđe Visok = B Nizak = B

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja: Naučeno pravilo predviđanja kosa crna B

Informacioni sistemi Prof. dr Angelina Njeguš Stablo odlučivanja: Naučeno pravilo predviđanja kosa crna B plava riđa A oči plave A smeđe B

Informacioni sistemi Prof. dr Angelina Njeguš Primene data mining-a

Informacioni sistemi Prof. dr Angelina Njeguš Primene data mining-a

Informacioni sistemi Prof. dr Angelina Njeguš Primena data mining-a u maloprodaji § Analiza korpe

Informacioni sistemi Prof. dr Angelina Njeguš Primena data mining-a u maloprodaji § Analiza korpe (Basket analysis) ú Koje artikle klijenti kupuju zajedno? - ovo znanje može da poboljša skladištenje, promociju … § Prognoza prodaje (Sales forecasting) ú Ispitivanje vremenskih obrazaca pomaže prodavcima u odlučivanju o skladištenju robe ú Ukoliko klijent danas kupi jedan artikal, kada će kupiti kompletan asortiman tog artikla? § Marketing ú Prodavci mogu da kreiraju profile svojih klijenata prema određenim ponašanjima, npr. , oni koji kupuju samo markiranu robu i oni koji vole rasprodaje. Ova informacija je korisna kada se rade promocije popusta. § Planiranje i alokacija robe ú Ukoliko prodavac otvara novu prodavnicu, on može poboljšati planiranje i raspodelu robe, ispitujući šablone (paterne) u prodavnicama sa sličnim demografskim karakteristikama. ú Takođe prodavci mogu da koriste data mining da bi utvrdili idealan raspored za određenu prodavnicu.

Informacioni sistemi Prof. dr Angelina Njeguš Primena data mininga u bankarstvu § Marketing kartica

Informacioni sistemi Prof. dr Angelina Njeguš Primena data mininga u bankarstvu § Marketing kartica (Card marketing) ú Identifikovanjem segmenata klijenata banke, izdavaoci kartica i oni koji ih nabavljaju mogu da poboljšaju profitabilnost sa efektinijim programima pridobijanja i zadržavanja klijenata, razvojem ciljanog proizvoda i kastimiziranih cena § Formiranje cena i profitabilnost ú Izdavaoci kartica, na osnovu data mining-a, mogu da kreiraju takve cene proizvoda koje će povećati profit, a smanjiti gubitak klijenata. § Otkrivanje prevara ú Analiziranjem prethodnih transakcija, za koje se kasnije pokazalo da su lažne, banka može da identifikuje paterne (šablone)

Informacioni sistemi Prof. dr Angelina Njeguš Primena data mininga u telekomunikacijama § Analiza poziva

Informacioni sistemi Prof. dr Angelina Njeguš Primena data mininga u telekomunikacijama § Analiza poziva ú Telekomunikacione kompanije akumuliraju detaljne zapise poziva. Identifikujući segmente klijenata koji koriste slične obrasce, kompanija može da razvije atraktivne programe cena, funkcionalnosti i druge programe promocija § Lojalnost klijenata ú Neki klijenti često menjaju provajdere kako bi iskoristili prednosti atraktivnih promotivnih kampanja konkurentnih kompanija ú Kompanije koriste DM kako bi identifikovali karakteristike klijenata koji su prešli kod njih, kao i da usmere svoje programe na one klijente koji proizvode najveći profit.

Informacioni sistemi Prof. dr Angelina Njeguš Primene data mininga u ostalim privrednim granama §

Informacioni sistemi Prof. dr Angelina Njeguš Primene data mininga u ostalim privrednim granama § Proizvodnja ú Proizvođači moraju da kastimiziraju proizvode za klijente, s toga moraju biti u stanju da predvide koje funkcionalnosti treba da ugrade u proizvode kako bi zadovoljili zahteve kupaca § Žalbe ú Proizvođači treda da predvide broj klijenata koji će podneti žalbe, kao i prosečne troškove od tih žalbi § Avio industrija ú Avio linije mogu da identifikuju grupe klijenata koji se mogu podstaći da putuju više puta.

Informacioni sistemi Prof. dr Angelina Njeguš O Business intelligence (BI) sistemima v Šta je

Informacioni sistemi Prof. dr Angelina Njeguš O Business intelligence (BI) sistemima v Šta je BI? v Kome je BI namenjen? v BI alati na tržištu v Zanimanje: BI konsultant

Informacioni sistemi Prof. dr Angelina Njeguš BI sistemi § Inteligentni poslovni sistemi (Business Intelligence

Informacioni sistemi Prof. dr Angelina Njeguš BI sistemi § Inteligentni poslovni sistemi (Business Intelligence – BI) je arhitektura koja predstavlja zbirni naziv za: ú kolekciju integrisanih alata, ú aplikacija i ú baza podataka koje obezbeđuju organizaciji: ú efikasan i lak pristup poslovnim podacima ú analizu i ú međusobno deljenje informacija u cilju donošenja kvalitetnijih, brzih i relevantnijih odluka i poboljšanja sveukupne poslovne efektivnosti

Informacioni sistemi Prof. dr Angelina Njeguš BI daje odgovor na pet pitanja • •

Informacioni sistemi Prof. dr Angelina Njeguš BI daje odgovor na pet pitanja • • • Data Šta se desilo? Šta se dešava? Prošlost Zašto se to desilo? Šta će se desiti? Šta ja želim da se dogodi? ERP CRM SCM 3 Pty Sadašnjost Budućnost Doc

Informacioni sistemi Prof. dr Angelina Njeguš Frontend alati 76

Informacioni sistemi Prof. dr Angelina Njeguš Frontend alati 76

Informacioni sistemi Prof. dr Angelina Njeguš Kome je BI namenjen

Informacioni sistemi Prof. dr Angelina Njeguš Kome je BI namenjen

Informacioni sistemi Prof. dr Angelina Njeguš BI alati na tržištu § Oracle - Siebel

Informacioni sistemi Prof. dr Angelina Njeguš BI alati na tržištu § Oracle - Siebel Business Analytics Applications § SAS - Business Intelligence § SAP - Business. Objects XI § IBM - Cognos 8 BI § Oracle - Hyperion System 9 BI+ § Microsoft - Analysis Services § Micro. Strategy - Dynamic Enterprise Dashboards § Pentaho - Open BI Suite § Information Builders - Web. FOCUS Business Intelligence § Qlik. Tech – Qlik. View § TIBCO Spotfire - Enterprise Analytics § Sybase – Info. Maker § KXEN – IOLAP § SPSS - Show. Case

Informacioni sistemi Prof. dr Angelina Njeguš Zanimanje: BI developer § § § Razvija DW

Informacioni sistemi Prof. dr Angelina Njeguš Zanimanje: BI developer § § § Razvija DW Razvija OLAP kocke Dizajnira, razvija i implementira dashboards, izveštaje i druge interfejse Poznaje metodologije razvoja BI sistema Koristi data mining algoritme radi kreiranja izveštaja … BI analitičar/konsultant

Informacioni sistemi Prof. dr Angelina Njeguš Konkursi na tržištu § BI Developer § BI

Informacioni sistemi Prof. dr Angelina Njeguš Konkursi na tržištu § BI Developer § BI Reporting Analyst § BI Architect § BI Specialist § BI Expert § BI Consultant § …

Informacioni sistemi Prof. dr Angelina Njeguš Sticanje znanja i veština na Univerzitetu Singidunum §

Informacioni sistemi Prof. dr Angelina Njeguš Sticanje znanja i veština na Univerzitetu Singidunum § § Univerzitet je član IBM Akademske Inicijative ú IBM Kurs: “Info. Sphere Warehouse (DM 032)” sa modulima (tabela) ú Dostupna virtuelna mašina sa materijalima za vežbu ú Dostupnost materijala sa kurseva i određenih alata: https: //www. ibm. com/developerworks/university/ac ademicinitiative/ Univerzitet je član Microsoft IT Academy ú Microsoft kurs: “Introducing Business Intelligence in Microsoft SQL Server 2008 R 2” ú Deo kursa “Implementing and Maintaining Business Intelligence in Microsoft SQL Server 2008: Integration Services, Reporting Services and Analysis Services” ú Pristup e-learning kursevima ú SQL Server 2008 R 2 Business Intelligence Training Course: http: //msdn. microsoft. com/en-us/gg 618026

Informacioni sistemi Prof. dr Angelina Njeguš Besplatna e-knjiga § § Naziv: Introducing Microsoft SQL

Informacioni sistemi Prof. dr Angelina Njeguš Besplatna e-knjiga § § Naziv: Introducing Microsoft SQL Server 2008 R 2 Autori: Ross Mistry and Stacia Misner Izdavač: Microsoft Godina izdanja: 2010 § Struktura knjige: PART I Database Administration CHAPTER 1 SQL Server 2008 R 2 Editions and Enhancements CHAPTER 2 Multi-Server Administration CHAPTER 3 Data-Tier Applications CHAPTER 4 High Availability and Virtualization Enhancements CHAPTER 5 Consolidation and Monitoring PART II Business Intelligence Development CHAPTER 6 Scalable Data Warehousing CHAPTER 7 Master Data Services CHAPTER 8 Complex Event Processing with Stream. Insight CHAPTER 9 Reporting Services Enhancements CHAPTER 10 Self-Service Analysis with Power. Pivot