Multidimenzionlis Adatbzisok Alapjai Nyrcsk Zoltn F 4 CSMV
Multidimenzionális Adatbázisok Alapjai Nyírcsák Zoltán – F 4 CSMV alien@sch. bme. hu www. sch. bme. hu/~alien/olap
Mi a multidimenzionális adatbázis ? • A multidimenzionális adatbázis egy számítógépes szoftverrendszer, mely lehetővé teszi nagy mennyiségű adat hatékony és egyszerű tárolását. • az adatok egymással valamilyen módon összefüggenek • különböző nézetek – perspektívák, dimenziók - alapján tároljuk és vizsgáljuk őket
Az információ felhasználása A kapott információkból a menedzserek: • Stratégiákat állítanak fel • Trendeket ismernek fel • Üzleti döntéseket hoznak
Az alapvető cél • Vezetők által feltett kérdések, amik az üzleti életre vonatkoznak • Adatainkat különféle perspektívákból szemléljük • Nagy mennyiségű adatot érint • Gyors válaszidő szükséges • Átlátható formátumú eredményt akarunk
Relációs Adatbázis (miért nem jó ? ) • • • Komplex lekérdezések Több táblás join-ok Indexelések Lassú válaszidő Nehezen átlátható eredmény
Egy relációs tábla ELADOTT MENNYISÉG – GLEASON KERESKEDÉS MODELL SZÍN ELADOTT MENNYISÉG MIKROBUSZ SPORT KUPÉ SEDAN KÉK PIROS FEHÉR 6 5 4 3 5 5 4 3 2
“Cross-Tab” nézetek - Tömbök ELADOTT MENNYISÉG – GLEASON KERESKEDÉS KÉK 6 5 4 MIKROBUSZ 3 5 5 KUPÉ 4 3 2 SEDAN PIROS M O D EL L FEHÉR SZÍN • 2 dimenzió (perspektíva) : szín, modell – 3 -3 elemmel • Egyszerűbb kinézet • Több információ nyerhető belőle ránézésre
Egy nagyobb tábla Nézzük az előbbi táblát, kiegészítve még egy dimenzióval! • • Dimenzió : KERESKEDÉS 3 db értékkel Táblaméret : 3 x 3 x 3 = 27 Probléma : áttekinthetetlen
Megjelenítés többdimenzióban ELADOTT MENNYISÉG – GLEASON KERESKEDÉS M O D EL L MIKROBUSZ 6 5 4 KUPÉ 3 5 5 SEDAN 4 3 2 CLYDE KÉK PIROS SZÍN FEHÉR GLEASON CARR KERESKEDÉS
Teljesítménybeli előnyök • Relációs esetben az egy rekord kikeresésének átlagos költsége 1000 rekord esetén : 500 • Multidimenzionális esetben 3 dimenziót feltételezve ez 5+5+5=15 • Költségcsökkenés 3300 %-os
Mikor használjuk, mikor ne ? IGEN • Az mezők értéke ismétlődést mutat • Eredendően összefüggő adatok, amikből fontos üzleti információt nyerhetünk • • NEM Különféle, nem ismétlődő értékek Tipikus relációs táblák, korrelálatlan adatok, kevés (rejtett) összefüggés
Műveletek multidimenzionális adathalmazon • Forgatás – új nézet egyszerű műveletel • Szűkítés (átméretezés) – a fontos elemekre fókuszálunk (redukált tömb) • Multidimenzionális lekérdezések • Hierarchikus felépítésnél – roll-up, drilldown
Szervezeti hierarchia SZERVEZETI DIMENZIÓ MIDWEST RÉGIÓ KERÜLET KERESKEDÉS CHICAGO CLYDE ST. LOUIS GLEASON CARR GARY LEVI
Multidimenzionális lekérdezések • • Egyszerűbb nyelvezet Átlátható eredmény Gyors válaszidő MDX (Multi. Dimensional e. Xpression)
Architektúra • Kliens-szerver • Multi user • OLTP és OLAP rendszerek külön Miért ? – OLTP – egyenletes terhelés, folyamatos, kis intenzitású query-k – OLAP – ritka, nagy intenzitású kérések, nagy adatmennyiséget érint – Szétválasztás nélkül a tranzakciós rendszer teljesítménye romlik
További jellemzők • Idő dimenzió – legtöbb rendszerben beépített támogatás van rá • Ritka adatok (sparse data) kezelése • Hierarchikus dimenziók • Partíciók • Kockák, virtuális kockák • Aggregátumok
Kereskedelmi szoftverek • TM 1 • Oracle Express • MS OLAP Services (Analysis Services)
- Slides: 17