Potaov cvien z pedmtu Datov sklady Nadpis 1

  • Slides: 11
Download presentation
Počítačová cvičení z předmětu Datové sklady Nadpis 1 #6 OLAPNadpis analýza 2 samostatný projekt

Počítačová cvičení z předmětu Datové sklady Nadpis 1 #6 OLAPNadpis analýza 2 samostatný projekt Nadpis 3 Jméno Vladimír Příjmení Bartík Jan Kupčík Vysoké učení technické v Brně, Fakulta informačních technologií v Brně Božetěchova 2, 612 66 Brno Petr Leixner jmeno@fit. vutbr. cz Vysoké učení technické v Brně, Fakulta informačních technologií Božetěchova 2, 612 66 Brno 99. 2008

Úkol: • Proveďte analýzu fiktivní firmy zabývající se prodejem jízdních kol, komponent a příslušenství

Úkol: • Proveďte analýzu fiktivní firmy zabývající se prodejem jízdních kol, komponent a příslušenství • Pro analýzu použijte OLAP nástroje v prostředí MS SQL Severu 2005 a MS Excel • K dispozici máte připravenou databázi Adventure. Works. DW Počítačová cvičení z předmětu Datové sklady pro FP 2

Výběr dílčích úkolů: • Před cvičením • • • Na cvičení • • •

Výběr dílčích úkolů: • Před cvičením • • • Na cvičení • • • Prostudujte databázové schéma a popis vstupní databáze zobrazené na obrázku „adventure_works_dw_schema. gif“ Navrhněte analytickou úlohu, která by byla řešitelná s využitím této databáze. Definici úlohy (v duchu níže uvedených ukázek, ale nesmí být totožná s ukázkou) přineste s sebou na cvičení. Na základě poznání konkrétního obsahu tabulek vstupních dat na cvičení bude možné úlohu mírně modifikovat. Vytvořte datový sklad pro řešení vámi navržené úlohy. Ukázky možných úloh pro inspiraci: 1. Porovnejte prodeje jednotlivých druhů jízdních kol v USA za roky 2002 a 2004. V případě rozdílu zkuste vyslovit hypotézu proč tomu tak je. 2. Nalezněte top 3 produkty v oblasti prodeje oblečení v Evropě pro rok 2004. 3. Zjistěte zda se na prodeji kol v roce 2002 ve Spojených státech podepsal sezónní vliv (stačí na úrovni kvartálů). Zjistěte, zda jde na trzích v Austrálii sledovat stejný model chování zákazníků. Diskutujte proč tomu tak je. Ověřte si svoji hypotézu čísly z předchozích a následujících kvartálů. Počítačová cvičení z předmětu Datové sklady pro FP 3

Doporučený postup • Vycházejte z materiálů k cvičením týkajících se OLAP analýzy a datových

Doporučený postup • Vycházejte z materiálů k cvičením týkajících se OLAP analýzy a datových skladů • Spusťte SQL Server Management Studio • Prohlédněte si schéma databáze • Vyberte, které tabulky vám budou sloužit jako tabulky faktů a které budou tvořit dimenze • Spusťte SQL Server BI Development Studio Počítačová cvičení z předmětu Datové sklady pro FP 4

Doručený postup… • Vytvořte svůj nový projekt s názvem „vaslogin_Adventure. Works“ • Jako zdroj

Doručený postup… • Vytvořte svůj nový projekt s názvem „vaslogin_Adventure. Works“ • Jako zdroj dat použijte databázi Adventure. Works. DW uloženou na serveru WINSQL • V definici Pohledu na data vyberte vybranou tabulku faktů a k ní vztažené tabulky dimenzí * • Vytvořte datovou kostku • Vyberte, které tabulky budou dimenze a které fakta • Zvolte která tabulka bude tvořit časovou osu • Vyberte metriky pro tabulku faktů • Zrevidujte hierarchie dimenzí – mnohdy jsou v hierarchii vloženy klíče místo názvů (např. dejte category english name místo čísla kategorie) • Proveďte deploy datového skladu • Proveďte OLAP analýzu své úlohy * Pozn. : Za řešení tohoto bodu není považován výběr všech tabulek databáze a jejich následné nahrání do datového skladu. Počítačová cvičení z předmětu Datové sklady pro FP 5

Výsledek • Do sešitu MS Excel nebo dokumentu MS Word vložte: • zadání své

Výsledek • Do sešitu MS Excel nebo dokumentu MS Word vložte: • zadání své úlohy, • výstup OLAP analýzy ve formě vhodného grafu, ze kterého lze vyčíst požadovanou odpověď, • dostatečný textový komentář, který popisuje zjištěné informace. • Soubor pojmenujte Vaším jménem • Soubor zabalte do archivu zip a odešlete na mail cvičícího, který kontroloval Vaše řešení

Stručný popis tabulek a důležitých atributů • Tabulky faktů • Fact. Internet. Sales: Prodeje

Stručný popis tabulek a důležitých atributů • Tabulky faktů • Fact. Internet. Sales: Prodeje přes internet • Cizí klíče do 8 dimenzí (produkt, čas objednávky, čas odeslání, čas dodání, zákazník, slevová akce, měna, místo prodeje) • Order. Quantity – počet ks; Unit. Price – cena 1 ks; Unit. Price. Discount. Pct % slevy; Sales. Amount – celková částka, … • Fact. Reseller. Sales: Prodeje u různých prodejců • 9 cizích klíčů: oproti předchozí chybí zákazník, navíce je prodejce a zaměstnanec • Ostatní důležité atributy stejně pojmenované • Fact. Sales. Quota: Omezení (kvóty) prodejů za různá období (asi ne příliš důležité) • Fact. Currency: Tabulka týkající se kurzů (Average. Rate) mezi měnami (Currency. Key) v různých obdobích (Time. Key) • Fact. Finance: Přiřazení částky (Amount) k oddělení (department), času a účtu (account)… Počítačová cvičení z předmětu Datové sklady pro FP 7

Stručný popis tabulek a důležitých atributů • Dimenze • Dim. Product – produktová dimenze

Stručný popis tabulek a důležitých atributů • Dimenze • Dim. Product – produktová dimenze • odkaz na dimenzi subkategorií produktů, váhová a množstevní jednotka, angl. , franc. a špan. název, barva a další údaje popisující daný produkt • Dim. Product. Subcategory - dimenze subkategorií produktů • odkaz na dimenzi kategorie produktů, dále obsahuje názvy subkategorie v různých jazycích • Dim. Product. Category - dimenze kategorií produktů • názvy kategorie v různých jazycích • Dim. Time – časová dimenze • datum, den, název dne v různých jazycích, číslo měsíce a jeho název v různých jazycích atd… • Dim. Currency – dimenze měny • název a kód měny • Dim. Geography – geografická dimenze • město, provincie, kód a názvy států ve 3 jazycích, PSČ Počítačová cvičení z předmětu Datové sklady pro FP 8

Stručný popis tabulek a důležitých atributů • Dimenze • Dim. Employee – dimenze zaměstnanců

Stručný popis tabulek a důležitých atributů • Dimenze • Dim. Employee – dimenze zaměstnanců • odkaz na dimenzi míst (oblastí), dále běžné údaje, jako např. jméno, datum narození, titul, telefon, počet dní dovolené atd. • Dim. Sales. Territory – dimenze míst (oblastí) • region, stát, světadíl • Dim. Promotion – dimenze reklamních (slevových) akcí • název akce (EN, FR, ES), výše slevy v %, popis akce, typ akce, datum začátku a konce, … • Dim. Customer – dimenze zákazníků • odkaz na geografickou dimenzi, dále jméno, datum nar. , e-mail, roční příjem, počet dětí, vzdělání, zaměstnání, adresa, telefon … • Dim. Sales. Reason – dimenze důvodů prodeje (TV reklama, reklamní akce, doporučení…) • název a typ důvodu prodeje Počítačová cvičení z předmětu Datové sklady pro FP 9

Stručný popis tabulek a důležitých atributů • Dimenze • Dim. Reseller – dimenze prodejce

Stručný popis tabulek a důležitých atributů • Dimenze • Dim. Reseller – dimenze prodejce • odkaz do geografické dimenze, telefon, jméno, typ, počet zaměstnanců, od kdy, do kdy prodával, adresa, atd… • Dim. Account – dimenze účtů pro finanční tabulku faktů • typ účtu, jeho popis, měrná jednotka… • Dim. Scenario – dimenze „scénářů“ • název scénáře (3 možné hodnoty – Actual/Budget/Forecast) • Dim. Department. Group – dimenze oddělení • název a kód oddělení společnosti Počítačová cvičení z předmětu Datové sklady pro FP 10

Hodně štěstí při plnění úkolů… Počítačová cvičení z předmětu Datové sklady pro FP 11

Hodně štěstí při plnění úkolů… Počítačová cvičení z předmětu Datové sklady pro FP 11