Potaov cvien z pedmtu Datov sklady Nadpis 1

  • Slides: 7
Download presentation
Počítačová cvičení z předmětu Datové sklady Nadpis 1 #8 Data Mining Nadpis 2 samostatný

Počítačová cvičení z předmětu Datové sklady Nadpis 1 #8 Data Mining Nadpis 2 samostatný projekt Nadpis 3 Jméno Vladimír Příjmení Bartík Jan Kupčík Vysoké učení technické v Brně, Fakulta informačních technologií v Brně Božetěchova 2, 612 66 Brno Petr Leixner jmeno@fit. vutbr. cz Vysoké učení technické v Brně, Fakulta informačních technologií Božetěchova 2, 612 66 Brno 99. 2008

Úkol: • Proveďte analýzu volně dostupné databáze hub s využitím data miningu • Pro

Úkol: • Proveďte analýzu volně dostupné databáze hub s využitím data miningu • Pro řešení úlohy využijte nástroj SAS Enterprise Miner • K dispozici máte vzorek databáze Agaricus-Lepiota obsahující informace o houbách, včetně popisu atributů (viz. dále) Počítačová cvičení z předmětu Datové sklady pro FP 2

Výběr dílčích úkolů: • Stáhněte databázi zde: http: //www. fit. vutbr. cz/~bartik/agaricus-lepiota. xls •

Výběr dílčích úkolů: • Stáhněte databázi zde: http: //www. fit. vutbr. cz/~bartik/agaricus-lepiota. xls • Prostudujte schéma vstupní databáze hub, seznamte se s významem jednotlivých atributů • Importujte vstupní databázi do prostředí SAS • V prostředí SAS Enterprise Mineru vytvořte úlohu, která bude klasifikovat data o houbách do dvou tříd (jedlá/jedovatá) • Jako klasifikační metodu využijte rozhodovací strom • Zobrazte vytvořený rozhodovací strom a vyhodnoťte úspěšnost klasifikační úlohy • Pro řešení je možné vycházet z materiálů k předchozímu cvičení Počítačová cvičení z předmětu Datové sklady pro FP 3

Význam atributů + hodnoty • jedla (jedlost houby): e=jedlá, p=jedovatá • cap-shape (tvar klobouku):

Význam atributů + hodnoty • jedla (jedlost houby): e=jedlá, p=jedovatá • cap-shape (tvar klobouku): bell=b, conical=c, convex=x, flat=f, knobbed=k, sunken=s • cap-surface (povrch klobouku): fibrous=f, grooves=g, scaly=y, smooth=s • cap-color (barva klobouku): brown=n, buff=b, cinnamon=c, gray=g, green=r, pink=p, purple=u, red=e, white=w, yellow=y • bruises (otlačeniny): bruises=t, no=f • odor (vůně): almond=a, anise=l, creosote=c, fishy=y, foul=f, musty=m, none=n, pungent=p, spicy=s • gill-attachment (připojení lupenů): attached=a, descending=d, free=f, notched=n • gill-spacing (mezery mezi lupeny): close=c, crowded=w, distant=d • gill-size (velikost lupenů): broad=b, narrow=n Počítačová cvičení z předmětu Datové sklady pro FP 4

Význam atributů + hodnoty • gill-color (barva lupenů): black=k, brown=n, buff=b, chocolate=h, gray=g, green=r,

Význam atributů + hodnoty • gill-color (barva lupenů): black=k, brown=n, buff=b, chocolate=h, gray=g, green=r, orange=o, pink=p, purple=u, red=e, white=w, yellow=y • stalk-shape (tvar nohy): enlarging=e, tapering=t • stalk-root (kořen nohy): bulbous=b, club=c, cup=u, equal=e, rhizomorphs=z, rooted=r, missing=? • stalk-surface-above-ring (povrch nohy nad prstenem): ibrous=f, scaly=y, silky=k, smooth=s • stalk-surface-below-ring (povrch nohy pod prstenem): ibrous=f, scaly=y, silky=k, smooth=s • stalk-color-above-ring (barva nohy nad prstenem): brown=n, buff=b, cinnamon=c, gray=g, orange=o, pink=p, red=e, white=w, yellow=y • stalk-color-below-ring (barva nohy pod prstenem): brown=n, buff=b, cinnamon=c, gray=g, orange=o, pink=p, red=e, white=w, yellow=y • veil-type (typ závoje): partial=p, universal=u Počítačová cvičení z předmětu Datové sklady pro FP 5

Význam atributů + hodnoty • veil-color (barva závoje): brown=n, orange=o, white=w, yellow=y • ring-number

Význam atributů + hodnoty • veil-color (barva závoje): brown=n, orange=o, white=w, yellow=y • ring-number (počet prstenů): none=n, one=o, two=t • ring-type (typ prstenu): cobwebby=c, evanescent=e, flaring=f, large=l, none=n, pendant=p, sheathing=s, zone=z • spore-print-color (barva spor): black=k, brown=n, buff=b, chocolate=h, green=r, orange=o, purple=u, white=w, yellow=y • population (v jakých populacích se vyskytují): abundant=a, clustered=c, numerous=n, scattered=s, several=v, solitary=y • habitat (přirozené prostředí): grasses=g, leaves=l, meadows=m, paths=p, urban=u, waste=w, woods=d Počítačová cvičení z předmětu Datové sklady pro FP 6

Hodně štěstí při plnění úkolů… Počítačová cvičení z předmětu Datové sklady pro FP 7

Hodně štěstí při plnění úkolů… Počítačová cvičení z předmětu Datové sklady pro FP 7