Az RDA a nyers adatokat relcis formtumv alaktja

  • Slides: 29
Download presentation
Az RDA a nyers adatokat relációs formátumúvá alakítja felkutatja és feloldja az adatelem meghatározásokban

Az RDA a nyers adatokat relációs formátumúvá alakítja felkutatja és feloldja az adatelem meghatározásokban az esetleges pontatlanságot/bizonytalanságot Az adatösszefüggések megértésére szolgál normalizálja a relációkat a tárolási (aktualizálási) anomáliák elkerülése érdekében ellenőrzi a választott LDM helyességét Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 1

MIÉRT? Adatorientált, nem folyamatorientált Különválasztja a fizikai és a logikai megfontolásokat Szabályok - könnyen

MIÉRT? Adatorientált, nem folyamatorientált Különválasztja a fizikai és a logikai megfontolásokat Szabályok - könnyen alkalmazható - halmaza Matematikai alapokon nyugszik Valóságból indul ki, az alábbiakat felhasználva: létező kimenetek tervezett kimenetek bemenő dokumentációk képernyőképek B/K adatleírások Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 2

MIT EREDMÉNYEZ? Adatelemek közti összefüggések (belső adatfüggések) feltárását Kétértelműségek (félreérthetőségek) feloldását Az adatok optimális

MIT EREDMÉNYEZ? Adatelemek közti összefüggések (belső adatfüggések) feltárását Kétértelműségek (félreérthetőségek) feloldását Az adatok optimális csoportokba szervezését Segíti a többször és többek által felhasznált adatok felismerését Az adatok pontosan meghatározottak Az adatok karbantartása könnyebb lesz Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 3

A RELÁCIÓ TULAJDONSÁGAI Vevő száma 2234 9999 1417 8053 1421 6219 NÉV Kedv. KÓD

A RELÁCIÓ TULAJDONSÁGAI Vevő száma 2234 9999 1417 8053 1421 6219 NÉV Kedv. KÓD Smith Ivanov Rubashov Glenkin Learmonth Burchett A A A B C C Státusz 3 3 3 2 3 4 nincs két azonos sor a sorok sorrendjének nincs jelentőssége az oszlopoknak egyedi nevei vannak az oszlopok sorrendjének nincs jelentőssége Dr. habil. Molnár Bálint egyetemi docens 4

KULCS TÍPUSOK Egyszerű kulcs (vevő száma) Vevő száma 2234 9999 1417 8053 1421 6219

KULCS TÍPUSOK Egyszerű kulcs (vevő száma) Vevő száma 2234 9999 1417 8053 1421 6219 Név Smith Ivanov Rubashov Glenkin Learmonth Burchett Kedv. kód A A A B C C Összetett (konkatenált) kulcs (Termékszám + rend. szám Termék szám 10 11 12 13 13 15 10 Rendelés szám 100 100 106 107 109 111 Státusz 3 3 3 2 3 4 ) Mennyiség 25 10 46 133 5 66 10 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens Státusz 250 80 960 266 10 34 100 5

KULCS TÍPUSOK Hierachikus kulcs SZÁMLASZÁM. 928321 VEVő NEVE CÍME Termék Szám Leírás Dye Wash

KULCS TÍPUSOK Hierachikus kulcs SZÁMLASZÁM. 928321 VEVő NEVE CÍME Termék Szám Leírás Dye Wash Benzole Beet Red Liquid Yara Oil Citrus Marine Peat Emulsifier Dye Wash Benzole 42161 63214 17719 19214 32010 42161 DÁTUM 80/08/14 3621417 J M Jarman & Co. Ltd. 22 Newbolt Street Moss Side Manchester M 31 1 TD AlapÁr Kedv. Ár 93. 50 10. 60 14. 30 110. 00 46. 00 93. 50 90. 00 8. 00 12. 00 100. 00 40. 00 90. 00 Menny. 10 20 30 10 20 20 Számla végösszeg Ár 900. 00 160. 00 360. 00 1000. 00 800. 00 1800. 00 5020. 00 A számla minden sorához a kulcs : { Számlaszám Termékszám előfordulhat , hogy nem lesz egyedi Ezért generálunk egy mesterséges megoldást : Jó lesz ez? - Nem ! Számlaszám Számlasor száma Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 6

KULCS TÍPUSOK Külső kulcs 3 NF relációk Vevő száma Név Cím Kedvezmény kód Státusz

KULCS TÍPUSOK Külső kulcs 3 NF relációk Vevő száma Név Cím Kedvezmény kód Státusz *Raktárszám Elhelyezkedési kód Név Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 7

A RELÁCIÓS MEGKÖZELÍTÉS TULAJDONSÁGAINAK ÖSSZEFOGLALÁSA adatok egy táblázata nincs két azonos sor a sorok

A RELÁCIÓS MEGKÖZELÍTÉS TULAJDONSÁGAINAK ÖSSZEFOGLALÁSA adatok egy táblázata nincs két azonos sor a sorok sorrendjének nincs jelentőssége az oszlopok sorrendjének nincs jelentőssége Az oszlopoknak egyedi nevük van a relációknak kell, hogy legyen egy kulcsa egyszerű összetett hierarchikus = egymezős kulcs = több egyszerű kulcsmező = egyszerű kulcs + nem egyedi elem(ek) Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 8

A NORMALIZÁLÁS ALAPJAI Az öt normalizációs lépés Hozzunk létre egy nem-normalizált relációt (0 NF)

A NORMALIZÁLÁS ALAPJAI Az öt normalizációs lépés Hozzunk létre egy nem-normalizált relációt (0 NF) Hozzuk első normálalakra (1 NF) Hozzuk második normálalakra (2 NF). Hozzuk harmadik normálalakra (3 NF). Racionalizálás Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 9

1. lépés Nem normalizált alak (0 NF) létrehozása Irányelvek a kulcs kiválasztásához: egyedi értékű

1. lépés Nem normalizált alak (0 NF) létrehozása Irányelvek a kulcs kiválasztásához: egyedi értékű az összes sorra vonatkozva nem ismétlődik egyetlen soron belül a lehető legkevesebb attribútumból áll ne legyen szöveges kulcs, ha lehetséges Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 10

1. lépés Nem normalizált alak (0 NF) létrehozása ELőTTE TERMÉKSZÁM: 20541 LEÍRÁS: Zippo Washing

1. lépés Nem normalizált alak (0 NF) létrehozása ELőTTE TERMÉKSZÁM: 20541 LEÍRÁS: Zippo Washing Powder RENDELÉS DÁTUM RENDELÉSI SZÁM S 87429 S 87437 S 87439 S 87452 S 87457 S 87461 S 87475 87/03/02 87/03/04 87/03/06 UTÁNA ADATELEMEK TERMÉKSZÁM Első normál alak VEVő SZÁM. NÉV 62098 76502 77566 62098 22322 88722 62099 T Leaf MT Bins Coopers T Leaf D Head ABC Ltd C Lyon Második normál alak Menny. 4 34 5 6 10 7 4 Harmadik normál alak ÁR 26. 60 63. 40 28. 30 30. 00 33. 99 31. 50 26. 60 Racionalizált Leírás Rendelési szám Rendelési dátum Vevő száma Név Mennyiség Ár Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 11

2. LÉPÉS Első normálalakra (1 NF) hozás Különítsük el az ismétlődő csoportokat Adatelemek olyan

2. LÉPÉS Első normálalakra (1 NF) hozás Különítsük el az ismétlődő csoportokat Adatelemek olyan csoportja, vagy olyan adatelem, amelynek a kulcs egyetlen értéke esetén több értéke lehet. ELőTTE UTÁNA Adatelemek Termékszám Leírás Rendelés szám Rendelés dátum Vevő száma Név Mennyiség Ár Első normálforma Második normálforma Termékszám Leírás Termékszám Rendelési szám Rendelés dátuma Vevő száma Név Mennyiség Ár Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 12

3. LÉPÉS Második normálalakra (2 NF) hozás Különítsük el a kulcs részeitől való függőségeket!

3. LÉPÉS Második normálalakra (2 NF) hozás Különítsük el a kulcs részeitől való függőségeket! (külön relációkba) Minden mező a teljes kulcshoz kapcsolódik vagy annak egy részéhez? ELőTTE Adatelemek Termékszám Leírás Rendelési szám Rendelés dátum Vevő száma Név Mennyiség Ár Első normálalak UTÁNA Második normálalak Termékszám Leírás Termékszám Rendelési szám Rendelés dátum Vevő száma Név Mennyiség Ár Termékszám Rendelési szám Mennyiség Ár Rendelési szám Rendelés dátum Vevő száma Név Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 13

4. LÉPÉS Harmadik normálformára (3 NF) hozás Határozzuk meg a belső adatfüggőségeket Az 'A'

4. LÉPÉS Harmadik normálformára (3 NF) hozás Határozzuk meg a belső adatfüggőségeket Az 'A' attribútum függ-e a 'B'-től és fordítva ? Első normálforma Termékszám Leírás Termékszám Rend. dátum Vevő száma Név Mennyiség Ár ELőTTE UTÁNA Második normálforma Harmadik normálforma Racionalizál t Termékszám Leírás Termékszám Rend. szám Mennyiség Ár Rend. szám Rendelés dátuma Vevő száma Név Rend. szám Rendelés dátuma Vevő száma * Vevő száma Név Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 14

AZ ELSő NÉGY LÉPÉS ÖSSZEFOGLALÁSA Soroljuk fel az adatokat és válasszuk ki a kulcs(oka)t

AZ ELSő NÉGY LÉPÉS ÖSSZEFOGLALÁSA Soroljuk fel az adatokat és válasszuk ki a kulcs(oka)t Nem normalizált alak (0 NF) létrehozása Első normálalakra hozás Különítsük el az ismétlődő csoportokat! Második normálformára (2 NF) hozás. Határozzuk meg a kulcs részétől való függőségeket Harmadik normálalakra (3 NF) hozás Határozzuk meg a belő adatfüggőségeket Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 15

5. LÉPÉS Racionalizálás Vonjuk össze az azonos kulcsokkal rendelkező relációkat! Vevő száma Cím Zóna

5. LÉPÉS Racionalizálás Vonjuk össze az azonos kulcsokkal rendelkező relációkat! Vevő száma Cím Zóna Kedvezmény kód Hitelhatár Vevő száma Név Cím Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 16

A RELÁCIÓS MEGKÖZELÍTÉS TULAJDONSÁGAINAK ÖSSZEFOGLALÁSA Az adatok egy táblázata Nincs két azonos sor A

A RELÁCIÓS MEGKÖZELÍTÉS TULAJDONSÁGAINAK ÖSSZEFOGLALÁSA Az adatok egy táblázata Nincs két azonos sor A sorok sorrendjének nincs jelentőssége Az oszlopoknak egyedi nevük van a relációknak kell, hogy legyen egy kulcsa egyszerű összetett hierarchikus = egymezős kulcs = több egyszerű kulcsmező = egyszerű kulcs + nem egyedi elem(ek) Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 17

A FEJEZET CÉLJA RDA a gyakorlatban A relációs adatelemzés alkalmazásához kapcsolódó gyakorlati kérdések megvizsgálása:

A FEJEZET CÉLJA RDA a gyakorlatban A relációs adatelemzés alkalmazásához kapcsolódó gyakorlati kérdések megvizsgálása: Az ismétlődő csoportok felismerése adatfüggőségi ábra redundancia az elsődleges kulcsok esetén a racionalizálás veszélyei tárolási anomáliák Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 18

ISMÉTLőDő CSOPORTOK FELISMERÉSE Az eladások értékének területi megoszlása 14/1. oldal Dátum: 84. 12. 31.

ISMÉTLőDő CSOPORTOK FELISMERÉSE Az eladások értékének területi megoszlása 14/1. oldal Dátum: 84. 12. 31. Eladások értéke Ügynök HTCS Társaság TT divizió É régió ÉNy terület Eladók Régió Háztartási termék csoport Tisztítási termékek déli Felosztás 241000 Északi ÉK terület Eladók D régió DNy terület Eladók Terület Jones Higgins Green 10000 15000 12000 Black Brown Smith 14000 17000 12000 Hayes Albion Morris 11000 12000 18000 3700 0 Társaság 2000000 0 8000 0 4300 0 161000 41000 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 19

ISMÉTLőDő CSOPORTOK FELISMERÉSE Első normálalak Adatelemek Társ. kódja Társ. neve Dátum Társ. összes eladása

ISMÉTLőDő CSOPORTOK FELISMERÉSE Első normálalak Adatelemek Társ. kódja Társ. neve Dátum Társ. összes eladása Divízió kód Divízió eladások Régió kód Régió eladások Terül. kód Terül. eladások Eladó neve Eladói eladások Társ. kódja Dátum Társ. kódja Társ. neve Társ. összes eladása Dátum Divizi kód Társ. kódja Régió kód Dátum Terület kód Divízió kód Területi eladások Divízió név Divízió eladók Társ. kódja Dátum Divízió kód Régió eladások Második normálalak stb. . . Dátum Divízió kód Régió kód Terület kód Eladó neve Eladói eladások KÜLÖNÍTSÜNK EL MINDEN ISMÉTLőDő CSOPORTOT ITT Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 20

SOK RELÁCIÓ A termék osztályok eladása divízió/régió szerint Eladási divízió : Északi Term. csoport

SOK RELÁCIÓ A termék osztályok eladása divízió/régió szerint Eladási divízió : Északi Term. csoport A B C Termék osztály 1 2 3 4 Term. cs. összeg 1 2 3 4 term cs. összeg Dátum: 82. 09. 03. A 2(1) 2(3) 3 B 1 4 7 6 18 2 C 7 12(5) 11 D 6 1 - 9 3 7 RÉGIÓ - 7 1 3 1 5 7 19 7 7 12 E 2 2 4 F 1 4 7 12 6 10 1 1 3 - 5 17 12 DIV. G 1 5 H 6 5 7 4 4 10 1 1 3 7 9 6 2 17 29 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens Eddig 5(2) 19 15 13 52(4) 17 3 15 5 40 17 14 3 2 36 128(6) 21

SOK RELÁCIÓ Adatelemek Első normálalak Dátum Divízió Régió Termék csoport Termék osztály Összes eladások-1

SOK RELÁCIÓ Adatelemek Első normálalak Dátum Divízió Régió Termék csoport Termék osztály Összes eladások-1 Második normálalak Dátum Divízió Termék csoport Termék osztály Összes eladások-2 Dátum Divízió Régió Termék csoport Összes eladások - 4 Összes eladások - 3 Dátum Divízió Régió Összes eladások - 5 Dátum Divízió Összes eladások -6 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 22

ADATFÜGGőSÉGI ÁBRA Segíti az adatfüggőségek feltárását az összetett, belső kapcsolatok esetén, attribútum szinten, a

ADATFÜGGőSÉGI ÁBRA Segíti az adatfüggőségek feltárását az összetett, belső kapcsolatok esetén, attribútum szinten, a 2 NF-t megelőzően. A A C A D B C Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 23

ELSőDLEGES KULCS REDUNDANCIA 1 NF 2 NF-é alakítása Távolítsuk el a szükségtelen attribútumokat az

ELSőDLEGES KULCS REDUNDANCIA 1 NF 2 NF-é alakítása Távolítsuk el a szükségtelen attribútumokat az elsődleges kulcsból Eladási ter. száma Eladó-kód Eladó neve Megcélzott eladások Aktuális eladások stb. 1 NF-ből 2 NF Eladási ter. száma Eladó-kód Eladó neve Megcélzott eladások Aktuális eladások stb. Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 24

A RACIONALIZÁLÁS VESZÉLYEI Repülőgép típus: DC 8 Leírás: 4 motoros N/B sugárhajtású Munkaszám Munkakezdés

A RACIONALIZÁLÁS VESZÉLYEI Repülőgép típus: DC 8 Leírás: 4 motoros N/B sugárhajtású Munkaszám Munkakezdés dátuma 4143241 1219416 3147214 9763112 1112151 Munka típus 85/03/27 85/04/23 85/05/27 85/08/07 85/04/08 A X D B C * tegyük fel, hogy a munkaszám egyedi Adateleme k Repülőgép típus Leírás Munkaszám Munkakezdet dát. Munka típusa Első normálalak Második normálalak Harmadik normálalak Repülőgép típus Leírás Repülőgép típus Munkaszám Munkakezd. dátum Munka típusa Repülőgép típus Munkaszám Repülőgép típus Munka kezd. dátuma munkatípus Munkaszám Munka kezd. dátuma Munka típusa Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 25

A RACIONALIZÁLÁS VESZÉLYEI Repülőgép nyilvántartási száma: XJP-A Repülőgép típus: DC 8 Típus leírás. :

A RACIONALIZÁLÁS VESZÉLYEI Repülőgép nyilvántartási száma: XJP-A Repülőgép típus: DC 8 Típus leírás. : 4 motoros. N/B sugárhajtású Munkakezdés dátuma: 85/03/27 munkaszám munka típus Leírás 4143241 6142146 7142167 A B A Adatelemek Első normálalak Rep. Nyilv. Szám Repülőgép típus Típus leírás Munkakezdet dátuma Munkaszám Munka típus Leírás Rep. Nyilv. Szám Repülőgép típus Típus leírás Rep. Nyilv. Szám Munkakezdet dátuma Munkaszám Munka típus Leírás Renew New Com. Unit Test APU Test Contact X 241 Második normálalak Rep. Nyilv. Szám Munkakezdet dátuma Munkaszám Munka típus Leírás Harmadik normálalak Rep. Nyilv. Szám *Repülőgép típus Típus leírás Munkaszám Munkakezdet dátuma *Rep. Nyilv. Szám Munka típus Leírás Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 26

A RACIONALIZÁLÁS VESZÉLYEI 3 NF Munkaszám Munkakezdés Dátum *Rep Nyilv. szám Munkatípus Munka leírás

A RACIONALIZÁLÁS VESZÉLYEI 3 NF Munkaszám Munkakezdés Dátum *Rep Nyilv. szám Munkatípus Munka leírás Munkaszám *Rep. típus Munkakezdés dátum Munkatípus *Rep. nyilv. száma Munka leírás Munkaszám Munkakezdés dátum *Rep. nyilv. szám Munkatípus Munka leírás Rep. Nyilv. szám *Rep. típus Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 27

TÁROLÁSI ANOMÁLIÁK Ha 1 NF kerül implementálásra: beszúrás törlés függő módosítások Első normálalak Termékszám

TÁROLÁSI ANOMÁLIÁK Ha 1 NF kerül implementálásra: beszúrás törlés függő módosítások Első normálalak Termékszám Leírás Termékszám Rendelés sz. Rend. dátum Vevő száma Név Mennyiség Ár Második normálalak Termékszám Leírás Harmadik normálalak Termékszám Leírás Termékszám Rendelés sz. Mennyiség Ár Rendelés sz. Rend. dátum Vevő száma Név Racionalizál t 1 Rendelés sz. Rend. dátum *Vevő száma 2 3 4 Vevő száma Név Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 28

ÖSSZEFOGLALÁS A 3 NF nem tartalmazhat fizikai tervezési döntéseket Információrendszer fejlesztés módszertana, Dr. Molnár

ÖSSZEFOGLALÁS A 3 NF nem tartalmazhat fizikai tervezési döntéseket Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens 29