Normalizao de Dados Profa Dra Marilde Santos Departamento

  • Slides: 47
Download presentation
Normalização de Dados Profa. Dra. Marilde Santos Departamento de Computação – UFSCar marilde@dc. ufscar.

Normalização de Dados Profa. Dra. Marilde Santos Departamento de Computação – UFSCar marilde@dc. ufscar. br Novembro de 2003 Profa. Marilde Santos

SGBD + Banco de Dados • Independência de dados • Consistência de dados Novembro

SGBD + Banco de Dados • Independência de dados • Consistência de dados Novembro de 2003 Profa. Marilde Santos 2

Consistência de Dados SGBD Regras de Integridade • Validade • Completeza • Consistência Novembro

Consistência de Dados SGBD Regras de Integridade • Validade • Completeza • Consistência Novembro de 2003 Profa. Marilde Santos 3

Consistência de Dados O controle de consistência pode ser exercido: • Pelo gerenciador; •

Consistência de Dados O controle de consistência pode ser exercido: • Pelo gerenciador; • Pelos aplicativos; • Pela própria construção do sistema. Novembro de 2003 Profa. Marilde Santos 4

Consistência de Dados Pela própria construção do sistema. • Controlar a construção do sistema

Consistência de Dados Pela própria construção do sistema. • Controlar a construção do sistema através da criação de tabelas segundo regras que garantam a manutenção de certas propriedades. • As tabelas que atendem a um determinado conjunto de regras, diz-se estarem em uma determinada forma normal. Novembro de 2003 Profa. Marilde Santos 5

Formas Normais Primeira Forma Normal Uma relação está na 1 a. forma normal quando

Formas Normais Primeira Forma Normal Uma relação está na 1 a. forma normal quando todos os seus atributos são atômicos e monovalorados. ? Nome Idade Data. Nasc Data. Matrícula São atômicos? Novembro de 2003 Profa. Marilde Santos 6

Formas Normais Primeira Forma Normal Uma relação está na 1 a. forma normal quando

Formas Normais Primeira Forma Normal Uma relação está na 1 a. forma normal quando todos os seus atributos são atômicos e monovalorados. Nome Idade Data. Nasc ! Data. Matrícula Data. Nasc e Data. Matrícula serão atributos atômicos se não forem utilizadas “partes” das São atômicos? datas em outras relações do Banco de Dados. Novembro de 2003 Profa. Marilde Santos 7

Formas Normais Primeira Forma Normal Atributos multivalorados 1) Quando a quantidade de valores é

Formas Normais Primeira Forma Normal Atributos multivalorados 1) Quando a quantidade de valores é pequena e conhecida a priori; Substitui-se o atributo multivalorado por um conjunto de atributos de mesmo domínio, cada um representando a ocorrência de um valor. Novembro de 2003 Profa. Marilde Santos 8

Formas Normais Primeira Forma Normal Atributos multivalorados. 2) Quando a quantidade de valores é

Formas Normais Primeira Forma Normal Atributos multivalorados. 2) Quando a quantidade de valores é muito grande, variável ou desconhecida. Retira-se da relação o atributo multivalorado, e cria- se uma nova relação que tem o mesmo conjunto de atributos chave, mais o atributo multivalorado como chave, porém tomado como monovalorado. Novembro de 2003 Profa. Marilde Santos 9

Formas Normais Primeira Forma Normal Atributos multivalorados Nome Idade Data. Nasc Telefone Quantos números

Formas Normais Primeira Forma Normal Atributos multivalorados Nome Idade Data. Nasc Telefone Quantos números de telefone? Novembro de 2003 Profa. Marilde Santos 10

Formas Normais Primeira Forma Normal Atributos multivalorados Nome Idade Data. Nasc Novembro de 2003

Formas Normais Primeira Forma Normal Atributos multivalorados Nome Idade Data. Nasc Novembro de 2003 Se forem 3 números fone 1 Profa. Marilde Santos Telefone 2 fone 3 11

Formas Normais Primeira Forma Normal Atributos multivalorados Se forem muitos números Nome Idade Data.

Formas Normais Primeira Forma Normal Atributos multivalorados Se forem muitos números Nome Idade Data. Nasc Novembro de 2003 Telefone Data. Nasc Nome Profa. Marilde Santos Telefone 12

Formas Normais Dependências Funcionais Se o valor de um conjunto de atributos A permite

Formas Normais Dependências Funcionais Se o valor de um conjunto de atributos A permite descobrir o valor de um outro conjunto B, dizemos que A determina funcionalmente B, ou que B depende de A, e denotamos: A B Novembro de 2003 Profa. Marilde Santos 13

Formas Normais Dependência Funcional Parcial Se A for chave da relação e o valor

Formas Normais Dependência Funcional Parcial Se A for chave da relação e o valor de um subconjunto de atributos de A permite descobrir o valor de um outro conjunto B, dizemos que B possui dependência funcional parcial em relação a A. Novembro de 2003 Profa. Marilde Santos 14

Formas Normais Atributo Primo Todo atributo que pertence a uma chave candidata é denominado

Formas Normais Atributo Primo Todo atributo que pertence a uma chave candidata é denominado primo. O que é mesmo chave candidata? Novembro de 2003 Profa. Marilde Santos 15

Formas Normais Segunda Forma Normal Uma relação está na 2 a. forma normal quando:

Formas Normais Segunda Forma Normal Uma relação está na 2 a. forma normal quando: Ø está na 1 a. F. N. e; Ø todos os seus atributos que não são primos, não dependem parcialmente de qualquer chave candidata da relação. Novembro de 2003 Profa. Marilde Santos 16

Formas Normais Segunda Forma Normal Número Sigla Sala Número Horas Número, Sigla Sala, Número-Horas

Formas Normais Segunda Forma Normal Número Sigla Sala Número Horas Número, Sigla Sala, Número-Horas Sigla Número-Horas Novembro de 2003 Profa. Marilde Santos 17

Formas Normais Segunda Forma Normal Número Sala Sigla Número Sigla Sala Novembro de 2003

Formas Normais Segunda Forma Normal Número Sala Sigla Número Sigla Sala Novembro de 2003 Profa. Marilde Santos Número Horas Sigla Número-Horas 18

Formas Normais Segunda Forma Normal Evita: • Inconsistências devido a duplicidade de informações •

Formas Normais Segunda Forma Normal Evita: • Inconsistências devido a duplicidade de informações • Perda de dados em operações de remoções / alteração na relação Novembro de 2003 Profa. Marilde Santos 19

Formas Normais Segunda Forma Normal Número Sigla Horário 1 2 DC 122 10: 00

Formas Normais Segunda Forma Normal Número Sigla Horário 1 2 DC 122 10: 00 2 DC 122 14: 00 2 1 DC 189 8: 00 3 2 DC 189 15: 00 4 1 DC 134 16: 00 2 Valores Inconsistentes Número-Horas Número, Sigla Sala, Número-Horas Sigla Número-Horas Novembro de 2003 Profa. Marilde Santos 20

Formas Normais Segunda Forma Normal Número Sigla Horário 1 2 DC 122 10: 00

Formas Normais Segunda Forma Normal Número Sigla Horário 1 2 DC 122 10: 00 2 DC 122 14: 00 2 1 DC 189 8: 00 3 2 DC 189 15: 00 4 1 Número-Horas 16: 00 2 Se. DC 134 não houver turmas de uma determinada disciplina em um semestre, perde-se a informação sobre o Número de Horas!!! Novembro de 2003 Profa. Marilde Santos 21

Formas Normais Terceira Forma Normal Uma relação está na 3 a. Forma normal quando:

Formas Normais Terceira Forma Normal Uma relação está na 3 a. Forma normal quando: Ø Está na 2 a. F. N. E; Ø Todos os seus atributos não primos são dependentes não transitivos de uma chave candidata. Mas o que é Dependência Funcional Transitiva? Novembro de 2003 Profa. Marilde Santos 22

Formas Normais Terceira Forma Normal Mas o que é Dependência Funcional Transitiva? Seja a

Formas Normais Terceira Forma Normal Mas o que é Dependência Funcional Transitiva? Seja a relação R(X, Y, A), A é transitivamente dependente de X, se existe Y tal que: X Y, Y não determina X Y A A XY Novembro de 2003 Profa. Marilde Santos 23

Formas Normais Terceira Forma Normal Número Sigla Sala Prédio Número, Sigla Sala, Prédio Sala

Formas Normais Terceira Forma Normal Número Sigla Sala Prédio Número, Sigla Sala, Prédio Sala Prédio Novembro de 2003 Profa. Marilde Santos 24

Formas Normais Terceira Forma Normal Número Sala Sigla Número, Sigla Sala Número Sigla Sala

Formas Normais Terceira Forma Normal Número Sala Sigla Número, Sigla Sala Número Sigla Sala Novembro de 2003 Profa. Marilde Santos Prédio Sala Prédio 25

Formas Normais Terceira Forma Normal Evita: • inconsistências devido a duplicidade de informações •

Formas Normais Terceira Forma Normal Evita: • inconsistências devido a duplicidade de informações • perda de dados em operações de remoções / alteração na relação Novembro de 2003 Profa. Marilde Santos 26

Formas Normais Terceira Forma Normal Número Sigla 1 2 DC 102 3 E 1

Formas Normais Terceira Forma Normal Número Sigla 1 2 DC 102 3 E 1 DC 102 4 E 1 1 DC 104 12 C 2 1 DC 155 4 C 2 2 DC 155 12 C 2 Sala Prédio Número, Sigla Sala, Prédio Sala Prédio Novembro de 2003 Valores Inconsistentes!!!!! Profa. Marilde Santos 27

Formas Normais Terceira Forma Normal Número Sigla 1 2 DC 102 3 E 1

Formas Normais Terceira Forma Normal Número Sigla 1 2 DC 102 3 E 1 DC 102 4 E 1 1 DC 104 12 C 2 1 DC 155 4 C 2 2 DC 155 12 C 2 Sala Prédio Número, Sigla Sala, Se não houver aula em. Prédio uma determinada sala nesse semestre perde-se a informação sobre qual prédio Sala Prédio contém a tal sala. Novembro de 2003 Profa. Marilde Santos 28

Formas Normais Terceira Forma Normal Uma relação está na 3 a. Forma normal quando:

Formas Normais Terceira Forma Normal Uma relação está na 3 a. Forma normal quando: Ø Está na 2 a. F. N. e; Ø Todos os seus atributos não primos são dependentes não transitivos de uma chave candidata. Em outras palavras, uma relação está na 3 FN se: Ø para toda dependência funcional X A de R, Ø X for superchave ou Ø A for atributo primo Novembro de 2003 Profa. Marilde Santos 29

Formas Normais Forma Normal de Boyce-Codd • Uma relação está na FNBC, se: •

Formas Normais Forma Normal de Boyce-Codd • Uma relação está na FNBC, se: • Para toda dependência funcional X A de R, • X for superchave Não adianta A ser primo!!! Novembro de 2003 Profa. Marilde Santos 30

Formas Normais Forma Normal de Boyce-Codd Apostila Id_Propried Disciplina Nome_Região Lote Área SO 1

Formas Normais Forma Normal de Boyce-Codd Apostila Id_Propried Disciplina Nome_Região Lote Área SO 1 Pr 1 BD 1 Pr 2 BD 1 SO Central BD L 23 l 500 L 14 500 Pr 3 ED 1 Sul ED L 2 1000 Pr 4 BD 2 Sul BD L 54 1000 Pr 5 Leste L 400 800 Pr 6 Norte L 43 l 1500 Pr 7 Central L 414 1500 Id_propried Nome_região, Lote, Área Nome_região, Lote Id_propried, Área Novembro de 2003 Área Nome_região Profa. Marilde Santos 31

Formas Normais Forma Normal de Boyce-Codd Disciplina Nome_Região Apostila Id_Propried Lote Área SO 1

Formas Normais Forma Normal de Boyce-Codd Disciplina Nome_Região Apostila Id_Propried Lote Área SO 1 Pr 1 BD 1 Pr 2 BD 1 SO Central BD L 23 l 500 L 14 500 Pr 3 ED 1 Sul ED L 2 1000 Pr 4 BD 2 Sul BD L 54 1000 Apostila Id_Propried Lote Disciplina SO 1 Pr 1 BD 1 Pr 2 BD 1 L 23 l SO BD L 14 BD Pr 3 ED 1 Novembro de 2003 Pr 4 BD 2 L 2 ED L 54 BD Área 500 1000 Profa. Marilde Santos 1000 Área Nome_Região 500 Central 1000 Sul 32

Formas Normais Dependências Funcionais Multivaloradas O conceito baseia-se no fato de que, embora não

Formas Normais Dependências Funcionais Multivaloradas O conceito baseia-se no fato de que, embora não seja possível um conjunto de valores determinar o valor de outro atributo, esse conjunto consegue restringir os valores possíveis para aquele atributo. Novembro de 2003 Profa. Marilde Santos 33

Formas Normais Dependências Funcionais Multivaloradas Se um conjunto de atributos A restringe os valores

Formas Normais Dependências Funcionais Multivaloradas Se um conjunto de atributos A restringe os valores possíveis para os atributos de um outro conjunto B, diz-se que A multidetermina funcionalmente B, ou que B é multi-dependendente de A, e denota-se: A B Novembro de 2003 Profa. Marilde Santos 34

Formas Normais Dependências Funcionais Multivaloradas Uma dependência multivalorada X Y especificada sobre a relação

Formas Normais Dependências Funcionais Multivaloradas Uma dependência multivalorada X Y especificada sobre a relação esquema R, onde X e Y são subconjuntos de R, especifica a seguinte restrição sobre qualquer r de R: se duas tuplas t 1 e t 2 existem em r tal que t 1[x] = t 2[x], então duas tuplas t 3 e t 4 deverão também existir em r com as seguintes propriedades, onde Z=(R-(X Z)): • T 3[X] = T 4[X] = T 1[X] = T 2[X] • T 3[Y] = T 1[Y] e T 4[Y] = T 2[Y] • T 3[Z] = T 2[Z] e T 4[Z] = T 1[Z] Novembro de 2003 Profa. Marilde Santos 35

Formas Normais Dependências Funcionais Multivaloradas Nome Matéria Orientando Alzira BD Paulo Alzira ES Sonia

Formas Normais Dependências Funcionais Multivaloradas Nome Matéria Orientando Alzira BD Paulo Alzira ES Sonia Alzira BD Sonia Alzira ES Paulo Alzira BD Pedro Alzira ES Pedro A Matéria Novembro de 2003 A Orientando Nome t 3[X] = t 4[X] = t 1[X] = t 2[X]; t 3[Y] = t 1[Y] e t 4[Y] = t 2[Y]; 36 Profa. Marilde Santos t 3[Z] = t 2[Z] e t 4[Z] = t 1[Z].

Formas Normais Quarta Forma Normal Uma relação está na quarta forma normal quando: dado

Formas Normais Quarta Forma Normal Uma relação está na quarta forma normal quando: dado um conjunto completo de dependências funcionais multivaloradas não triviais para essa relação: Ø Para todas as A B, Ø A é uma superchave da relação. Novembro de 2003 Profa. Marilde Santos DFM Trivial? ! O que é isso? ? 37

Formas Normais Quarta Forma Normal A B é uma DFM Trivial se: B A

Formas Normais Quarta Forma Normal A B é uma DFM Trivial se: B A ou A B=R Novembro de 2003 Profa. Marilde Santos 38

Formas Normais Quarta Forma Normal Nome Matéria Orientando Carlos SO Mario Carlos SO Ana

Formas Normais Quarta Forma Normal Nome Matéria Orientando Carlos SO Mario Carlos SO Ana Alzira BD Paulo Alzira ES Paulo Alzira BD Sonia Alzira ES Sonia A Novembro de 2003 Nome A Nome Matéria Nome não é superchave. Profa. Marilde Santos Orientando 39

Formas Normais Quarta Forma Normal Nome Matéria Orientando Carlos SO Mário SO Ana Alzira

Formas Normais Quarta Forma Normal Nome Matéria Orientando Carlos SO Mário SO Ana Alzira BD Paulo Alzira BD Sonia Alzira ES Paulo Sonia Alzira ES Sempre que dois conjuntos de atributos multivalorados independentes ocorrerem na mesma relação, será necessário repetir-se todos os valores de cada conjunto de atributos para Novembro de 2003 Profa. Marilde Santos cada valor possível do outro conjunto. 40

Formas Normais Quarta Forma Normal Nome Matéria Orientando Carlos SO Mário Carlos SO Ana

Formas Normais Quarta Forma Normal Nome Matéria Orientando Carlos SO Mário Carlos SO Ana Alzira BD Paulo Alzira BD Sonia Alzira ES Paulo Alzira ES Sonia Alzira BD Pedro Novembro de 2003 Alzira ES Profa. Marilde Santos Pedro 41

Formas Normais Quarta Forma Normal Evita: • Inconsistências devido à inclusão de uma nova

Formas Normais Quarta Forma Normal Evita: • Inconsistências devido à inclusão de uma nova tupla que tem valores diferentes das diversas ocorrências de um outro atributo multivalorado. • Inconsistências em operações de remoção de tuplas, sendo que o produto cartesiano dos atributos multivalorados da relação possuem diferentes valores de um dos atributos em comparação com os valores de outro atributo. Novembro de 2003 Profa. Marilde Santos 42

Formas Normais Quarta Forma Normal Nome Orientando Matéria Carlos SO Mário SO Ana Alzira

Formas Normais Quarta Forma Normal Nome Orientando Matéria Carlos SO Mário SO Ana Alzira BD Paulo Alzira BD Sonia Alzira ES Paulo Alzira ES Sonia Alzira BD Pedro Alzira ES Pedro Orientando Novembro de 2003 Nome A Orientando Nome Profa. Marilde Santos Nome Matéria A 43 Matéria

Formas Normais Considerações Finais Normalizar evita introduzir inconsistências quando se alteram relações; porém obriga

Formas Normais Considerações Finais Normalizar evita introduzir inconsistências quando se alteram relações; porém obriga a execução de custosas operações de junção para a consulta de informações. Novembro de 2003 Profa. Marilde Santos 44

Formas Normais Considerações Finais Mas, e aí? ! Normalizar ou não Normalizar? Eis a

Formas Normais Considerações Finais Mas, e aí? ! Normalizar ou não Normalizar? Eis a questão! A decisão deve ser tomada considerando-se o compromisso entre se garantir a eliminação de inconsistências na base, e eficiência de acesso. Novembro de 2003 Profa. Marilde Santos 45

Formas Normais Regras de Inferência para DFs 1. Reflexiva. Se X Y, então X

Formas Normais Regras de Inferência para DFs 1. Reflexiva. Se X Y, então X Y 2. Aumentativa. Se X Y, então XZ YZ 3. Transitiva. Se X Y e Y Z, então X Z 4. Decomposição/projeção. Se X YZ, então X Ye. X Z 5. União/aditiva. Se X Y e X Z, então X YZ 6. Pseudotransitiva. Se X Y e WY Z, então WX Z Novembro de 2003 Profa. Marilde Santos 46

Formas Normais Regras de Inferência (DFMs) 1. Reflexiva. Se X Y, então X Y

Formas Normais Regras de Inferência (DFMs) 1. Reflexiva. Se X Y, então X Y 2. Aumentativa. Se X Y, então XZ YZ 3. Transitiva. Se X Y e Y Z, então X Z 4. Complementação. Se X Y, então X ( R - (X Y) ) 5. Aumentativa (DFM). Se X Y e W Z, então WX YZ 6. Transitiva (DFM). Se X Y e Y Z, então X (Z Y) 7. Replicação. Se X Y, então X Y 8. Coalescência. Se X Y, e W com as seguintes propriedades: a) W Y vazio; Profa. é Marilde Santos b)w Z e c) Y Z, Novembro de 2003 47