Universidade de Braslia Departamento de Engenharia Mecnica Programa
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Professor Confiabilidade Estrutural Jorge Luiz A. Ferreira
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Introdução Vamos analisar a seguinte situação: Após ensaiar um lote de lâmpadas incandecente e outro de lampadas fluorecente com o objetivo de avaliar o tempo de falha, os engenheiros da empresa estão interessados em identificar a distribuição de probabilidade que melhor representa o comportamento de falha destes dispositivos. Medidas Resumo Média Desvio Padrão C. V. Como Executar tal Tarefa ? Lampada (1) (2) 1004 9962 103 449 10. 3% 4. 5%
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Existem Diversas Técnicas Disponíveis, Dentre as Quais Podem ser Citadas: Procedimento Heurísticos*: Testes de Adequação (Aderência) • Comparação • Teste de Chi-Quadrados; de (Freqüências); • Análise Gráfica • Diagrama Q-Q • Diagrama P-P Histogramas • Teste de Kolgorov-Smirnov; • Teste de Anderson-Darling; • Teste de Filliben * Define-se procedimento heurístico como um método de aproximação das soluções dos problemas, que não segue um percurso claro mas se baseia na intuição e nas circunstâncias.
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Comparação de Histogramas (Freqüências) Representam-se graficamente, utilizando a mesma escala, a função densidade de probabilidade que supomos estar correta, e um histograma dos dados. Existe coincidência entre os Gráficos ? Dificuldades no uso: Exige uma Quantidade de Dados Experimentais Muito Elevada (Consistência do Histograma)
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) A construção do gráfico Q-Q baseia-se na hipótese que, após a ordenação crescente dos dados, a i-ésima observação da amostra, Xi, pode ser assumida como uma estimativa do quantil da distribuição, ou seja: Ordenação dos Dados
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) Assim, tal estimativa do quantil pode ser usada na comparação da probabilidade acumulada, Prob(Xi ≥ x), associada a uma Função de distribuição de probabilidade específica (modelo), F(Xi) , ou seja: Onde F-1 é a função inversa da função de distribuição modelo, xqi é o valor previsto para quantil associado à i-ésima freqüência acumulada observada experimentalmente, identificada por Qi Construção da F. O. não foi Justa !! ?
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) Para corrigir o efeito da observação amostral sobre o comportamento da cauda várias fórmulas diferentes têm sido usados. Tipicamente, para a determinação dos quantis é utilizada a seguinte fórmula: é i/ (n + 1): onde i é a posição do i-ésimo dado observado após a ordenação da amostra e n é o tamanho da amostra
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) Na literatura são citadas outras metodologias para a estimativa do valor do quantil. As expressões em geral têm a forma (i - k) / (n+1 -2∙k) para algum valor de k na faixa de 0 - 1/2, que dá um intervalo entre i / (n + 1) e (i - 1/2)/n Outras Fórmula que podem ser Utilizadas:
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) Estimativa do Quantil Q para cada fórmula:
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) Estimativa do Quantil Q para cada fórmula:
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) Diferença Quantil: Percentual Gerada Por cada Metodologia de Estimativa do
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil - Quantil ) Como Avaliar se os Dados se Ajustam Bem à Função de Distribuição de Probabilidade Modelo ? 1200 1150 1100 Valor Esperado Uma Possibilidade é Usar o Coeficiente de Explicação !!!! 1050 1000 950 900 850 800 Média: 1004 Desvio Padrão: 113 900 1000 Valor Observado 1100 1200 R 2 = 0. 9415 800 Média: 1000 Desvio Padrão: 200 900 1000 Valor Observado 1100 1200 R 2 = 0. 9415
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama Q-Q ( Quantil-Quantil ) Assim, usando o exemplo apresentar será possível os seguintes resultados Identificação da Amostra G de Lampada Vida [Horas] 825 B J A H 898 913 976 981 C I E 1020 1088 1096 D F 1102 1139 Frequencia Observada 6. 7% 16. 3% 26. 0% 35. 6% 45. 2% 54. 8% 64. 4% 74. 0% 83. 7% 4. 2% 15. 3% 19. 0% 39. 4% 41. 3% 56. 2% 79. 2% 81. 3% 82. 9% 90. 4% 1. 00 0. 80 Quantil Esperado Qxi 93. 3% 0. 60 0. 40 0. 20 0. 00 0. 20 Média: 1003, 8 Desvio Padrão: 103, 5 0. 40 0. 60 Quantil Observado 0. 80 R 2 = 0. 9599 1. 00
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Algumas Técnicas Heurísticas Análise Gráfica – Diagrama P-P ( Probabilidade - Probabilidade ) A idéia básica na construção do gráfico P-P é similar a que foi proposta para a construção do gráfico Q-Q. A diferença básica entre ambos é que no gráfico Q-Q são plotados os quantiles, enquanto no gráfico P-P são plotadas as freqüências ou probabilidades associadas aos xi, ou seja: Onde F é a função de distribuição a ser testada (modelo), xi é o valor previsto para o i-ésimo dado experimental, e Qxi é o valor previsto pelo Função de distribuição modelo.
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) Karl Pearson 1895 - † 1980 A idéia é comparar as freqüências observadas com as freqüências esperadas. Assim, considerando: • Uma tabela contendo as K (K>2) classes e as, respectivas, freqüências O 1, . . . , Ok ( ), observadas em um processo de amostragem. • As probabilidades associadas a distribuição modelo, associadas às k classes, tal que p 1 = p 01; . . . ; pk = p 0 k • As freqüências esperadas: E 1; . . . ; EK , Ek = N∙p 0 k, tal que: k-ésima Classe Ok Ek Distribuição de Freqüências Hipotético Histograma
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) A partir destas considerações pode-se admitir duas situações possíveis : Situação A : As probabilidades observadas e modelo são estatisticamente iguais, ou seja: p 1 = p 01 , p 2 = p 02, p. K = p 0 K Tal situação será admitida como Hipótese de Nulidade – H 0 Situação B : Existe pelo menos em uma das classes a probabilidade observada é estatisticamente diferente da probabilidade modelo. Já esta situação será admitida como Hipótese Alternativa – H 1
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) Com a intenção de construir uma metodologia para avaliar se a admissibilidade da situação 1, será proposta a seguinte estatística: Estatística esta, formada pelas realizações Ok, associadas as k classes e pelos seus respectivos valores esperados de ocorrência de um evento na k-ésima, rk, Ek = E[rk], os quais, se a hipótese nula for verdadeira, são iguais a Npk. Assim, a estatística c 2 expressará a soma das diferenças quadráticas entre as realizações das variáveis aleatórias rk e suas respectivas médias populacionais.
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) Quando N tende para o infinito, a estatística c 2, tal como expressa pela equação anterior, segue uma distribuição de Qui-Quadrado, com n = (r-1) graus de liberdade, ou seja: Assim, para grandes valores de N, pode-se, portanto, empregar esse resultado para testar a hipótese nula H 0 de que as freqüências relativas esperadas de rk sejam dadas por N∙pk, com pk calculadas pela distribuição de probabilidades proposta. Um valor elevado da estatística de teste revela grandes diferenças entre as freqüências observadas e esperadas, sendo um indicador da pouca aderência da distribuição especificada, sob H 0, à amostra.
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Tabela de c 2 Teste de Chi-Quadrados (c 2)
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) Importante: • A distribuição limite da estatística de teste não depende de pk, contido em H 0. • Na prática, o teste de aderência do c 2 fornece resultados satisfatórios para N > 50 e para N∙pk ≥ 5, com k =1, 2, . . . , K. • Se as probabilidades associadas ao modelo, pk , forem calculadas a partir de uma distribuição de P parâmetros, estimados pelas observações amostrais, perde-se P graus de liberdade adicionais. Em outras palavras, o parâmetro n, da distribuição da estatística de teste c 2, será n = (K – P - 1).
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) - Exemplo Considere um conjunto testes realizados em motores monocilíndricos com um certo tipo de combustível. O número de detonações foi gravado durante 30 minutos. Dez destes motores foram testados e os resultados são apresentados a seguir. Avaliar, a um nível de significância de 95%, se os dados amostrais podem ser descritos por uma distribuição de Poisson?
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) - Exemplo Resultados Ensaios de Detonação Solução: Núm Médio de Detonação por Minutos: 0, 72 (216/(10*30)) Se x representar a ocorrência de detonações em um intervalo de tempo, o parâmetro da distribuição, l, será igual a 0, 72
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Chi-Quadrados (c 2) - Exemplo Implementação do Teste Função Inv. Qui do Excel Conclusão: Considerando que c 2 < c 21 -a, n, a decisão é a de não rejeitar a hipótese de nulidade, H 0, ou seja admitir que os dados observados podem ser descritos por uma distribuição de Poisson com média igual a 0, 72
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov, V. I. Kolmogorov, A. , N. 1887 - † 1974 1903 - † 1987 O teste de aderência de Kolmogorov-Smirnov (KS) é um teste não paramétrico, cuja estatística de teste tem como base a diferença máxima entre as funções de probabilidades acumuladas, empírica e teórica (modelo), de variáveis aleatórias contínuas. Ordenar e Tratar P(x<X) Posição Dados Amostrais (i) (X) Observado Modelo 1 5. 10 0. 048 0. 051 2 6. 33 0. 095 0. 110 3 6. 38 0. 143 0. 114 4 6. 95 0. 190 0. 155 5 7. 04 0. 238 0. 162 6 7. 54 0. 286 0. 206 7 7. 87 0. 333 0. 239 8 9. 38 0. 381 0. 418 9 9. 43 0. 429 0. 424 10 9. 87 0. 476 0. 483 11 9. 87 0. 524 0. 483 12 10. 14 0. 571 0. 518 13 10. 94 0. 619 0. 623 14 11. 11 0. 667 0. 644 15 11. 40 0. 714 0. 680 16 11. 77 0. 762 0. 723 17 12. 34 0. 810 0. 782 18 12. 65 0. 857 0. 812 19 14. 40 0. 905 0. 929 20 14. 99 0. 952 Frequencia
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov O teste de aderência Smirnov, V. I. Kolmogorov, A. , N. 1887 - † 1974 1903 - † 1987 de Kolmogorov-Smirnov (KS) é um não paramétrico, cuja estatística de teste tem como base a diferença máxima entre as funções de probabilidades acumuladas, empírica e teórica (modelo), de variáveis aleatórias contínuas. 0. 900 Distribuição Acumulada teste 1. 000 0. 800 0. 700 0. 600 0. 500 Observado 0. 400 D 0. 300 0. 200 Modelo 0. 100 0. 00 5. 00 10. 00 Variável Aleatória 15. 00 20. 00
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov, V. I. Kolmogorov, A. , N. 1887 - † 1974 1903 - † 1987 Considere que X represente uma variável aleatória contínua, de cuja população extraiu-se a amostra {X 1, X 2, . . . , XN}. A hipótese nula a ser testada é H 0: P(X < x) =FX(x), onde FX(x) é suposta conhecida, ou seja, seus parâmetros não são estimados a partir da amostra. Para implementar o teste KS, inicialmente, classifique os elementos da amostra {X 1, X 2, . . . , XN} em ordem crescente, de modo a constituir a seqüência {x(1), x(2), . . . , x(m) , . . . x(N)}, na qual 1 ≤ m ≤ N denota a ordem de classificação. Para cada elemento x(m), a distribuição empírica FN(x(m)) é calculada pela proporção de valores amostrais que não excedam x(m), ou seja, FN = Quantil.
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov Em seguida, calcule as probabilidades teóricas, segundo F X(x), tendo como argumento os valores x(m). A estatística do teste KS é dada por Assim, DN corresponderá à maior diferença entre as probabilidades empírica e teórica (central, a direita ou a esquerda).
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov Se a hipótese de nulidade, H 0, for verdadeira quando N , a estatística DN irá tender a zero. Por outro lado, se N é um valor finito, a estatística DN deverá ser da ordem de grandeza de e, portanto, a quantidade não irá tender a zero, mesmo para valores muito elevados de N. Smirnov (1948) determinou a distribuição limite da variável aleatória premissa de veracidade da hipótese H 0, é expressa por: , a qual, sob a
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov Valores críticos da estatística DN, a do teste de aderência KS
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov Importante: A construção da estatística do teste KS parte da premissa que FX(x) é completamente conhecida e, portanto, que seus parâmetros são especificados e, portanto, não são estimados a partir da amostra. Entretanto, quando as estimativas dos parâmetros são obtidas dos elementos da amostra, simulações de Monte Carlo demonstram que o teste KS é conservador quanto à magnitude do erro do tipo I, podendo ocorrer rejeições indevidas da hipótese nula. Com o objetivo de corrigir tal situação, Crutcher (1975) apresenta novas tabelas de valores críticos da estatística DN, a para amostras de tamanhos variáveis, considerando, sob H 0, as distribuições exponencial, gama, normal e Gumbel.
Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação em Integridade Estrutural Testes e Adequação de Dados à Distribuições de Probabilidade Específicas Testes de Adequação ou de Aderência Teste de Kolmogorov-Smirnov Exemplo: Avaliar se os dados amostrais (A) são N(10, 3), a = 95% Conclusão: Considerando que D 20 < D 20, 95%, a decisão é a de não se rejeitar a hipótese de nulidade, H 0, ou seja admitir que os dados observados podem ser descritos por uma distribuição de N(10, 3).
- Slides: 31