PTR 5802 Tcnicas de Anlise de Dados Aplicadas

  • Slides: 10
Download presentation
PTR – 5802 - Técnicas de Análise de Dados Aplicadas à Engenharia de Transportes

PTR – 5802 - Técnicas de Análise de Dados Aplicadas à Engenharia de Transportes REGRESSÃO LINEAR MÚLTIPLA Prof. José Alberto Quintanilha 04 de maio de 2005

Regressão linear múltipla (2005) Até agora: ajuste linear simples Y = 0 + 1

Regressão linear múltipla (2005) Até agora: ajuste linear simples Y = 0 + 1 X + Prática: necessidade de se utilizar maior # de var. independentes para melhorar as estimativas de Y (var. dependente). Exemplo Regressão múltipla como uma seqüência de regressões simples Exame da equação de regressão: Coeficiente de correlação múltipla Desvio-padrão Coeficiente de variação Teste do F seqüencial Critério do F parcial Análise de resíduos Seleção da melhor equação de regressão Todas as possíveis regressões Backward Forward Stepwise 1

2 Regressão linear múltipla (2005) Exemplo (pág. 616 – Applied Linear Regression – Draper

2 Regressão linear múltipla (2005) Exemplo (pág. 616 – Applied Linear Regression – Draper & Smith – 1981 - 2 nd Ed. – John Wiley) Y: Montante de folhas usadas mensalmente (pounds) X 1: temperatura atmosférica média no mês (o. F) X 2: número de dias operando no mês Y = 0 + 1 X 1 + 2 X 2 + Y X b= (X’X)-1 X’Y Matriz de correlação: Y X 1 X 2 Y 1 -. 84 . 53 X 1 -. 84 1 -. 21 X 2 . 53 -. 21 1 b 0=9. 1266 b 1=-0. 0724 b 2=0. 2029 Yest=9. 1266 – 0, 0724 X 1+0. 2029 X 2

Regressão linear múltipla (2005) Regressão múltipla como uma seqüência de regressões simples 1 -

Regressão linear múltipla (2005) Regressão múltipla como uma seqüência de regressões simples 1 - gráfico Y x X 1: observar tendência 2 - calcular a regressão: Y = 0 + 1 X 1 + observar gráfico e tabela Yest= 13. 6215 – 0, 0798 X 1 3 - adicionar a var X 2: Objetivo: relacionar a ”nova variável independente”, com a variação não explicada após a inserção da var X 1. Nova variável independente: X 2 – X 2 est = ’ 0 + ’ 1 X 1 + ’ X 2 est= 22. 1685 – 0, 0367 X 1 Nova variável dependente: Y – Yest 3

Regressão linear múltipla (2005) Regressão múltipla como uma seqüência de regressões simples 4 -

Regressão linear múltipla (2005) Regressão múltipla como uma seqüência de regressões simples 4 - (Y – Yest) = ’ (X 2 – X 2 est) + ÞReta passa pela origem (Y – Yest)est = 0. 2015(X 2 – X 2 est)est Resultado: Yest=9. 1545 – 0, 0724 X 1+0. 2015 X 2 Anteriormente: Yest=9. 1266 – 0, 0724 X 1+0. 2029 X 2 Exame da equação de regressão Quão boa é a equação Y=f(X 1, X 2)? 1 - cálculo de Y = 0 + 1 X 1 + 2 X 2 + 2 - cálculo de Y – Yest 3 - ANOVA 4

5 Regressão linear múltipla (2005) Exame da equação de regressão Quanto a entrada de

5 Regressão linear múltipla (2005) Exame da equação de regressão Quanto a entrada de X 2 melhorou o modelo? Crtérios para averiguação: 1 - R 2: [coeficiente de correlação múltipla]2 Y=f(X 1) => R 2 = 71. 44% Y=f(X 1, X 2) => R 2 = 84. 89% Nota: R 2 maior não implica, necessariamente, em melhor Yest. Exemplo: Resíduo R 2 Var na SQ GL QM 1, 2, 3 48. 11 9 5. 35 98. 24 1, 2, 3, 4 47. 86 8 5. 98 Regr. 98. 23 2 - s: desvio-padrão se s depois da inclusão da nova variável é menor do que antes, indica que a nova previsão é mais precisa Y=f(X 1) => s=0. 89 Y=f(X 1, X 2) => s=0. 66

6 Regressão linear múltipla (2005) Exame da equação de regressão 3 - s/Ybarra: coeficiente

6 Regressão linear múltipla (2005) Exame da equação de regressão 3 - s/Ybarra: coeficiente de variação Y=f(X 1) => s/Ybarra = 9. 44% Y=f(X 1, X 2) => s/Ybarra = 7. 00% 4 - Critério do teste F-seqüencial ANOVA Fonte de GL SQ QM F Regressão/b 0 2 54. 19 27. 09 61. 90 b 1/b 0 1 45. 59 104. 16 8. 59 0. 44 Variação b 2/b 0, b 1 1 Resíduo 22 9. 63 Total 24 63. 82 F(1; 22; 5%)=4. 30 => b 2/b 0, b 1 é altamente significante e deve ficar no modelo 19. 64

7 Regressão linear múltipla (2005) Exame da equação de regressão 5 - Critério do

7 Regressão linear múltipla (2005) Exame da equação de regressão 5 - Critério do teste F-parcial (mudo a ordem de entrada: X 2 X 1 ANOVA Fonte de GL SQ QM F Regressão/b 0 2 54. 19 27. 09 61. 90 b 2/b 0 1 18. 34 41. 91 b 1/b 0, b 2 1 35. 84 81. 89 0. 44 Variação Resíduo 22 9. 63 Total 24 63. 82 Nota: a contribuição de X 1 é maior do que a sua contibuição após a entrada de X 2 no modelo: b 1/b 0 F = 104. 16 b 1/b 0, b 2 F = 81. 89 X 1 reduz SQRes mais depressa. 6 - Análise de resíduos

Regressão linear múltipla (2005) Seleção da melhor equação de regressão: melhor explicação de Y

Regressão linear múltipla (2005) Seleção da melhor equação de regressão: melhor explicação de Y com a menor quantidade de X’s. Técnicas: a) Todas as possíveis regressões todas as regressões com uma var. independente; todas as regressões com duas var. independentes, etc. ordeno, dentro de cada conjunto , pelo valor de R 2 b) Eliminação “backward” equação de regressão contendo todas as var. ; teste F parcial para todas as var. , cada uma sendo considerada como a última a entrar no modelo; o menor valor de F parcial: Fl é comparado com o Fcrítico: se Fl < Fcrítico retiro a var Xl, preparo a equação sem ela e volto ao passo anterior; se Fl > Fcrítico aceito o modelo. 8

Regressão linear múltipla (2005) Técnicas: c) Seleção “forward” seleciono a var. independente mais correlacionada

Regressão linear múltipla (2005) Técnicas: c) Seleção “forward” seleciono a var. independente mais correlacionada com a Y: por exemplo Y=f(Xi); seleciono a var. Xj mais correlacionada a Y/ Xi através do coeficiente de correlação parcial (equivale a encontra a correlação entre Y/ Xi e Xj/Xi. d) Regressão “stepwise” A cada entrada de uma variável, é examinada a sua exclusão assim como daquelas já presentes no modelo: F-parcial ou “F to remove” F-seqüencial ou “F to enter” Exercício: stepwise, usando Excel, com os dados das páginas 221 e 222 do livro Applied Multivariate Data Analysis – Vol. I: Regression and Experimental Design – J. D. Jobson, 1991, Springer-Verlag. 9