Regresin Lineal Simple Lic Csar Octavio Contreras INTRODUCCIN

  • Slides: 17
Download presentation
Regresión Lineal Simple Lic. César Octavio Contreras

Regresión Lineal Simple Lic. César Octavio Contreras

INTRODUCCIÓN n n n ORIGEN HISTORICO Después de estudiar cómo hay que organizar, representar

INTRODUCCIÓN n n n ORIGEN HISTORICO Después de estudiar cómo hay que organizar, representar gráficamente y analizar un conjunto de datos a partir de algunos parámetros, nos proponemos estudiar las relaciones entre variables. Queremos construir modelos que describan la relación entre las variables con el propósito, principalmente, de predecir los valores de una variable a partir de los valores de la otra. Lo haremos con el modelo de regresión lineal simple. 2

INTERPRETACIÓN MODERNA n El análisis de regresión trata del estudio de la dependencia de

INTERPRETACIÓN MODERNA n El análisis de regresión trata del estudio de la dependencia de la variable dependiente, respecto a una o más variables (las variables explicativas), con el objetivo de estimar y/o predecir la media o valor promedio poblacional de la primera en términos de los valores conocidos o fijos (en muestras repetidas) de las ultimas. 3

Regresión vs Causalidad n n Una relación estadística, sin importar que tan fuerte y

Regresión vs Causalidad n n Una relación estadística, sin importar que tan fuerte y sugestiva sea, nunca podrá establecer una conexión causal: nuestras ideas de causalidad deben venir de estadísticas externas y, en último termino, de una u otra teoría. Una relación estadística no puede por si misma implicar en forma lógica una causalidad. 4

Relaciones entre dos variables n n El objetivo es explicar el comportamiento de una

Relaciones entre dos variables n n El objetivo es explicar el comportamiento de una variable Y, que denominaremos variable explicada (o dependiente o endógena), a partir de otra variable X, que llamaremos variable explicativa (o independiente o exógena). Ejemplo Si las dos variables son los ingresos mensuales y los gastos en actividades de ocio 5

Las relaciones entre dos variables pueden ser de dos tipos: n n 1) Funcionales

Las relaciones entre dos variables pueden ser de dos tipos: n n 1) Funcionales (o deterministas): cuando hay una fórmula matemática que permite calcular los valores de una de las variables a partir de los valores que toma la otra. 2) Estadísticas (o estocásticas): cuando no existe una expresión matemática que las relacione de forma exacta. 6

Ejemplo de las alturas y los pesos 7

Ejemplo de las alturas y los pesos 7

Recta de regresión n Una vez que hemos hecho el diagrama de dispersión y

Recta de regresión n Una vez que hemos hecho el diagrama de dispersión y después de observar una posible relación lineal entre las dos variables, nos proponemos encontrar la ecuación de la recta que mejor se ajuste a la nube de puntos. Esta recta se denomina recta de regresión. 8

Estimación de los parámetros: método de los mínimos cuadrados n n y = a

Estimación de los parámetros: método de los mínimos cuadrados n n y = a + bx El método de los mínimos cuadrados consiste en buscar los valores de los parámetros a y b de manera que la suma de los cuadrados de los residuos sea mínima. Esta recta es la recta de regresión por mínimos cuadrados. 9

Las soluciones de este sistema de ecuaciones son: Sxy = es la covarianza muestral

Las soluciones de este sistema de ecuaciones son: Sxy = es la covarianza muestral de las observaciones (xi, yi). S 2 x = es la varianza muestral de las observaciones xi. 10

11

11

EJERCICIOS

EJERCICIOS

Impacto de los gastos en publicidad n n Los datos proporcionados en la siguiente

Impacto de los gastos en publicidad n n Los datos proporcionados en la siguiente tabla se publicaron en la edición correspondiente al primero de marzo de 1984 del periódico Wall Street Journal. Se refiere al presupuesto publicitario de 21 empresas para el año de 1983 y a las veces que los clientes observan los comerciales de los productos en una semana de dichas compañias. Haga una grafica poniendo las impresiones en el eje vertical y el gasto publicitario en el eje horizontal. Que se podría decir respecto a la naturaleza de la relación entre las dos variables? 13 Realiza una regresión lineal con estos datos

Empresa Impresion es Gasto Pub. Empresa Impresi ones Gasto Pub. Miller Lite 32. 1

Empresa Impresion es Gasto Pub. Empresa Impresi ones Gasto Pub. Miller Lite 32. 1 50. 1 Bud Lite 10. 4 45. 6 Pepsi 99. 6 74. 1 ATT 88. 9 154. 9 Stroh´s 11. 7 19. 3 Calvin Klein 12 5 Fed´l Express 21. 9 22. 9 Wendy´s 29. 2 49. 7 Burguer King 60. 8 82. 4 Polaroid 38 26. 9 Coca Cola 73. 6 40. 1 Shasta 10 5. 7 Mc. Donald´s 92. 4 185. 9 Meow Mix 12. 3 7. 6 MCI 50. 7 26. 9 Diet Cola 21. 4 20. 4 Oscar Meyer 23. 4 9. 2 Ford 40. 1 166. 2 Crest 71. 1 32. 4 Levi´s 40. 8 27 Kibbles ´N Bits 4. 4 6. 1 14

15

15

De que depende las victorias de un equipo de Base B n VICTORIAS =

De que depende las victorias de un equipo de Base B n VICTORIAS = 3. 083258 + 524. 4436*BATEO + 0. 016592*BASESROB - 0. 199310*ERRORES – 13. 46487*PROMCARR + 0. 095243*JONRON 0. 880311*SUPERFICIE BATEO. - La variable del promedio de bateo del equipo resulto relacionado positivamente con el numero de victorias del equipo lo cual resulta lógico, pues entre mas ocasiones están frente al bat se incrementa la probabilidad de hacer mas carreras lo cual resulta en victorias. BASESROB. - La variable del número de bases robadas resulta también con una relación positiva con el numero de victorias del equipo, pues entre mas bases roben los jugadores realizarán mas carreras lo cual, de nuevo, consigue mas victorias para el equipo. ERRORES. - El número de errores cometidos se relaciona negativamente con el número de victorias, pues entre mayor sea el numero de errores cometidos por el equipo con mayor probabilidad perderán el partido. PROMCARR. - El promedio de carreras del equipo se relaciona de manera negativa. JONRON. - El numero de cuadrangulares, lógicamente tiene una relación positiva con el numero de victorias del equipo, pues entre mas cuadrangulares anoten los jugadores será mas probable que ganen mas partidos. SUPERFICIE. - La variable superficie del terreno, tiene una relación negativa con el número de 16 victorias, lo que nos dice que si la cancha del equipo en estudio es artificial aumenta la probabilidad de perder mas partidos.

Regresión Lineal Simple Lic. César Octavio Contreras

Regresión Lineal Simple Lic. César Octavio Contreras