Estadstica 2010 Clase 5 Maestra en Finanzas Universidad

  • Slides: 32
Download presentation
Estadística 2010 Clase 5 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente:

Estadística 2010 Clase 5 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri

Clase 5 1. Análisis de Regresión 2. Especificación y Estimación 3. Supuestos del modelo

Clase 5 1. Análisis de Regresión 2. Especificación y Estimación 3. Supuestos del modelo de regresión lineal 4. Propiedades de los estimadores de MCO 5. Test de Hipótesis e Intervalos de Confianza 6. Bondad de Ajuste 7. Test de significatividad global 8. Ejercicios

1. Análisis de Regresión • A pesar de que el análisis de regresión tiene

1. Análisis de Regresión • A pesar de que el análisis de regresión tiene que ver con la dependencia de una variable respecto a otras variables, esto no implica causalidad necesariamente. La misma viene dada por consideraciones a priori o teóricas. • A diferencia del análisis de correlación, en donde el principal objetivo es medir el grado de asociación lineal entre dos variables, aquí estamos interesados en estimar o predecir el valor promedio de una variable sobre la base de valores fijos de otras variables.

1. Análisis de Regresión • Función de Regresión Poblacional El valor esperado de la

1. Análisis de Regresión • Función de Regresión Poblacional El valor esperado de la distribución de Y esta funcionalmente relacionado con Xi, pero. . . ¿Qué forma funcional toma Lineal ? No Lineal

1. Análisis de Regresión • En cuanto a linealidad, le pedimos a las regresiones

1. Análisis de Regresión • En cuanto a linealidad, le pedimos a las regresiones que sean lineales en los parámetros, y no necesariamente en las variables. • Entre las formas funcionales lineales se destacan:

1. Análisis de Regresión • La primer ecuación es lineal en Y y en

1. Análisis de Regresión • La primer ecuación es lineal en Y y en X. • La segunda ecuación se puede trasformar en: La cual es lineal en log Y y en log X • La tercer ecuación se puede transformar en La cual es lineal en log Y y en X. • Veamos la interpretación de cada coeficiente

2. Especificación y Estimación • • : parte determinística : perturbación estocástica (o parte

2. Especificación y Estimación • • : parte determinística : perturbación estocástica (o parte aleatoria).

2. Especificación y Estimación • Perturbación Estocástica –El término incluye todas las variables omitidas

2. Especificación y Estimación • Perturbación Estocástica –El término incluye todas las variables omitidas por el modelo pero que, en conjunto, influencian al valor de Y. También incluye información no disponible (variables no cuantificables), problemas de representación de las variables (errores de medición) y/o una falla en la forma funcional del modelo. • Modelo inicial –Introduciremos el análisis de regresión con un modelo de dos variables, del tipo: –En donde:

2. Especificación y Estimación • Objetivo: Cuantificar los parámetros ESTIMACIÓN Estimadores puntuales POBLACIÓN Muestra

2. Especificación y Estimación • Objetivo: Cuantificar los parámetros ESTIMACIÓN Estimadores puntuales POBLACIÓN Muestra disponible

2. Especificación y Estimación • Podemos reexpresar la recta de regresión poblacional como: •

2. Especificación y Estimación • Podemos reexpresar la recta de regresión poblacional como: • El último término es el error de estimación, podría calcularse de la siguiente manera: , que análogamente

2. Especificación y Estimación • Existen diversos métodos de estimación. El idea es aquél

2. Especificación y Estimación • Existen diversos métodos de estimación. El idea es aquél que genere una recta de regresión para la cual los residuos de estimación sean iguales a 0. En términos prácticos esto es imposible, por lo que nos conformamos con minimizar la magnitud de dichos residuos. El criterio que utilizaremos en esta reunión es el de Mínimos Cuadrados Ordinarios (MCO o MCC, por Mínimos Cuadrados Clásicos).

2. Especificación y Estimación • Desarrollando el cuadrado y minimizando (derivando respecto a ambos

2. Especificación y Estimación • Desarrollando el cuadrado y minimizando (derivando respecto a ambos parámetros) obtenemos las siguientes ecuaciones normales: y resolviendo ambas simultáneamente llegamos a que:

2. Especificación y Estimación • Si corremos la regresión en un programa de econometría

2. Especificación y Estimación • Si corremos la regresión en un programa de econometría (por ejemplo STATA o E-views) llegaríamos a los mismos resultados: • El comando en STATA sería: “reg acin merval” y así corremos una regresión con termino constante incluido.

3. Supuestos del modelo de regresión lineal • El modelo clásico de regresión lineal,

3. Supuestos del modelo de regresión lineal • El modelo clásico de regresión lineal, surgido de la aplicación de los MCO, necesita de ciertos supuestos para poder realizar inferencia estadística sobre la variable dependiente, así como sobre los parámetros poblacionales. – Los supuestos son 10, destacando los siguientes:

4. Propiedades de los estimadores de MCO • Entonces, en base a estos supuestos,

4. Propiedades de los estimadores de MCO • Entonces, en base a estos supuestos, cada estimador de MCO es MELI (Mejor Estimador Lineal Insesgado): –Es lineal (función lineal de una variable aleatoria) –Es insesgado (su valor promedio es igual al verdadero valor del parámetro) –Es eficiente (tiene varianza mínima dentro de todos los estimadores lineales insesgados del parámetro) Cabe destacar que éstas son propiedades de muestra finita, o sea, se mantienen independiente del tamaño de la muestra sobre la cual estén basados los estimadores.

4. Propiedades de los estimadores de MCO • Los estimadores de MCO, además, presentan

4. Propiedades de los estimadores de MCO • Los estimadores de MCO, además, presentan las siguientes propiedades deseables: –El valor de la media de los residuos es cero. –Los residuos no están correlacionados con el valor predicho de Y, –Los residuos no están correlacionados con Xi. : :

4. Propiedades de los estimadores de MCO • es un estimador insesgado de •

4. Propiedades de los estimadores de MCO • es un estimador insesgado de • La varianza de es, • Mientras que la varianza de es, . Es decir,

4. Propiedades de los estimadores de MCO En donde, Y como desconocemos , lo

4. Propiedades de los estimadores de MCO En donde, Y como desconocemos , lo reemplazamos por la estimación muestral, . La misma se estima a partir del siguiente cálculo: Y agregándole el supuesto de que las perturbaciones se distribuyen normalmente, obtenemos que:

5. Test de Hipótesis e Intervalos de Confianza • Ya definidas las distribuciones de

5. Test de Hipótesis e Intervalos de Confianza • Ya definidas las distribuciones de los estadísticos, podemos realizar test individuales sobre los parámetros , de la siguiente manera: Caso III Prueba Estadística Rechazar si tcal<-t( , n-2) Regla de Decisión Rechazar si |tcal |>t( /2, n-2) Rechazar si tcal>t( , n-2)

5. Test de Hipótesis e Intervalo de Confianza • Y el intervalo de confianza,

5. Test de Hipótesis e Intervalo de Confianza • Y el intervalo de confianza, con un nivel de significación, para los parámetros poblacionales, quedan definidos de la siguiente manera:

5. Test de Hipótesis e Intervalo de Confianza • Recordemos que en la regresión

5. Test de Hipótesis e Intervalo de Confianza • Recordemos que en la regresión anterior obteníamos: • Que significa el p-value? Se puede definir como “el mínimo valor de error tipo I (el α de la clase pasada) para el cual se rechaza la hipótesis nula.

6. Bondad de Ajuste • La bondad de ajuste de la recta de regresión

6. Bondad de Ajuste • La bondad de ajuste de la recta de regresión es equivalente a determinar cuán bien se ajusta la recta de regresión a los datos muestrales. Como medida de esto surge el coeficiente de determinación (ó R 2): • En el contexto de la regresión, es una medida de la proporción de la variación en la variable dependiente explicada por la/s variable/s explicativa/s.

6. Bondad de Ajuste • Coeficiente de Correlación: Determina el grado de relación lineal

6. Bondad de Ajuste • Coeficiente de Correlación: Determina el grado de relación lineal que existe entre distintas variables. Dicho coeficiente toma valores entre – 1 y 1. De aquí en mas lo llamaremos r o ρ. • Si el coeficiente de correlación lineal es igual a +1 o – 1 podemos afirmar que la relación lineal entre ambas variables es perfecta. Es decir “ambas variables se mueven juntas”. • En el caso de dos variables que no tienen relación lineal alguna, tendremos un ρ igual a cero.

6. Bondad de Ajuste • Recordemos como se calcula el coeficiente de Correlación: o

6. Bondad de Ajuste • Recordemos como se calcula el coeficiente de Correlación: o

6. Bondad de Ajuste • Vamos a testear con un nivel de significatividad del

6. Bondad de Ajuste • Vamos a testear con un nivel de significatividad del 5% si el coeficiente de correlación lineal entre ambas variables es o no significativamente distinto de cero. Planteamos las hipótesis: H 0: ρ=0 y H 1: ρ≠ 0 • A fin de realizar nuestro test, utilizaremos el siguiente estadístico • En donde si reemplazamos por los datos del ejercicio tenemos que: t=(0. 94*(6 -2)0. 5)/(1 -(0. 942)0. 5=5. 51

6. Bondad de Ajuste Uno podría plantear, en base a que Donde: , lo

6. Bondad de Ajuste Uno podría plantear, en base a que Donde: , lo siguiente:

6. Bondad de Ajuste • Dividiendo a todo por SCT tenemos que: • Ahora

6. Bondad de Ajuste • Dividiendo a todo por SCT tenemos que: • Ahora bien, definiendo al coeficiente de determinación como • Podemos expresarlo también como:

7. Test de significatividad global Podemos hacer otro análisis sobre la varianza de la

7. Test de significatividad global Podemos hacer otro análisis sobre la varianza de la regresión conocido como el test F. Su popularidad radica en que es fácilmente calculada para regresiones simples y múltiples: Entonces, plantenado como hipótesis nula que los estimadores no son conjuntamente significativos, , se realiza el test de hipótesis.

8. Ejercicios • E 1. Sea n=10, ∑X=40, ∑Y=90, el estimador de a 1=2

8. Ejercicios • E 1. Sea n=10, ∑X=40, ∑Y=90, el estimador de a 1=2 y ρ=0. 5 ¿Cuáles de las siguientes afirmaciones son ciertas? I. El coeficiente de determinación es igual a 0. 25 II. El estimador de a 0=1 III. Si X fuera 5, entonces Y sería 11. IV. La pendiente de la recta de regresión es ascendente hacia la derecha. A. Sólo I y IV. B. Sólo II y III. C. Sólo I y II D. Todas son correctas. • E 2. Si una regresión lineal simple tiene un R 2 = 0. 45. ¿Cuál es el coeficiente de correlación entre las variables dependiente e independiente? A. 0. 20 B. 0. 37 C. 0. 55 D. 0. 67

8. Ejercicios • E 3. De una muestra de 200 pares de observaciones se

8. Ejercicios • E 3. De una muestra de 200 pares de observaciones se han calculado las siguientes cantidades: ∑X=11. 34, ∑Y=20. 72, ∑X 2=12. 16, ∑Y 2=84. 96, ∑XY=22. 13 Estimar y • E 4. Si una regresión lineal simple tiene un R 2 = 0. 45. ¿Cuál es el coeficiente de correlación entre las variables dependiente e independiente? A. 0. 20 B. 0. 37 C. 0. 55 D. 0. 67

8. Ejercicios • E 4. Una muestra de 20 observaciones correspondiente al modelo de

8. Ejercicios • E 4. Una muestra de 20 observaciones correspondiente al modelo de regresión Donde u se distribuye normalmente con media cero y varianza desconocida, dio los siguientes datos: ∑X=186. 2, ∑Y=21. 9, Estimar α y β y calcular las estimaciones de las varianzas.

FIN Me pueden escribir a: jrs 06@cema. edu. ar Las presentaciones estarán colgadas en:

FIN Me pueden escribir a: jrs 06@cema. edu. ar Las presentaciones estarán colgadas en: www. cema. edu. ar/u/jrs 06