Estadstica 2010 Clase 4 Maestra en Finanzas Universidad

  • Slides: 27
Download presentation
Estadística 2010 Clase 4 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente:

Estadística 2010 Clase 4 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri

Clase 4 1. Test de Hipótesis 2. Propiedades de los estimadores

Clase 4 1. Test de Hipótesis 2. Propiedades de los estimadores

1. Test de Hipótesis • Problema: Nuevamente tenemos una v. a. X con una

1. Test de Hipótesis • Problema: Nuevamente tenemos una v. a. X con una FDP conocida. Después de obtener una muestra aleatoria n, obtenemos el estimador puntual, Pero este estimador que obtuvimos, ¿es compatible con algún valor específico de bajo hipótesis? . TEST de HIPOTESIS Simples Compuestas • Para comprobar la hipótesis nula se utiliza la información muestral para obtener el estadístico de prueba, un estimador puntual del parámetro desconocido. Entonces pasamos a averiguar la distribución muestral del estadístico de prueba y utilizar el método de intervalos de confianza para probar dicha hipótesis nula.

1. Test de Hipótesis • Un test de hipótesis puede ser entendido como un

1. Test de Hipótesis • Un test de hipótesis puede ser entendido como un procedimiento estadístico simple cuya finalidad es corroborar o desmentir alguna afirmación que se hace con relación a un parámetro poblacional. En definitiva, es una regla de decisión sobre determinadas características de los parámetros poblacionales de nuestro interés. Hipótesis nula: Suposición inicial sobre el parámetro poblacional bajo estudio que sirve para iniciar el procedimiento de prueba o verificación. Hipótesis alternativa: Hipótesis que se establece como alternativa de la hipótesis nula; si la H 0 es rechazada, entonces será la hipótesis alternativa la que se tomará tentativamente como válida.

1. Test de Hipótesis

1. Test de Hipótesis

1. Test de Hipótesis • Nivel de significación de una prueba: Se llama así

1. Test de Hipótesis • Nivel de significación de una prueba: Se llama así a la probabilidad máxima de cometer un error de tipo I. A dicha probabilidad se la suele denotar con la letra griega α. • Lo más usual es que al principio uno establezca cuál es el valor de α que desea aplicar en la prueba. A la probabilidad máxima de cometer un error de tipo II se le denota con la letra griega β.

1. Test de Hipótesis: Tipos de error al tomar una decisión Ejemplo 1: Se

1. Test de Hipótesis: Tipos de error al tomar una decisión Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito Los datos pueden refutarla. • H 0: Hipótesis nula – Es inocente La que se acepta si las pruebas no indican lo contrario. Rechazarla por error tiene graves consecuencias. • H 1: Hipótesis alternativa – Es culpable No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior. 7

1. Test de Hipótesis: Tipos de error al tomar una decisión Realidad Inocente OK

1. Test de Hipótesis: Tipos de error al tomar una decisión Realidad Inocente OK Culpable Error Menos grave Veredicto Culpable Error OK Muy grave 8

1. Test de Hipótesis: Tipos de error al tomar una decisión Ejemplo 2: Se

1. Test de Hipótesis: Tipos de error al tomar una decisión Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal • H 0: Hipótesis nula No especulativa – (Ej. 1) Es inocente – (Ej. 2) El nuevo tratamiento no tiene efecto – (Ej. 3) No hay nada que destacar • H 1: Hipótesis alternativa – (Ej. 1) Es culpable – (Ej. 2) El nuevo tratamiento es útil – (Ej. 3) Hay una situación anormal Especulativa 9

1. Test de Hipótesis Terminología: el intervalo de confianza que se construye se denomina

1. Test de Hipótesis Terminología: el intervalo de confianza que se construye se denomina la región de aceptación y el o las áreas por fuera de ella se conocen como regiones críticas, o de rechazo. Por último, los límites inferior y superior de la región de aceptación se denominan valores críticos. Deseable: minimizar los errores tipo I y tipo II. Pero, para cualquier tamaño de muestra dado, no es posible minimizar ambos simultáneamente. Es preferible tener baja probabilidad de cometer un error de tipo I y luego tratar de minimizar al máximo la probabilidad de incurrir en un error de tipo II.

1. Test de Hipótesis • Un test de hipótesis se llama bilateral (o de

1. Test de Hipótesis • Un test de hipótesis se llama bilateral (o de dos colas) cuando la hipótesis alternativa involucra el signo “≠” para el parámetro que se somete a prueba. Región de aceptación 1 - - z /2 + z /2

1. Test de Hipótesis • Un test de hipótesis se llama unilateral (o de

1. Test de Hipótesis • Un test de hipótesis se llama unilateral (o de una cola) cuando la hipótesis alternativa involucra el signo “<” (test unilateral izquierdo) o bien el signo “>” (test unilateral derecho). Unilateral izquierdo H 1: m < 40 Unilateral derecho H 1: m > 40

1. Test de Hipótesis: Método del intervalo de confianza Dado que tenemos a está

1. Test de Hipótesis: Método del intervalo de confianza Dado que tenemos a está distribuido como , podemos inferir que el estadístico de prueba Entonces, si conocemos la distribución de probabilidades de , ¿cómo establecemos si un intervalo de confianza de para , basado en este último, contiene al planteo de nuestra hipótesis nula? Veamos los pasos a seguir: 1. Puesto que 2. Entonces, de la tabal de distribución normal se sabe que: , se cumple que:

1. Test de Hipótesis: Método del intervalo de confianza 3. Reordenando y sustituyendo términos

1. Test de Hipótesis: Método del intervalo de confianza 3. Reordenando y sustituyendo términos da: Éste es un intervalo de confianza al para. Lo único que se debe hacer es ver si se encuentra en este intervalo. Si se encuentra no podemos rechazar la hipótesis nula, en caso contrario sí.

1. Test de Hipótesis: Método del intervalo de confianza Terminología: • • Nivel de

1. Test de Hipótesis: Método del intervalo de confianza Terminología: • • Nivel de significancia : probabilidad de cometer un error de tipo I. Potencia de la prueba: dado que la probabilidad de un error tipo II está representada por , la probabilidad de no cometerlo se denomina de esta última forma (entiéndase como la capacidad de rechazar una hipótesis nula falsa). P-value de un estadístico de prueba: • También conocido como nivel exacto de significancia, es el nivel más bajo de significancia al cual puede rechazarse una hipótesis nula.

1. Test de Hipótesis: Método de la prueba de significancia • Inversamente, dado que

1. Test de Hipótesis: Método de la prueba de significancia • Inversamente, dado que en cualquier aplicación dada, conocemos tanto a y n, pero los verdaderos valores de y no se conocen. Si es especificado, y asumimos un valor determinado de mediante la hipótesis nula, podemos calcular un estadístico Z, Y consultar en la tabla de la distribución qué probabilidad asociada tiene. La idea clave es el estadístico de prueba y su distribución de probabilidad bajo el valor supuesto. La prueba se conoce como prueba Z. Cuando se dice que un estadístico de prueba es significativo, quiere decirse que se puede rechazar la hipótesis nula.

1. Test de Hipótesis • A fin de realizar un test de hipótesis sobre

1. Test de Hipótesis • A fin de realizar un test de hipótesis sobre un parámetro poblacional, es recomendable seguir los siguientes 5 pasos: P 1. Emitir una hipótesis nula (H 0) relativa a algún parámetro de la población. La hipótesis debe involucrar alguno de los signos “=”, “≥” o “≤”, pero no puede involucrar ninguno de los signos “<”, “>”, ni tampoco “≠”. P 2. Especificar un nivel de significación α a emplear. Lo convencional es emplear los niveles del 5% ( α = 0, 05) o del 1% ( α = 0, 01). P 3. Extraer de la población una muestra aleatoria de tamaño n, y calcular el estadístico de prueba apropiado (z, t, etc. ). P 4. Comparar el valor numérico obtenido para el estadístico de prueba con un valor tabulado (valor crítico - z*, t*, etc. -) de la distribución estadística teórica correspondiente. P 5. Decidir si se rechaza o no la hipótesis nula.

1. Test de Hipótesis • Veamos dos casos de tests para la media poblacional

1. Test de Hipótesis • Veamos dos casos de tests para la media poblacional 1 - Los paquetes de harina marca XYZ de medio kilogramo afirman contener en su etiqueta un contenido neto de 500 gr. Supongamos que deseamos evaluar dicha afirmación a partir de nuestra creencia de que los paquetes contienen menor cantidad de harina. Para ello, se eligen al azar 50 paquetes y se los pesa con una balanza de precisión, obteniendo los siguientes datos muestrales: Planteamos entonces la hipótesis nula y alternativa: Para la realización del test, usaremos un nivel de significación del α = 0, 05.

1. Test de Hipótesis Aunque desconocemos cómo se distribuye el peso de los paquetes,

1. Test de Hipótesis Aunque desconocemos cómo se distribuye el peso de los paquetes, por tratarse de una muestra grande (n > 30) usaremos la distribución normal estándar a fin de hallar nuestro valor crítico. Para un nivel de significación de 0, 05 la tabla correspondiente arroja un valor de z* = -1, 645.

1. Test de Hipótesis El estadístico que utilizaremos es: Reemplazando en el mismo por

1. Test de Hipótesis El estadístico que utilizaremos es: Reemplazando en el mismo por los datos del ejercicio se obtiene que: Dado que -1, 645 < -1, 6444, el valor calculado del estadístico de prueba no alcanza a caer en zona de rechazo. Por lo tanto, al nivel de significación del 5% no se puede rechazar la hipótesis nula. Es decir, no existen argumentos para afirmar que los paquetes de harina XYZ contienen (en promedio) menos que lo anunciado en sus etiquetas.

1. Test de Hipótesis • Supongamos que ahora deseamos realizar un test de hipótesis

1. Test de Hipótesis • Supongamos que ahora deseamos realizar un test de hipótesis relativo a la varianza o la desviación estándar poblacionales. Para ello, deberemos usar el estadístico de prueba llamado chi−cuadrado muestral, definido como sigue: • En un test unilateral a la derecha (o de cola derecha), la hipótesis nula será: y la hipótesis alternativa será: • Para un nivel de significación α, la región de rechazo se busca en tablas de la distribución chi−cuadrada con ν = n − 1 grados de libertad.

1. Test de Hipótesis • En cambio, en un test unilateral a la izquierda

1. Test de Hipótesis • En cambio, en un test unilateral a la izquierda (o de cola izquierda), la hipótesis nula es: o bien , y la hipótesis alternativa es: Por último, para un test bilateral (o de dos colas), se tiene: y la hipótesis alternativa es:

1. Test de Hipótesis • Veamos un ejemplo. Supongamos que estamos analizando el tiempo

1. Test de Hipótesis • Veamos un ejemplo. Supongamos que estamos analizando el tiempo (en minutos) de espera de los clientes en la ventanilla de un banco. Antes de un curso de capacitación para los empleados de atención al público se sabía que la desviación estándar era 2, 3 minutos. Luego del curso de capacitación, el tiempo de espera de 10 clientes tomados al azar fue de: 1, 8; 5, 2; 4, 3; 6, 6; 2, 5; 3, 4; 2, 6; 5, 6; 4, 7 y 4, 0. Por lo tanto: con α = 0, 05. ¿Sirvió el curso de capacitación para disminuir la varianza de los tiempos de espera?

1. Test de Hipótesis De los datos muestrales, hallamos que S = 1, 5166

1. Test de Hipótesis De los datos muestrales, hallamos que S = 1, 5166 minutos. A primera vista podríamos sospechar que el curso sí sirvió, pero veamos: el valor crítico para la distribución chi−cuadrado con 9 grados de libertad es de 3, 32. Si reemplazamos en el estadístico de prueba por los datos del ejercicio, obtendremos que: Por lo tanto, no existe suficiente evidencia estadística en contra de la hipótesis H 0, así que se concluye que probablemente el curso de capacitación no sirvió para disminuir la varianza de manera perceptible (o significativa).

2. Propiedades de los estimadores: muestras pequeñas • Insesgamiento – • Mínima Varianza –

2. Propiedades de los estimadores: muestras pequeñas • Insesgamiento – • Mínima Varianza – • Un estimador es insesgado si el valor esperado del mismo es igual al parámetro a estimar, es decir, Se dice que un estimador es de mínima varianza del parámetro, si la varianza del mismo es menor igual que la del resto de los estimadores. Linealidad – Un estimador es lineal con respecto al parámetro, si es una función lineal de las observaciones muestrales. Así, por ejemplo la media muestral definida como es un estimador lineal de X.

2. Propiedades de los estimadores: muestras pequeñas • Mejor estimador lineal insesgado – •

2. Propiedades de los estimadores: muestras pequeñas • Mejor estimador lineal insesgado – • Si es lineal, es insesgado y tiene mínima varianza entre todos los estimadores lineales e insesgados de , entonces se denomina MELI. Error Medio Cuadrático (EMC) – Definimos al EMC de un estimador Haciendo contraste con la varianza de como , la cual está definida como Esta última mide la dispersión de la distribución de alrededor de su media, mientras que EMC mide la dispersión alrededor del verdadero valor del parámetro. El criterio es buscar un estimador cuyo EMC sea el menor en un conjunto de estimadores comparables.

2. Propiedades de los estimadores: muestras grandes • Insesgamiento asintótico – • Se dice

2. Propiedades de los estimadores: muestras grandes • Insesgamiento asintótico – • Se dice que es un estimador consistente si se aproxima al verdadero valor de medida que el tamaño de la muestra aumenta. a Eficiencia asintótica – • es asintóticamente insesgado si Consistencia – • Un estimador Si es consistente y su varianza asintótica es menor que la varianza asintótica de todos los demás estimadores consistentes de , entonces es llamado asintóticamente eficiente. Normalidad asintótica – Se dice que un estimador está normalmente distribuido asintóticamente si su distribución muestral tiende a aproximarse a la distribución normal a medida que el tamaño de la muestra aumenta de manera indefinida