Inferencia Estadstica Tema 7 Ignacio Cascos Depto Estadstica





















































- Slides: 53
Inferencia Estadística Tema 7 Ignacio Cascos Depto. Estadística, Universidad Carlos III 1
Descripción breve del tema 1. Introducción 2. Intervalos de Confianza n Determinación del tamaño muestral 3. Contrastes de hipótesis n n n Ignacio Cascos Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares Depto. Estadística, Universidad Carlos III 2
Objetivos o Estudio de la estimación mediante conjuntos, los Intervalos de Confianza. o Realización de contrastes de hipótesis estadísticas con niveles de significación fijados de antemano y mediante p-valores. Ignacio Cascos Depto. Estadística, Universidad Carlos III 3
Descripción breve del tema 1. Introducción 2. Intervalos de Confianza n Determinación del tamaño muestral 3. Contrastes de hipótesis n n n Ignacio Cascos Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares Depto. Estadística, Universidad Carlos III 4
Introducción Una hipótesis es cualquier afirmación con la que expresamos una creencia sobre una distribución poblacional. Un contraste de hipótesis es una prueba estadística que nos indica si debemos rechazar (o no) tales afirmaciones a partir de las observaciones de una muestra. A partir de una muestra, construiremos también estimadores que toman como valor un intervalo. Ignacio Cascos Depto. Estadística, Universidad Carlos III 5
Descripción breve del tema 1. Introducción 2. Intervalos de Confianza n Determinación del tamaño muestral 3. Contrastes de hipótesis n n n Ignacio Cascos Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares Depto. Estadística, Universidad Carlos III 6
Intervalos de Confianza Dada una probabilidad 1 -a fijada de antemano podemos construir un intervalo a partir de la información que nos proporciona una muestra aleatoria X 1, X 2, …, Xn y que contiene un parámetro q con probabilidad 1 -a. Obtenemos un Intervalo de Confianza con nivel de confianza 1 -a sustituyendo los estimadores de q por su estimación. o Ignacio Cascos Depto. Estadística, Universidad Carlos III 7
Intervalos de Confianza Construcción de un IC, método del pivote. El objetivo es buscar dos estadísticos, tales que o Partimos de un estimador de q con distribución conocida, si es Normal, tenemos Ignacio Cascos Depto. Estadística, Universidad Carlos III 8
Intervalos de Confianza o Un IC para el parámetro q al nivel de confianza 1 -a construido a partir de un estadístico con distribución normal tendrá la forma donde P(Z > za/2) = a/2 para Z~N(0, 1). Ignacio Cascos Depto. Estadística, Universidad Carlos III 9
Intervalos de Confianza o Determinación del tamaño muestral. En general, un IC para q puede escribirse como donde a y b dependen de El nivel de confianza ; 2. La varianza del estimador de q ; 3. El tamaño muestral afecta a la varianza del estimador. 1. Ignacio Cascos Depto. Estadística, Universidad Carlos III 10
Intervalos de Confianza Determinación del tamaño muestral. Fijado un nivel de error en la estimación del parámetro (equiv. la amplitud del IC), podemos calcular el tamaño muestral. Basta resolver la ecuación a+b = A , donde A es la amplitud deseada del IC. o Ignacio Cascos Depto. Estadística, Universidad Carlos III 11
Descripción breve del tema 1. Introducción 2. Intervalos de Confianza n Determinación del tamaño muestral 3. Contrastes de hipótesis n n n Ignacio Cascos Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares Depto. Estadística, Universidad Carlos III 12
Contrastes de Hipótesis Mediante un contraste de hipótesis, contrastamos una afirmación sobre la población a partir de una muestra. o La afirmación queremos contrastar recibe el nombre de hipótesis nula (H 0) n “la duración media de un analgésico es m 0”, H 0: m = m 0 No rechazamos la hipótesis nula, salvo que haya una fuerte evidencia en contra suya. Ignacio Cascos Depto. Estadística, Universidad Carlos III 13
Contrastes de Hipótesis o La hipótesis alternativa (H 1) es lo que ocurre cuando no ocurre H 0 n n H 1: m ¹ m 0 H 1: m < m 0 Para rechazar la hipótesis nula (y quedarnos con la alternativa), los datos han de mostrar una gran evidencia a favor de H 1. Ignacio Cascos Depto. Estadística, Universidad Carlos III 14
Contrastes de Hipótesis o Tipos de hipótesis n n o Simples: especifican un valor único del parámetro H 0: m = m 0 Compuestas: el parámetro puede tomar varios valores H 0: m ³ m 0 Tipos de contrastes n n Ignacio Cascos Bilaterales: nos interesan valores a dcha. e izq. de uno fijo H 0: m = m 0 ; H 1: m ¹ m 0 Unilaterales: sólo nos interesan los valores a un lado H 0: m = m 0 ; H 1: m < m 0 equiv. a H 0: m ³ m 0 ; H 1: m < m 0 Depto. Estadística, Universidad Carlos III 15
Contrastes de Hipótesis o Si deseamos garantizar algo, debemos ponerlo en la hipótesis alternativa. n o Ante un enunciado del tipo “¿Podemos afirmar que la media poblacional es superior a m 0? ” planteamos: H 0: m = m 0 ; H 1: m > m 0 Si nos planteamos el refutar algo, debemos ponerlo en la hipótesis nula (su contrario en la alternativa). n Ante un enunciado del tipo “El fabricante afirma que la media es m 0, ¿podemos refutar esa afirmación? ” planteamos: H 0: m = m 0 ; H 1: m ¹ m 0 Ignacio Cascos Depto. Estadística, Universidad Carlos III 16
Contrastes de Hipótesis o Tipos de errores n n Ignacio Cascos Error de Tipo I: Se rechaza la hipótesis nula (H 0) cuando es cierta, a = P(Error Tipo I) = P(rechazo H 0|H 0) es el error más grave. Error de Tipo II: No se rechaza la hipótesis nula (H 0) cuando es falsa, b = P(Error Tipo II) = P(no rechazo H 0|H 1) este error es menos importante. Depto. Estadística, Universidad Carlos III 17
Metodología del contraste Etapas de un contraste de hipótesis: Antes de tomar la muestra 1. Definir la hipótesis nula y la alternativa. o Expresar en términos estadísticos nuestro problema. 2. Definir una medida de discrepancia entre las datos de la muestra y la hipótesis nula. Decidir cómo medir la distancia entre nuestra estimación y el valor del parámetro según H 0. Ignacio Cascos Depto. Estadística, Universidad Carlos III 18
Metodología del contraste 3. Decidir qué discrepancias consideramos inadmisibles. Decidir qué distancias entre la estimación y el parámetro (según H 0) son demasiado grandes. Una vez tomada la muestra 4. Calcular la estimación del parámetro y su discrepancia. Si la distancia de la estimación al valor del parámetro (según H 0) es grande, rechazamos H 0. Si es pequeña, no la rechazamos. Ignacio Cascos Depto. Estadística, Universidad Carlos III 19
Medida de la discrepancia o La discrepancia es una medida de la distancia del valor que toma el parámetro según la hipótesis nula a su estimador. La construcción de la discrepancia (cómo medimos la distancia) depende de la hipótesis alternativa del contraste. Ignacio Cascos Depto. Estadística, Universidad Carlos III 20
Medida de la discrepancia o En el contraste El signo de la discrepancia es irrelevante. o En el contraste La discrepancia será mayor cuanto mayor sea Ignacio Cascos Depto. Estadística, Universidad Carlos III 21
Región de rechazo Calculamos qué discrepancias resultan inadmisibles, qué distancias entre el parámetro (según H 0) y su estimación son demasiado grandes. Estas distancias vienen determinadas por el nivel de significación a. Este nivel de significación a es la máxima probabilidad de error de tipo I que estamos dispuestos a asumir. Habitualmente a =0’ 01 ó 0’ 05 o Ignacio Cascos Depto. Estadística, Universidad Carlos III 22
Región de rechazo Fijado a, tenemos P(rechazo H 0|H 0) = a Conocemos la distribución del estimador de q (bajo H 0) Dado el contraste H 0: q = q 0 ; H 1: q ¹ q 0 o Rechazamos H 0 si El valor c es el que determina la región de rechazo. Ignacio Cascos Depto. Estadística, Universidad Carlos III 23
Región de rechazo Dado el contraste H 0: q = q 0 ; H 1: q < q 0 Rechazamos H 0 si Ignacio Cascos Depto. Estadística, Universidad Carlos III 24
Resolución del contraste o o Para resolver el contraste, calculamos la estimación del parámetro q , calculamos su discrepancia respecto de q 0 y la comparamos con el valor crítico obtenido para el nivel de significación a fijado de antemano. Si la estimación de q está dentro de la región de rechazo, hay evidencia suficiente para rechazar H 0 Si la estimación de q está fuera de la región de rechazo, no hay evidencia suficiente para rechazar H 0 Un contraste es estadísticamente significativo si el resultado experimental discrepa más de lo tolerado a priori. Ignacio Cascos Depto. Estadística, Universidad Carlos III 25
p-valor El p-valor es el mayor nivel de significación para el que no se rechaza la hipótesis nula, o equiv. , el nivel crítico que se corresponde con un valor crítico igual a la discrepancia observada p-valor = P(discrepancia mayor que observada|H 0) Es la probabilidad de tener una muestra peor que la que tenemos, supuesta cierta la hipótesis nula. Ignacio Cascos Depto. Estadística, Universidad Carlos III 26
p-valor Cuanto menor sea el p-valor, mayor grado de evidencia tenemos en contra de la hipótesis nula. Si el p-valor es 0’ 05 ó menor suele rechazarse H 0 Dado el contraste H 0: q = q 0 ; H 1: q < q 0 Buscamos el valor de a cuando c toma el valor de la estimación en la muestra que tenemos. Ignacio Cascos Depto. Estadística, Universidad Carlos III 27
p-valor Dado el contraste H 0: q = q 0 ; H 1: q ¹ q 0 Buscamos el valor de a cuando c (ó -c) toma el valor de la estimación en la muestra que tenemos Ignacio Cascos Depto. Estadística, Universidad Carlos III 28
Relación entre ICs y Contrastes o Dado un contraste bilateral H 0: q = q 0 ; H 1: q ¹ q 0 con nivel de significación a, se rechaza la hipótesis nula si q 0 no pertenece al Intervalo de Confianza con nivel de confianza 1 -a obtenido para q. Ignacio Cascos Depto. Estadística, Universidad Carlos III 29
Contrastes particulares o Contraste para la media de una población normal o muestra grande con varianza conocida n n Hipótesis nula. H 0: m = m 0 Hipótesis alternativa. H 1: m ¹ m 0 o n Hipótesis alternativa. H 1: m < m 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m > m 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 30
Intervalos de Confianza particulares o Intervalo de Confianza para la media de una población normal o a partir de una muestra grande con varianza conocida. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 31
Contrastes particulares o Contraste para proporción n Hipótesis nula. H 0: p = p 0 n Hipótesis alternativa. H 1: p ¹ p 0 o Rechazo H 0 cuando n Hipótesis alternativa. H 1: p < p 0 o Rechazo H 0 cuando n Hipótesis alternativa. H 1: p > p 0 o Rechazo H 0 cuando Ignacio Cascos Depto. Estadística, Universidad Carlos III 32
Intervalos de Confianza particulares o Intervalo de Confianza para una proporción. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 33
Contrastes particulares o Contraste para la media de una población normal con varianza desconocida n n Hipótesis nula. H 0: m = m 0 Hipótesis alternativa. H 1: m ¹ m 0 o n Hipótesis alternativa. H 1: m < m 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m > m 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 34
Intervalos de Confianza particulares o Intervalo de Confianza para la media de una población normal con varianza desconocida. con un nivel de confianza 1 -a , donde P(X > tn, a) = a Ignacio Cascos si X~tn Depto. Estadística, Universidad Carlos III 35
Contrastes particulares o Contraste para la varianza de una población normal n n Hipótesis nula. H 0: s 2 = s 02 Hipótesis alternativa. H 1: s 2 ¹ s 02 o n Hipótesis alternativa. H 1: s 2 < s 02 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: s 2 > s 02 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 36
Intervalos de Confianza particulares o Intervalo de Confianza para la varianza de una población normal. con un nivel de confianza 1 -a , donde P(X > c 2 n, a) = a Ignacio Cascos si X~c 2 n Depto. Estadística, Universidad Carlos III 37
Contrastes particulares o Contraste para la igualdad de medias de dos poblaciones normales con varianzas conocidas n n Hipótesis nula. H 0: m 1 = m 2 Hipótesis alternativa. H 1: m 1 ¹ m 2 o n Hipótesis alternativa. H 1: m 1 < m 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m 1 > m 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 38
Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas conocidas. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 39
Contrastes particulares o Contraste para la igualdad de proporciones de dos poblaciones (muestras independientes) n n Hipótesis nula. H 0: p 1 = p 2 Hipótesis alternativa. H 1: p 1 ¹ p 2 o n Hipótesis alternativa. H 1: p 1 < p 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: p 1 > p 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 40
Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de proporciones de dos poblaciones (muestras independientes). con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 41
Contrastes particulares o Contraste para la igualdad de medias de dos poblaciones normales con varianzas desconocidas y distintas (muestras independientes) n Hipótesis nula. H 0: m 1 = m 2 n Hipótesis alternativa. H 1: m 1 ¹ m 2 o n Hipótesis alternativa. H 1: m 1 < m 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m 1 > m 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 42
Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y distintas. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 43
Contrastes particulares o Contraste para la igualdad de medias de dos poblaciones normales con varianzas desconocidas pero iguales n n Hipótesis nula. H 0: m 1 = m 2 Hipótesis alternativa. H 1: m 1 ¹ m 2 o n Hipótesis alternativa. H 1: m 1 < m 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m 1 > m 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 44
Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales. con un nivel de confianza 1 -a , donde P(X > tn, a) = a Ignacio Cascos si X~tn Depto. Estadística, Universidad Carlos III 45
Contrastes particulares o Contraste para la igualdad de medias en dos poblaciones normales con varianza desconocida (muestras relacionadas), d = x 1 -x 2 n Hipótesis nula. H 0: md = 0 n Hipótesis alternativa. H 1: md ¹ 0 o n Hipótesis alternativa. H 1: md < 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: md > 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 46
Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianza desconocida (muestras relacionadas). con un nivel de confianza 1 -a , donde P(X > tn, a) = a Ignacio Cascos si X~tn Depto. Estadística, Universidad Carlos III 47
Contrastes particulares o Contraste para la igualdad de varianzas de dos poblaciones normales n n Hipótesis nula. H 0: s 12 = s 22 Hipótesis alternativa. H 1: s 12 ¹ s 22 o n Hipótesis alternativa. H 1: s 12 < s 22 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: s 12 > s 22 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 48
Intervalos de Confianza particulares o Intervalo de Confianza para el cociente de varianzas de dos poblaciones normales. con un nivel de confianza 1 -a , donde P(X > Fn 1 -1, n 2 -1, a) = a Fn 2 -1, n 1 -1, 1 -a = 1/Fn 1 -1, n 2 -1, a Ignacio Cascos si X~ Fn 1 -1, n 2 -1 Depto. Estadística, Universidad Carlos III 49
Contrastes particulares o Contraste aproximado para el EMV n n Hipótesis nula. H 0: q = q 0 Hipótesis alternativa. H 1: q ¹ q 0 o n Hipótesis alternativa. H 1: q < q 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: q > q 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 50
Intervalos de Confianza particulares o Intervalo de Confianza aproximado para un EMV. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 51
Contrastes particulares o Contraste para la Poisson (basado en EMV) n n Hipótesis nula. H 0: l = l 0 Hipótesis alternativa. H 1: l ¹ l 0 o n Hipótesis alternativa. H 1: l < l 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: l > l 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 52
Intervalos de Confianza particulares o Intervalo de Confianza aproximado para la l de una Poisson (basado en EMV). con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 53