Inferencia Estadstica Tema 7 Ignacio Cascos Depto Estadstica

Inferencia Estadística Tema 7 Ignacio Cascos Depto. Estadística, Universidad Carlos III 1

Descripción breve del tema 1. Introducción 2. Intervalos de Confianza n Determinación del tamaño

Objetivos o Estudio de la estimación mediante conjuntos, los Intervalos de Confianza. o Realización

Introducción Una hipótesis es cualquier afirmación con la que expresamos una creencia sobre una

Intervalos de Confianza Dada una probabilidad 1 -a fijada de antemano podemos construir un

Intervalos de Confianza Construcción de un IC, método del pivote. El objetivo es buscar

Intervalos de Confianza o Un IC para el parámetro q al nivel de confianza

Intervalos de Confianza o Determinación del tamaño muestral. En general, un IC para q

Intervalos de Confianza Determinación del tamaño muestral. Fijado un nivel de error en la

Contrastes de Hipótesis Mediante un contraste de hipótesis, contrastamos una afirmación sobre la población

Contrastes de Hipótesis o La hipótesis alternativa (H 1) es lo que ocurre cuando

Contrastes de Hipótesis o Tipos de hipótesis n n o Simples: especifican un valor

Contrastes de Hipótesis o Si deseamos garantizar algo, debemos ponerlo en la hipótesis alternativa.

Contrastes de Hipótesis o Tipos de errores n n Ignacio Cascos Error de Tipo

Metodología del contraste Etapas de un contraste de hipótesis: Antes de tomar la muestra

Metodología del contraste 3. Decidir qué discrepancias consideramos inadmisibles. Decidir qué distancias entre la

Medida de la discrepancia o La discrepancia es una medida de la distancia del

Medida de la discrepancia o En el contraste El signo de la discrepancia es

Región de rechazo Calculamos qué discrepancias resultan inadmisibles, qué distancias entre el parámetro (según

Región de rechazo Fijado a, tenemos P(rechazo H 0|H 0) = a Conocemos la

Región de rechazo Dado el contraste H 0: q = q 0 ; H

Resolución del contraste o o Para resolver el contraste, calculamos la estimación del parámetro

p-valor El p-valor es el mayor nivel de significación para el que no se

p-valor Cuanto menor sea el p-valor, mayor grado de evidencia tenemos en contra de

p-valor Dado el contraste H 0: q = q 0 ; H 1: q

Relación entre ICs y Contrastes o Dado un contraste bilateral H 0: q =

Contrastes particulares o Contraste para la media de una población normal o muestra grande

Intervalos de Confianza particulares o Intervalo de Confianza para la media de una población

Contrastes particulares o Contraste para proporción n Hipótesis nula. H 0: p = p

Intervalos de Confianza particulares o Intervalo de Confianza para una proporción. con un nivel

Contrastes particulares o Contraste para la media de una población normal con varianza desconocida

Contrastes particulares o Contraste para la varianza de una población normal n n Hipótesis

Intervalos de Confianza particulares o Intervalo de Confianza para la varianza de una población

Contrastes particulares o Contraste para la igualdad de medias de dos poblaciones normales con

Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de

Contrastes particulares o Contraste para la igualdad de proporciones de dos poblaciones (muestras independientes)

Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de proporciones de

Contrastes particulares o Contraste para la igualdad de medias en dos poblaciones normales con

Contrastes particulares o Contraste para la igualdad de varianzas de dos poblaciones normales n

Intervalos de Confianza particulares o Intervalo de Confianza para el cociente de varianzas de

Contrastes particulares o Contraste aproximado para el EMV n n Hipótesis nula. H 0:

Intervalos de Confianza particulares o Intervalo de Confianza aproximado para un EMV. con un

Contrastes particulares o Contraste para la Poisson (basado en EMV) n n Hipótesis nula.

Intervalos de Confianza particulares o Intervalo de Confianza aproximado para la l de una

Slides: 53

Download presentation

Inferencia Estadística Tema 7 Ignacio Cascos Depto. Estadística, Universidad Carlos III 1

Descripción breve del tema 1. Introducción 2. Intervalos de Confianza n Determinación del tamaño muestral 3. Contrastes de hipótesis n n n Ignacio Cascos Generalidades de los contrastes Metodología del contraste Región de rechazo y p-valor Relación entre ICs y contrastes de hipótesis Algunos contrastes particulares Depto. Estadística, Universidad Carlos III 2

Objetivos o Estudio de la estimación mediante conjuntos, los Intervalos de Confianza. o Realización de contrastes de hipótesis estadísticas con niveles de significación fijados de antemano y mediante p-valores. Ignacio Cascos Depto. Estadística, Universidad Carlos III 3

Introducción Una hipótesis es cualquier afirmación con la que expresamos una creencia sobre una distribución poblacional. Un contraste de hipótesis es una prueba estadística que nos indica si debemos rechazar (o no) tales afirmaciones a partir de las observaciones de una muestra. A partir de una muestra, construiremos también estimadores que toman como valor un intervalo. Ignacio Cascos Depto. Estadística, Universidad Carlos III 5

Intervalos de Confianza Dada una probabilidad 1 -a fijada de antemano podemos construir un intervalo a partir de la información que nos proporciona una muestra aleatoria X 1, X 2, …, Xn y que contiene un parámetro q con probabilidad 1 -a. Obtenemos un Intervalo de Confianza con nivel de confianza 1 -a sustituyendo los estimadores de q por su estimación. o Ignacio Cascos Depto. Estadística, Universidad Carlos III 7

Intervalos de Confianza Construcción de un IC, método del pivote. El objetivo es buscar dos estadísticos, tales que o Partimos de un estimador de q con distribución conocida, si es Normal, tenemos Ignacio Cascos Depto. Estadística, Universidad Carlos III 8

Intervalos de Confianza o Un IC para el parámetro q al nivel de confianza 1 -a construido a partir de un estadístico con distribución normal tendrá la forma donde P(Z > za/2) = a/2 para Z~N(0, 1). Ignacio Cascos Depto. Estadística, Universidad Carlos III 9

Intervalos de Confianza o Determinación del tamaño muestral. En general, un IC para q puede escribirse como donde a y b dependen de El nivel de confianza ; 2. La varianza del estimador de q ; 3. El tamaño muestral afecta a la varianza del estimador. 1. Ignacio Cascos Depto. Estadística, Universidad Carlos III 10

Intervalos de Confianza Determinación del tamaño muestral. Fijado un nivel de error en la estimación del parámetro (equiv. la amplitud del IC), podemos calcular el tamaño muestral. Basta resolver la ecuación a+b = A , donde A es la amplitud deseada del IC. o Ignacio Cascos Depto. Estadística, Universidad Carlos III 11

Contrastes de Hipótesis Mediante un contraste de hipótesis, contrastamos una afirmación sobre la población a partir de una muestra. o La afirmación queremos contrastar recibe el nombre de hipótesis nula (H 0) n “la duración media de un analgésico es m 0”, H 0: m = m 0 No rechazamos la hipótesis nula, salvo que haya una fuerte evidencia en contra suya. Ignacio Cascos Depto. Estadística, Universidad Carlos III 13

Contrastes de Hipótesis o La hipótesis alternativa (H 1) es lo que ocurre cuando no ocurre H 0 n n H 1: m ¹ m 0 H 1: m < m 0 Para rechazar la hipótesis nula (y quedarnos con la alternativa), los datos han de mostrar una gran evidencia a favor de H 1. Ignacio Cascos Depto. Estadística, Universidad Carlos III 14

Contrastes de Hipótesis o Tipos de hipótesis n n o Simples: especifican un valor único del parámetro H 0: m = m 0 Compuestas: el parámetro puede tomar varios valores H 0: m ³ m 0 Tipos de contrastes n n Ignacio Cascos Bilaterales: nos interesan valores a dcha. e izq. de uno fijo H 0: m = m 0 ; H 1: m ¹ m 0 Unilaterales: sólo nos interesan los valores a un lado H 0: m = m 0 ; H 1: m < m 0 equiv. a H 0: m ³ m 0 ; H 1: m < m 0 Depto. Estadística, Universidad Carlos III 15

Contrastes de Hipótesis o Si deseamos garantizar algo, debemos ponerlo en la hipótesis alternativa. n o Ante un enunciado del tipo “¿Podemos afirmar que la media poblacional es superior a m 0? ” planteamos: H 0: m = m 0 ; H 1: m > m 0 Si nos planteamos el refutar algo, debemos ponerlo en la hipótesis nula (su contrario en la alternativa). n Ante un enunciado del tipo “El fabricante afirma que la media es m 0, ¿podemos refutar esa afirmación? ” planteamos: H 0: m = m 0 ; H 1: m ¹ m 0 Ignacio Cascos Depto. Estadística, Universidad Carlos III 16

Contrastes de Hipótesis o Tipos de errores n n Ignacio Cascos Error de Tipo I: Se rechaza la hipótesis nula (H 0) cuando es cierta, a = P(Error Tipo I) = P(rechazo H 0|H 0) es el error más grave. Error de Tipo II: No se rechaza la hipótesis nula (H 0) cuando es falsa, b = P(Error Tipo II) = P(no rechazo H 0|H 1) este error es menos importante. Depto. Estadística, Universidad Carlos III 17

Metodología del contraste Etapas de un contraste de hipótesis: Antes de tomar la muestra 1. Definir la hipótesis nula y la alternativa. o Expresar en términos estadísticos nuestro problema. 2. Definir una medida de discrepancia entre las datos de la muestra y la hipótesis nula. Decidir cómo medir la distancia entre nuestra estimación y el valor del parámetro según H 0. Ignacio Cascos Depto. Estadística, Universidad Carlos III 18

Metodología del contraste 3. Decidir qué discrepancias consideramos inadmisibles. Decidir qué distancias entre la estimación y el parámetro (según H 0) son demasiado grandes. Una vez tomada la muestra 4. Calcular la estimación del parámetro y su discrepancia. Si la distancia de la estimación al valor del parámetro (según H 0) es grande, rechazamos H 0. Si es pequeña, no la rechazamos. Ignacio Cascos Depto. Estadística, Universidad Carlos III 19

Medida de la discrepancia o La discrepancia es una medida de la distancia del valor que toma el parámetro según la hipótesis nula a su estimador. La construcción de la discrepancia (cómo medimos la distancia) depende de la hipótesis alternativa del contraste. Ignacio Cascos Depto. Estadística, Universidad Carlos III 20

Medida de la discrepancia o En el contraste El signo de la discrepancia es irrelevante. o En el contraste La discrepancia será mayor cuanto mayor sea Ignacio Cascos Depto. Estadística, Universidad Carlos III 21

Región de rechazo Calculamos qué discrepancias resultan inadmisibles, qué distancias entre el parámetro (según H 0) y su estimación son demasiado grandes. Estas distancias vienen determinadas por el nivel de significación a. Este nivel de significación a es la máxima probabilidad de error de tipo I que estamos dispuestos a asumir. Habitualmente a =0’ 01 ó 0’ 05 o Ignacio Cascos Depto. Estadística, Universidad Carlos III 22

Región de rechazo Fijado a, tenemos P(rechazo H 0|H 0) = a Conocemos la distribución del estimador de q (bajo H 0) Dado el contraste H 0: q = q 0 ; H 1: q ¹ q 0 o Rechazamos H 0 si El valor c es el que determina la región de rechazo. Ignacio Cascos Depto. Estadística, Universidad Carlos III 23

Región de rechazo Dado el contraste H 0: q = q 0 ; H 1: q < q 0 Rechazamos H 0 si Ignacio Cascos Depto. Estadística, Universidad Carlos III 24

Resolución del contraste o o Para resolver el contraste, calculamos la estimación del parámetro q , calculamos su discrepancia respecto de q 0 y la comparamos con el valor crítico obtenido para el nivel de significación a fijado de antemano. Si la estimación de q está dentro de la región de rechazo, hay evidencia suficiente para rechazar H 0 Si la estimación de q está fuera de la región de rechazo, no hay evidencia suficiente para rechazar H 0 Un contraste es estadísticamente significativo si el resultado experimental discrepa más de lo tolerado a priori. Ignacio Cascos Depto. Estadística, Universidad Carlos III 25

p-valor El p-valor es el mayor nivel de significación para el que no se rechaza la hipótesis nula, o equiv. , el nivel crítico que se corresponde con un valor crítico igual a la discrepancia observada p-valor = P(discrepancia mayor que observada|H 0) Es la probabilidad de tener una muestra peor que la que tenemos, supuesta cierta la hipótesis nula. Ignacio Cascos Depto. Estadística, Universidad Carlos III 26

p-valor Cuanto menor sea el p-valor, mayor grado de evidencia tenemos en contra de la hipótesis nula. Si el p-valor es 0’ 05 ó menor suele rechazarse H 0 Dado el contraste H 0: q = q 0 ; H 1: q < q 0 Buscamos el valor de a cuando c toma el valor de la estimación en la muestra que tenemos. Ignacio Cascos Depto. Estadística, Universidad Carlos III 27

p-valor Dado el contraste H 0: q = q 0 ; H 1: q ¹ q 0 Buscamos el valor de a cuando c (ó -c) toma el valor de la estimación en la muestra que tenemos Ignacio Cascos Depto. Estadística, Universidad Carlos III 28

Relación entre ICs y Contrastes o Dado un contraste bilateral H 0: q = q 0 ; H 1: q ¹ q 0 con nivel de significación a, se rechaza la hipótesis nula si q 0 no pertenece al Intervalo de Confianza con nivel de confianza 1 -a obtenido para q. Ignacio Cascos Depto. Estadística, Universidad Carlos III 29

Contrastes particulares o Contraste para la media de una población normal o muestra grande con varianza conocida n n Hipótesis nula. H 0: m = m 0 Hipótesis alternativa. H 1: m ¹ m 0 o n Hipótesis alternativa. H 1: m < m 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m > m 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 30

Intervalos de Confianza particulares o Intervalo de Confianza para la media de una población normal o a partir de una muestra grande con varianza conocida. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 31

Contrastes particulares o Contraste para proporción n Hipótesis nula. H 0: p = p 0 n Hipótesis alternativa. H 1: p ¹ p 0 o Rechazo H 0 cuando n Hipótesis alternativa. H 1: p < p 0 o Rechazo H 0 cuando n Hipótesis alternativa. H 1: p > p 0 o Rechazo H 0 cuando Ignacio Cascos Depto. Estadística, Universidad Carlos III 32

Intervalos de Confianza particulares o Intervalo de Confianza para una proporción. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 33

Contrastes particulares o Contraste para la media de una población normal con varianza desconocida n n Hipótesis nula. H 0: m = m 0 Hipótesis alternativa. H 1: m ¹ m 0 o n Hipótesis alternativa. H 1: m < m 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m > m 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 34

Intervalos de Confianza particulares o Intervalo de Confianza para la media de una población normal con varianza desconocida. con un nivel de confianza 1 -a , donde P(X > tn, a) = a Ignacio Cascos si X~tn Depto. Estadística, Universidad Carlos III 35

Contrastes particulares o Contraste para la varianza de una población normal n n Hipótesis nula. H 0: s 2 = s 02 Hipótesis alternativa. H 1: s 2 ¹ s 02 o n Hipótesis alternativa. H 1: s 2 < s 02 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: s 2 > s 02 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 36

Intervalos de Confianza particulares o Intervalo de Confianza para la varianza de una población normal. con un nivel de confianza 1 -a , donde P(X > c 2 n, a) = a Ignacio Cascos si X~c 2 n Depto. Estadística, Universidad Carlos III 37

Contrastes particulares o Contraste para la igualdad de medias de dos poblaciones normales con varianzas conocidas n n Hipótesis nula. H 0: m 1 = m 2 Hipótesis alternativa. H 1: m 1 ¹ m 2 o n Hipótesis alternativa. H 1: m 1 < m 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m 1 > m 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 38

Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas conocidas. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 39

Contrastes particulares o Contraste para la igualdad de proporciones de dos poblaciones (muestras independientes) n n Hipótesis nula. H 0: p 1 = p 2 Hipótesis alternativa. H 1: p 1 ¹ p 2 o n Hipótesis alternativa. H 1: p 1 < p 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: p 1 > p 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 40

Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de proporciones de dos poblaciones (muestras independientes). con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 41

Contrastes particulares o Contraste para la igualdad de medias de dos poblaciones normales con varianzas desconocidas y distintas (muestras independientes) n Hipótesis nula. H 0: m 1 = m 2 n Hipótesis alternativa. H 1: m 1 ¹ m 2 o n Hipótesis alternativa. H 1: m 1 < m 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m 1 > m 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 42

Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas y distintas. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 43

Contrastes particulares o Contraste para la igualdad de medias de dos poblaciones normales con varianzas desconocidas pero iguales n n Hipótesis nula. H 0: m 1 = m 2 Hipótesis alternativa. H 1: m 1 ¹ m 2 o n Hipótesis alternativa. H 1: m 1 < m 2 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: m 1 > m 2 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 44

Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianzas desconocidas pero iguales. con un nivel de confianza 1 -a , donde P(X > tn, a) = a Ignacio Cascos si X~tn Depto. Estadística, Universidad Carlos III 45

Contrastes particulares o Contraste para la igualdad de medias en dos poblaciones normales con varianza desconocida (muestras relacionadas), d = x 1 -x 2 n Hipótesis nula. H 0: md = 0 n Hipótesis alternativa. H 1: md ¹ 0 o n Hipótesis alternativa. H 1: md < 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: md > 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 46

Intervalos de Confianza particulares o Intervalo de Confianza para la diferencia de medias de dos poblaciones normales con varianza desconocida (muestras relacionadas). con un nivel de confianza 1 -a , donde P(X > tn, a) = a Ignacio Cascos si X~tn Depto. Estadística, Universidad Carlos III 47

Contrastes particulares o Contraste para la igualdad de varianzas de dos poblaciones normales n n Hipótesis nula. H 0: s 12 = s 22 Hipótesis alternativa. H 1: s 12 ¹ s 22 o n Hipótesis alternativa. H 1: s 12 < s 22 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: s 12 > s 22 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 48

Intervalos de Confianza particulares o Intervalo de Confianza para el cociente de varianzas de dos poblaciones normales. con un nivel de confianza 1 -a , donde P(X > Fn 1 -1, n 2 -1, a) = a Fn 2 -1, n 1 -1, 1 -a = 1/Fn 1 -1, n 2 -1, a Ignacio Cascos si X~ Fn 1 -1, n 2 -1 Depto. Estadística, Universidad Carlos III 49

Contrastes particulares o Contraste aproximado para el EMV n n Hipótesis nula. H 0: q = q 0 Hipótesis alternativa. H 1: q ¹ q 0 o n Hipótesis alternativa. H 1: q < q 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: q > q 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 50

Intervalos de Confianza particulares o Intervalo de Confianza aproximado para un EMV. con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 51

Contrastes particulares o Contraste para la Poisson (basado en EMV) n n Hipótesis nula. H 0: l = l 0 Hipótesis alternativa. H 1: l ¹ l 0 o n Hipótesis alternativa. H 1: l < l 0 o n Rechazo H 0 cuando Hipótesis alternativa. H 1: l > l 0 o Ignacio Cascos Rechazo H 0 cuando Depto. Estadística, Universidad Carlos III 52

Intervalos de Confianza particulares o Intervalo de Confianza aproximado para la l de una Poisson (basado en EMV). con un nivel de confianza 1 -a , donde P(Z > za) = a si Z~N(0, 1) Ignacio Cascos Depto. Estadística, Universidad Carlos III 53