TEMA 1 DESCRIPCIN DE DATOS ESTADSTICA DESCRIPTIVA 1

  • Slides: 27
Download presentation
TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1. 1 Introducción: conceptos básicos 1. 2

TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1. 1 Introducción: conceptos básicos 1. 2 Tablas estadísticas y representaciones gráficas 1. 3 Características de variables estadísticas unidimensionales 1. 3. 1 Características de posición 1. 3. 2 Características de dispersión 1. 3. 3 Características de forma 1. 4 Análisis exploratorio de datos: gráfico de caja 1

v 1. 1. Introducción : conceptos básicos Ø ESTADÍSTICA: “Estudio de los métodos de

v 1. 1. Introducción : conceptos básicos Ø ESTADÍSTICA: “Estudio de los métodos de recogida y descripción de datos, así como del análisis de esta información” v Etapas de un estudio estadístico 1 2 3 4 Recogida de datos Ordenación, tabulación y gráficos* Descripción de características* Análisis formal * Estadística descriptiva: parte de la estadística que se ocupa de las etapas 2 y 3 v Individuo, Población, Muestra Ø Población: “Conjunto de elementos a los que se les estudia una característica” Ø Individuo: “Cada uno de los elementos de la población” Ø Muestra: “Subconjunto representativo de la población” 2

v Variables estadísticas. Modalidades Ø Variable estadística (v. e. ): ”Característica propia del individuo

v Variables estadísticas. Modalidades Ø Variable estadística (v. e. ): ”Característica propia del individuo objeto del estudio estadístico” Ejemplos: - Estatura - Salario - Color del pelo - Nivel de colesterol - Nº de hijos de una familia Ø Modalidad: “Cada una de las posibilidades o estados diferentes de una variable estadística” Ø Exhaustivas e incompatibles Ejemplo: color del pelo: - castaño - rubio - negro 3

v Tipos de variables estadísticas Ø Cualitativas: Las características no son cuantificables Ejemplos: Grupo

v Tipos de variables estadísticas Ø Cualitativas: Las características no son cuantificables Ejemplos: Grupo sanguineo Profesión Color del pelo Ø Cuantitativas: Características cuantificables o numéricas ü Discretas: Numéricas numerables Ejemplos: Nº de hijos de una familia Nº de nidos de procesionarias por árbol Nº de virus en un cultivo ü Continuas: Numéricas no numerables Ejemplos: Estatura Salario Nivel de colesterol 4

v 1. 2. Tablas estadísticas y representaciones gráficas Ø Variables discretas ü Frecuencias xi

v 1. 2. Tablas estadísticas y representaciones gráficas Ø Variables discretas ü Frecuencias xi ni x 1. . . xi. . . xk Ni fi Fi n 1 N 1 f 1 F 1. . . ni Ni fi Fi. . . nk Nk fk Fk n 1 Absolutas, ni Absolutas acumuladas, Ni Relativas fi = n i / n Relativas acumuladas Fi = Ni / n 5

Ø Variables continuas: Intervalos Intervalo I i x i e 0 – e 1.

Ø Variables continuas: Intervalos Intervalo I i x i e 0 – e 1. . . e i-1 – ei. . . e k -1 – ek x 1. . . xi. . . xk n i Ni fi Fi n 1. . . ni. . . nk f 1. . . fi. . . fk F 1. . . Fi. . . Fk n N 1. . . Ni. . . Nk 1 Ø Marca de clase xi (punto medio de cada intervalo) Ø Amplitud ai (distancia entre los extremos) Ø Intervalos cerrados por un extremo y abiertos por otro 6

v Gráficos estadísticos Ø V. E. Cualitativas: Gráfico rectangular Color Plumaje Nº de Aves

v Gráficos estadísticos Ø V. E. Cualitativas: Gráfico rectangular Color Plumaje Nº de Aves ( n i ) Negro 10 Gris 14 Blanco 20 Rojo 6 Violeta 4 54 20 10 Negro Gris Blanco Rojo Violeta 7

Ø V. E. Cualitativas: Gráfico de sectores Grados de un sector = 360 0

Ø V. E. Cualitativas: Gráfico de sectores Grados de un sector = 360 0 x fi Color Plumaje Nº de Aves ni fi Grados Negro 10 0, 185 66, 6 Gris 14 0, 259 93, 24 Blanco 20 0, 37 133, 2 Rojo 6 0, 111 39, 96 Violeta 4 0, 074 26, 64 54 violeta rojo blanco negro gris 8

Ø V. E. Discretas: Gráfico de barras Nº de crías Nº animales: n i

Ø V. E. Discretas: Gráfico de barras Nº de crías Nº animales: n i fi Fi 2 20 0. 20 3 30 0. 50 4 25 0. 75 5 15 0. 90 6 10 0. 10 1 n = 100 9

Ø V. E. Continuas: Histograma Estatura ni hi = ni / ai 140 –

Ø V. E. Continuas: Histograma Estatura ni hi = ni / ai 140 – 160 30 1. 5 160 – 170 22 2. 2 170 – 180 20 2 180 – 190 18 1. 8 190 – 200 10 1 100 hi 2. 2 Ø El área de cada rectángulo es proporcional a la frecuencia” 2 1, 8 1, 5 1 140 160 170 180 190 200 10

v 1. 3. Características de variables estadísticas unidimensionales 1. 3. 1 Características de Posición

v 1. 3. Características de variables estadísticas unidimensionales 1. 3. 1 Características de Posición v Media aritmética Estatura Nº Personas M. Clase ni xi 140 – 150 20 145 2900 150 – 160 100 15500 160 – 180 80 170 13600 180 – 200 10 1900 n = 210 33900 11

v Moda q Valor de la variable más frecuente ü Puede haber más de

v Moda q Valor de la variable más frecuente ü Puede haber más de una moda → Plurimodal Ø Variables discretas § Datos en serie 2, 2, 3, 3, 5, 6, 7 Mo = 3 § Datos en tabla ♦ Ejemplo xi 1 ni 34 2 36 3 45 4 22 5 17 Mo = 3 12

Ø Variables continuas xi ni hi = ni / ai 140 – 160 –

Ø Variables continuas xi ni hi = ni / ai 140 – 160 – 170 – 180 – 190 – 200 30 22 20 18 10 100 1. 5 2, 2 2 1, 8 1 ♦ Ejemplo Ø Observaciones: 1. Puede utilizarse la frecuencia relativa 2. Si las amplitudes son iguales, la moda se puede obtener directamente con las frecuencias 13

v Mediana q Valor de la variable que ocupa el lugar central en una

v Mediana q Valor de la variable que ocupa el lugar central en una serie de datos ordenados. § El 50% de los elementos de la población tienen un valor de la variable menor o igual que la mediana. El 50% de los elementos de la población tienen un valor de la variable mayor o igual que la mediana. Ø Variables discretas § Datos en serie § Nº impar de observaciones: 2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5 § Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9 → Me = 6 – 7 xi ni Ni 2 3 5 6 7 8 3 1 1 1 2 1 9 3 4 5 6 8 9 fi 0, 333 0, 111 0, 222 0, 111 1 Indeterminada entre 6 y 7 Fi 0, 333 0, 444 0, 555 0, 666 0, 888 0, 999 xi ni Ni 3 4 6 7 8 9 1 1 1 2 3 5 1 6 2 8 2 10 10 fi 0, 1 0, 3 0, 1 0, 2 1 Fi 0, 1 0, 2 0, 5 0, 6 0, 8 1 14

Ø Variables discretas § Datos en tabla ♦ Ejemplo xi ni Ni fi Fi

Ø Variables discretas § Datos en tabla ♦ Ejemplo xi ni Ni fi Fi 0 4 4 1 6 10 0. 142 0. 214 0. 142 0. 357 2 10 20 3 5 25 0. 357 0. 178 0. 714 0. 892 4 3 28 0. 107 1 28 n /2 = 14 Fi = 0, 5 Me = 2 1 Ø Observación: Si n / 2 coincide con un N i la mediana está indeterminada entre x i y x i+1 15

Ø Variables continuas ♦ Ejemplo Estatura ni Ni fi Fi 140 – 150 15

Ø Variables continuas ♦ Ejemplo Estatura ni Ni fi Fi 140 – 150 15 15 0. 15 150 – 160 30 45 0. 30 0. 45 160 – 170 25 70 0. 25 0. 70 170 – 180 20 90 0. 20 0. 90 180 – 200 10 100 0. 10 n/2 = 50 Fi = 0, 5 1 100 Ø Observación: Si n/2 coincide con un Ni la mediana es el extremo superior del intervalo que le corresponde 16

v Percentiles q Definición: Pk , k: 1, 2, . . . , 99,

v Percentiles q Definición: Pk , k: 1, 2, . . . , 99, “percentil k”, valor de la variable que deja por debajo, el k% de los valores de la variable Q 1 = P 25 Cuartil 1º Q 2 = P 50 Cuartil 2º = Me Q 3 = P 75 Cuartil 3º D 1 = P 10 Decil 1º D 2 = P 20 Decil 2º …. D 9 = P 90 Decil 9º § Cálculo para v. e. discretas: Igual que la mediana, cambiando: § Cálculo para v. e. continuas: 17

♦ Ejemplos percentiles v. e. discreta xi ni Ni 2 20 20 3 30

♦ Ejemplos percentiles v. e. discreta xi ni Ni 2 20 20 3 30 50 4 44 94 5 20 114 6 10 124 Percentil 40, P 40 = 3 Percentil 95, P 95 = 6 n k /100 = 124 x 25/100 = 31 Percentil 25, P 25 = 3 = Q 1 n k /100 = 124 x 50/100 = 62 Percentil 50, P 50 = 4 = Me = Q 2 n k /100 = 124 x 75/100 = 93 Percentil 75, P 75 = 4 = Q 3 18

♦ Ejemplos percentiles v. e. continua Tallas ni Ni fi Fi 140 -150 15

♦ Ejemplos percentiles v. e. continua Tallas ni Ni fi Fi 140 -150 15 15 0. 15 150 -160 30 45 0. 30 0. 45 160 -170 25 70 0. 25 0. 70 170 -180 20 90 0. 20 0. 90 180 -200 10 100 0. 10 1 100 19

 1. 3. 2. Características de Dispersión ü “Miden la Homogeneidad de las observaciones”

1. 3. 2. Características de Dispersión ü “Miden la Homogeneidad de las observaciones” v Rango o recorrido Ø Valor máximo menos valor mínimo de la variable v Recorrido intercuartílico Ø Q 3 – Q 1 20

v Varianza v Desviación típica v Coeficiente de variación 21

v Varianza v Desviación típica v Coeficiente de variación 21

♦ Ejemplo xi ni nixi 2 4 6 8 20 40 44 80 240

♦ Ejemplo xi ni nixi 2 4 6 8 20 40 44 80 240 352 320 1440 2816 10 12 36 22 162 360 264 1296 3600 3168 11344 22

v Momentos centrales (Respecto a la media) 23

v Momentos centrales (Respecto a la media) 23

 1. 3. 3 Características de forma v Coeficiente de Sesgo (Asimetría) ► Distribución

1. 3. 3 Características de forma v Coeficiente de Sesgo (Asimetría) ► Distribución simétrica ► Distribución sesgada a la derecha ► Distribución sesgada a la izquierda 24

v Coeficiente de Curtosis (Aplastamiento) ► Distribución igual de aplastada que la distribución Normal

v Coeficiente de Curtosis (Aplastamiento) ► Distribución igual de aplastada que la distribución Normal ► Distribución menos aplastada que la distribución Normal ► Distribución más aplastada que la distribución Normal 25

1. 4 Gráfico de caja v. a. i. mín F 1 f 1 v.

1. 4 Gráfico de caja v. a. i. mín F 1 f 1 v. a. s. Q 1 Me Q 3 f 2 F 2 máx f 1=Q 1 -1. 5(Q 3 -Q 1) frontera interior inferior f 2=Q 3+1. 5(Q 3 -Q 1) frontera interior superior F 1=Q 1 -3(Q 3 -Q 1) frontera exterior inferior F 2=Q 3+3(Q 3 -Q 1) frontera exterior superior V. A. I. = Dato más próximo, por exceso, a f 1 (valor adyacente inferior) V. A. S. =Dato más proximo, por defecto, a f 2 (valor adyacente superior) Valores atípicos o anómalos: Datos inferiores a f 1 ó superiores a f 2 (distinguiéndose) o ** anómalos * v. a. i. Q 1 Me Q 3 v. a. s o anómalos 26

Ejemplo Sea la variable estadística “nº de hijos”. Los datos de 30 familias son

Ejemplo Sea la variable estadística “nº de hijos”. Los datos de 30 familias son los siguientes: 1, 2, 0, 0, 2, 4, 3, 0, 1, 1, 1, 2, 3, 4, 8, 3, 0, 1, 1, 3, 2, 1, 0, 4, 10, 5, 1, 0, 2, 4 mín = 0 Datos ordenados: máx = 10 0000001111222223333444458 10 Q 1 = 1 Q 3 = 3 Me = 2 f 1 = -2 f 2 = 6 F 1 = -5 F 2 = 9 Vai = 0 Vas = 5 Valores anómalos = 8, 10 0 1 2 3 4 5 6 7 8 * 9 10 o 27