ESTADSTICA 1 ESTADSTICA UNIDIMENSIONAL ESTADSTICA BIDIMENSIONAL 2 http
ESTADÍSTICA 1
• ESTADÍSTICA UNIDIMENSIONAL • ESTADÍSTICA BIDIMENSIONAL 2
http: //campusvirtual. uma. es/est_fisio/apuntes/#tema 0 http: //campusvirtual. uma. es/est_fisio/apuntes/ficheros/estad_uma_01. ppt http: //campusvirtual. uma. es/est_fisio/apuntes/ficheros/estad_uma_02. ppt http: //www. sectormatematica. cl/media/estad. htm 3
ESTADÍSTICA UNIDIMENSIONAL q CARACTERÍSTICAS q VARIABLES ESTADÍSTICAS q GRÁFICOS q MEDIDAS DE CENTRALIZACIÓN q MEDIDAS DE DISPERSIÓN q comparación 4
INTRODUCCIÓN • Desde las civilizaciones más antiguas existe la idea de tener censados los recursos y las personas. • Se conocen censos realizados en China sobre el año 2238 a. C. • En Egipto se censaban las riquezas, y en Roma se realizaron censos del número de habitantes y su distribución por el territorio. • En 1662, el inglés Graunt publicó un estudio sobre los datos de mortalidad de Londres. Nacía así la nueva ciencia que se llama Estadística 5
• La Estadística, que en principio se definió como “la ciencia de las cosas que pertenecen al Estado”, hoy se entiende como una ciencia que estudia los fenómenos sociales, económicos y físicos a partir de datos numéricos. • Resuelve problemas sobre comportamientos de grupos de población, cálculos de pólizas de seguros, fiabilidad de tratamientos médicos, tendencias políticas, … 6
La Estadística Descriptiva trata de describir y analizar algunos caracteres de los individuos de un grupo dado (población) sin extraer conclusiones para un grupo mayor. Para este estudio se dan los siguientes pasos: • Selección del carácter que vamos a estudiar. • Diseño de la encuesta o del experimento y recogida de datos. • Clasificación y organización de los resultados en tablas de frecuencias. • Elaboración de un gráfico. • Obtención de parámetros: valores numéricos que resumen la información. La Estadística Inferencial trabaja con muestras y pretende, a partir de ellas, “inferir” características de toda la población. Para ello hay que elegir bien la muestra y estudiar el grado de 7 confianza que puede tener el resultado obtenido.
VARIABLES ESTADÍSTICAS Variable es una característica (cualidad, magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio. Clasificación de las variables Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser: Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Ejemplo: el peso (2. 3 kg, 2. 4 kg, 2. 5 kg. . . ) o la 8 altura (1. 64 m, 1. 65 m, 1. 66 m. . . ), …
Una vez seleccionado el carácter (variable estadística) que vamos a estudiar, diseñamos la encuesta y, una vez hecha, procedemos al recuento de datos y a su análisis. RECUENTO DE DATOS Los datos obtenidos se ordenan en forma de tablas , llamadas de distribución de frecuencias. TABLA DE FRECUENCIAS Una tabla de frecuencias será el lugar donde quedarán ordenados los distintos datos. Para ello dispondremos una tabla en la que aparecerán las siguientes columnas: Primer columna (xi) Frecuencia absoluta (ni): valores que puede tomar la variable estadística Número de veces que se repite dicho valor 9
Organización de los datos : En forma individual, es decir contar dato por dato. En forma agrupada, contando por grupos de datos. La elección mas conveniente, de ordenación de los datos depende de la cantidad y rango de datos, del tipo de variable, etc. En el caso de una variable estadística continua, los valores se agrupan en conjuntos de números entre dos limites dados, a estos conjuntos de números se les llama clases. Para poder hacer el análisis de los datos, se calculan los puntos medios de cada clase, que se llaman marcas de clase. 10
Número de hijos que tienen 140 parejas seleccionadas en una ciudad TABLA DE FRECUENCIAS Número de hijos Cantidad de parejas 0 3 1 2 3 4 5 6 18 45 43 20 7 4 DIAGRAMA DE BARRAS (Se trata de una variable cuantitativa discreta) 11
Reparto, según el tipo de trabajo, de los 14500000 trabajadores que había en España en 2001 TABLA DE FRECUENCIAS SECTOR DE PRODUCCIÓN Nº DE TRABAJADO RES Agricultura 1 000 Industria 4 500 000 Servicios 9 000 Se trata de una variable estadística cualitativa Columna de las frecuencias absolutas 12
Número de hijos que tienen 140 parejas seleccionadas en una ciudad TABLA DE FRECUENCIAS Valores que toma la variable estadística (Xi) Frecuencia con la que toma los valores Xi (ni) DIAGRAMA DE BARRAS Se trata de una variable estadística cuantitativa discreta 13
Número de hijos que tienen 140 parejas seleccionadas en una ciudad TABLA DE FRECUENCIAS Número de hijos Cantidad de parejas Porcentaje Xi ni % 0 3 2, 1 1 18 12, 9 2 45 32, 1 3 43 30, 7 4 20 14, 3 5 7 5, 0 6 4 2, 9 140 100 DIAGRAMA DE SECTORES La suma de las frecuencias (n) debe coíncidir con el nº de encuestados, y la suma de los porcentajes debe ser 100. 14
TURISMO EN ARAGÓ N Hoteles Hostales/ Pensiones Huesca 8. 570 5. 011 2. 909 18. 202 Teruel 2. 522 2. 868 1. 351 1. 506 Zaragoza 8. 044 3. 618 361 3. 593 TOTAL 19. 136 11. 497 4. 621 23. 301 Casas Rurales Campings www. aragob. es/culytur/turismo. htm OTRA REPRESENTACIÓN DE DATOS 15
16
Luz Gas Agua Familia Arce $ 12. 500 $ 18. 900 $ 7. 800 Familia Bruna $ 31. 000 $ 24. 900 $ 16. 600 Familia Cobo $ 8. 000 $ 12. 000 $ 10. 800 Familia Duna $ 27. 000 $ 33. 100 $ 21. 600 Tablas de Datos La tabla nos muestra los consumos básicos de 5 familias. Gráficos Los gráficos permiten visualizar mejor la información obtenida al recolectar los datos. 17
Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o cualitativa Polígono de frecuencias formado por líneas poligonales en un sistema de ejes cartesianos. Gráficos de sectores: circulares o de tarta, dividen un círculo en porciones proporcionales según el valor de las frecuencias. §Histogramas: formas especiales de diagramas de barras para distribuciones 18 cuantitativas continuas.
Cartogramas: expresiones gráficas a modo de mapa. Pictogramas: o representaciones visuales figurativas. En realidad son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable. 19
gráficas de datos Pirámides de población: para clasificaciones de grupos de población por sexo y edad. PIRÁMIDE DE EDADES PICTOGRAMA 20
21
GRÁFICO QUE MUESTRA EL NÚMERO DE PROFESORAS Y PROFESORES EN CUATRO PAÍSES. 22
23
24
La estadística descriptiva es una ciencia que analiza series de datos y trata de extraer conclusiones sobre el comportamiento de estas variables. (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) 25
CUALITATIVAS VARIABLES ESTADÍSTICAS No se pueden medir numéricamente CUANTITATIVAS tienen valor numérico (edad, precio de un producto, ingresos anuales). por ejemplo: nacionalidad, color de la piel, sexo, …. DISCRETAS sólo pueden tomar valores enteros CONTÍNUAS pueden tomar cualquier valor real dentro de un intervalo VARIABLES ESTADÍSTICAS Unidimensional sólo recogen información sobre una característica Bidimensional recogen información sobre dos características de la población Por ejemplo: número de hermanos (puede ser 1, 2, 3. . , etc, ) Por ejemplo, la velocidad de un vehículo puede ser 80, 3 km/h, 94, 57 km/h. . . etc. por ejemplo: edad de los alumnos de una clase por ejemplo: edad y altura de los alumnos de una clase 26
Conceptos estadísticos • Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. • Población: conjunto de todos los individuos (personas, objetos, animales, etc. ) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. • Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo 27 (muestra) que se entienda que es suficientemente representativo.
Lanzamos un dado 40 veces y obtenemos: 1 6 1 4 5 6 2 3 2 4 2 6 6 5 1 2 6 5 3 4 1 6 2 4 6 1 4 6 3 4 2 6 4 3 5 5 2 1 5 3 Variable cuantitativa discreta Procedemos al recuento de los datos recogidos Xii Recuento 1 2 3 frecuencia absoluta fi fi frecuenci a relativa fri porcentaje frecuencia absoluta acumulada frecuencia relativa acumulada % Fi Fri la 6 columna 0, 15 Rellenamos la columna Es lade suma de las frecuencias Es la relativas suma 7 de las 0, 18 17, 5 13 0, 33 frecuencias absolutas Rellenamos lafrecuencia columna de cada (La frecuencia relativa 6 5 4 7 5 6 6 9 40 (La absoluta frecuencia 0, 13 frecuencia 18 0, 45 de los porcentajes Se 12, 5 obtiene dividiendo absoluta es el número de veces relativa (Basta multiplicar su 17, 5 frecuencia con 25 las absoluta frecuencias 0, 18 0, 63 que la variable por toma un la con las cien por número total valor) frecuencias 0, 15 determinado 15 elcolumna 31 absolutas 0, 78 anterior) de individuos) anteriores relativas 0, 23 22, 5 40 1 anteriores 1 100 28
Lanzamos un dado 40 veces y obtenemos: DIAGRAMAS DE BARRAS Y POLÍGONO DE FRECUENCIAS 29
PARÁMETROS DE CENTRALIZACIÓN Informan sobre los valores medios de la serie de datos. a) Media aritmética: La media de varias cantidades es la suma de todas ellas dividida por el número de ellas. MEDIA: b) Moda (Mo): La moda es el dato con mayor frecuencia. c) Mediana (Me): La mediana es el dato que ocupa el lugar central una vez ordenados todos los datos. Si hay dos valores centrales, se asigna la mediana a la media de ambos valores. 30
Preguntamos a los alumnos de una clase el número de suspensos en la primera evaluación, y reflejamos los resultados en la siguiente tabla: TABLA DE FRECUENCIAS DIAGRAMA DE SECTORES La mayor de las frecuencias es 10 Que corresponde al valor 0. La MODA ES 0 La mitad de los alumnos tienen 1 suspenso o menos y la otra mitad 2 o más Que corresponde al valor 1. La MEDIANA ES 1’ 5 31
Preguntamos a los alumnos de una clase el número de suspensos en la primera evaluación, y reflejamos los resultados en la siguiente tabla: TABLA DE FRECUENCIAS VARIABLE CUANTITATIVA DISCRETA MEDIDAS DE CENTRALIZACIÓN MODA (El valor mas frecuente): Mo=0 MEDIANA(el valor central una vez ordenados los datos): 0, 0, 0, 1, 1, 2, 2, 2, 3, 3, 4, 4, 5, 5, 5 MEDIA: 32
Agrupar en una tabla las 160, 168, 175, 183, 170, 175, 186, 187, 164, 173, 167, 174, 176, 178, siguientes estaturas: 164, 170, 184, 171, 168, 187, 161, 183, 165, 175, 162, 188, 169, 163, 166, 172, 179, 177 DISTRIBUCIÓN DE FRECUENCIAS Es el punto medio del intervalo VARIABLE CUANTITATIVA CONTINUA Calcula los productos correspondientes suma MEDIANA: Me=172’ 5 MODA: MO=177’ 5 MEDIA: 33
Se pregunta a 40 estudiantes cuál de los siguientes deportes prefiere practicar: baloncesto(B), balonvolea(V), fútbol(F), tenis(T), ajedrez (A). Resultados: F F B F F F A F B T V F F F A B B F F A B F F B F B B T F F B B F T T A VARIABLE CUALITATIVA MEDIA: Carece de sentido en el caso de variables cualitativas MEDIANA: Carece de sentido MODA: MO=Fútbol 34
Medidas de posición no central Permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. 35
Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. En cada una de las siguientes distribuciones halla Q 1, Me=Q 2, y Q 3. Q 1=3’ 5 A. 1, 2, 3, 3, 4, 4, 4, 5, 5, 6, 6, 6, 7, 8, 9, 10. M =5 e El 25% de la población está por debajo de 3’ 5, el 50% está por debajo de 5 y el 75% por debajo de 6’ 5 Q 3=6’ 5 B. 1, 3, 3, 4, 5, 5, 6, 7, 8, 8, 9, 10, 11, 12, 13, 16 Q 1=5 Me=8 Q 3=11 C. 1, 1, 1, 2, 2, 5, 5, 5, 20 Q 1=1 Me=1 Q 3=5 36
Medidas de dispersión 1. - Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. 2. - Desviación media: Es la media de las distancias de los distintos valores a la media. 3. - Varianza: Mide la distancia existente entre los valores de la serie y la media. 4. - Desviación típica: Se calcula como raíz cuadrada de la varianza. 5. - Coeficiente de varización de Pearson: se calcula como cociente entre la desviación típica y la media. 37
Desviación media(1) Calcula el rango o recorrido y la desviación media en la siguiente distribución: 1, 2, 2, 4, 5, 6, 7, 9, 9, 9, 10, 10, 10. = 10 – 1 = 9 MEDIA: DESVIACIÓN MEDIA: Moda: 9 Mediana: 9 38
Desviación media(2) Calcula el rango o recorrido y la desviación media en la siguiente distribución: 1, 1, 1, 2, 2, 3, 4, 5, 6, 6, 7, 7, 8, 9, 9, 9. RANGO=9 – 1= 8 MEDIA: DESVIACIÓN MEDIA: Mediana: 5, 5 Moda: 1 y 9 (Bimodal) 39
Estadística con Excel Calcula la media de los ejercicios que has realizado hasta ahora con la calculadora, utilizando todas las teclas adecuadas. 40
Necesidad de las medidas de dispersión Poner ejemplos 41
42
Variable estadística cuantitativa discreta Tabla , Medidas de centralización y medidas de dispersión Siguiendo con el mismo ejemplo Completar la tabla para Rango Desviacion media Varianza desviacion típica 43
Cómo hacerlo con Excel Poner un hipervínculo en la página anterior ¿Copiar el resultado y la gráfica aquí? 44
Fórmula abreviada de la desviación típica 45
Variable estadística cuantitativa discreta Tabla , Medidas de centralización y medidas de dispersión Siguiendo con el mismo ejemplo Completar la tabla pero con la fórmula abreviada para Rango Desviacion media Varianza pero con la fórmula abreviada desviacion típica 46
Cómo hacerlo con Excel Poner un hipervínculo en la página anterior ¿Copiar el resultado y la gráfica aquí? 47
Variable estadística cuantitativa contínua Tabla , Medidas de centralización y representación gráfica Ejempo Tabla Intervalos de clase Marca de clase Histograma-polígono de frecuencias Media Moda Mediana 48
Variable estadística cuantitativa contínua Tabla , Medidas de centralización y medidas de dispersión Siguiendo con el mismo ejemplo Completar la tabla para Rango Desviacion media Varianza desviacion típica 49
Cómo hacerlo con Excel Poner un hipervínculo en la página anterior ¿Copiar el resultado y la gráfica aquí? 50
Comparando dos poblaciones 51
ESTADÍSTICA BIDIMENSIONAL q casos y cosas q FORMA DE DAR LOS DATOS q DIAGRAMAS DE DISPERSIÓN q COVARIANZA q INDICE DE CORRELACIÓN DE PEARSON 52
• http: //www. estadisticarsanchez. com/C C_02_Ej. Pr. VBidimi. pdf • http: //www. vitutor. com/estadistica/bi/dis tribuciones_bidimensionales. html • http: //centros. edu. xunta. es/iesaslagoas /metodosesta/0 documentos/T 02_bidim ensional_03. pdf 53
- Slides: 53