Anlisis de los datos La descripcin de los
- Slides: 33
Análisis de los datos: La descripción de los datos
Una vez ordenados y clasificados, los datos obtenidos pueden ser objeto de descripción estadística Como los datos varían mucho, el reflejo de estos cambios en las variables y atributos se muestra en sus valores y modalidades a lo largo de la población o muestra Estas variaciones se especifican en distribuciones de frecuencia y en porcentajes y pueden representarse gráficamente La esencia de la Estadística radica en: reducir, describir y medir los datos referentes a las variaciones y relaciones entre variables
Estadística de variables Distribuciones de frecuencia: Cuando se obtienen valores de una variable o las modalidades de un atributo por el “número de veces” en que se presentan en todas las unidades estudiadas Estás distribuciones se presentan descritas en tablas, que pueden contener y presentar casos de frecuencias para una sola o más variables Las frecuencias de una sola variable pueden ser de tres tipos: pocas observaciones, muchas observaciones pero distribuidas en pocos valores y muchas observaciones y muchos valores
Familiares condenados Número % 1 98 49. 0 2 67 33. 5 3 25 12. 5 4 7 3. 5 5 3 1. 5 TOTAL 200 100. 0 Delincuentes distribuidos por el número de familiares condenados una vez
Cuando hablamos de la frecuencia estamos trabajando con porcentajes El porcentaje se calcula a partir de una frecuencia y de su proporción: la proporción es el cociente de dividir un sumando por el total y multiplicarlo por 100 Con los porcentajes se observa más fácilmente el nivel de representatividad de una frecuencia Con los mismos datos podemos trabajar por frecuencias acumuladas, con ellas se forma una distribución de datos. Los datos se presentan no por el número de veces en que se distribuyen en cada valor de la variable sino con relación “al número de observaciones que corresponden a un valor y a todos los anteriores a él”
Familiares condenados Número % Hasta 1 98 49. 0 Hasta 2 165 82. 5 Hasta 3 190 95 Hasta 4 197 98. 5 Hasta 5 200 100 Delincuentes de frecuencias acumuladas y porcentajes del número de familiares de delincuentes condenados una vez
Los límites de la variable se puede también expresar por el límite superior de cada intervalo. Así, según los datos sobre los familiares de delincuentes condenados, también pueden expresarse eliminando el límite superior de cada intervanlo
Familiares condenados Número Menos de 2 98 Menos de 3 165 Menos de 4 190 Menos de 5 197 Menos de 6 200 Distribución de frecuencia acumulada de familiares de delincuentes condenados una vez
La acumulación puede expresarse en sentido creciente o decreciente. Los datos de las Tablas 2 y 3 están descritos en forma creciente Este tipo de frecuencias acumuladas también se efectúa cuando la variable tiene muchas observaciones y muchos valores distintivos. Estos valores se agrupan en clases formándose los intervalos La elaboración de los grupos de valores se ha de realizar reduciendo las informaciones para que revelen las características importantes de la distribución. En ello surgen distintos problemas:
1. Fijar el número de clases o grupos de valores, que dependen de las características de la variable. Se evitará el excesivo detalles así como el poco detalle. El criterio será utilitario: aquel número que sea suficiente para ser manejable y exprese las características de la variable. 2. Fijar los intervalos: a) Fijar los extremos de la variable; b) Dividir las expresiones de la variable en tantas partes o intervalos como clases quieran observarse
3. El intervalo tiene dos límites: uno superior y otro inferior, que definen al intervalo en sí mismo y a su amplitud Se han de fijar los límites de los intervalos. Un problema consiste en evitar que el límite superior y el inferior de dos intervalos contiguos estén expresados por el mismo valor De 4 a 8 De 8 a 12 De 12 a 16 Una solución es De 4 a 7, 99 De 8 a 11, 99 De 12 a 15, 99
Otra cuestión en este punto es el de los intervalos mal especificados Intervalos Poblaciones Penitenciarías Ante de 12 años 38 4 De 12 a 16 45 14 De 17 a 21 17 7 Después de 21 6 2 Total 106 27 Antes de 12 y después de 21 no está limitados y no se puede calcular su amplitud
4. Amplitud de los intervalos pueden ser de la misma amplitud o puede ser variable, ya que lo más importante es que la estadística obtenida exprese lo más fielmente posible las características de la variable estudiada Intervalos Prisión 1 Condenas Prisión 2 preventi Hasta 2 años 45 10 De 2 y 1 día a 6 35 1 De 6 y 1 día a 10 15 0 De 10 y 1 día a 17 1 0 De 17 y 1 día a 30 5 0 De 30 y 1 día a 40 1 0 TOTAL 102 11
Se forman estadísticas de dos variables cuando en cada unidad estudiada se observan la relación de dos variables, de modo que se obtienen parejas de valores. Los datos resultantes se han de describir de modo que se exprese la ligación de los dos valores de la pareja Hay tres métodos estadísticos que describen esta relación de variables:
1. Para las variables de pocas observaciones la tabla se forma poniendo los pares de valores en dos columnas, una para cada variable haciendo corresponder las parejas de valores, de tal forma que las columnas pueden colocarse en el orden que se quiere.
Edad en años (9 sujetos) Número de condenas 21 2 22 2 25 2 27 3 28 4 29 2 32 2 39 4
2. Para las variables en que hay muchos pares de valores pero pocas parejas de valores distintas, se forma una tabla donde hay tres columnas: dos columnas para las parejas distintas y una tercera para las frecuencias de las observaciones
Edad en años Número de condenas Número de reincidentes 21 2 25 22 2 18 23 7 35 25 2 41 29 2 30 34 3 9 35 2 24 42 3 18 TOTAL 200
3. El número de observaciones puede ser muy elevado y el número de parejas distintas también. Efectuada la reducción de datos se presenta en una tabla de doble entrada. Puede ocurrir que ambas variables tomen muchos valores distintos o que los tome sólo una, en este caso se presentará a intervalos
En una muestra de 800 se requiere ver la relación entre años de escolaridad y salario Años de escolaridad Salarios mensuales De 18 -30 De 30 -60 De 60 -100 Unidades de muestra 6 años 143 59 0 202 8 años 96 170 32 298 10 años 0 123 56 179 12 años 0 17 104 121 TOTAL 239 369 192 800
Con las estadísticas de más de dos variables se pretenden conocer la relación que liga más de dos variables, hasta un conjunto de ellas. Ejemplo: los gastos mensuales de una familia es una variable que está relacionada con: ingresos familiares, número de hijos, edad de los hijos, nivel de precios. En un estudio que se consideren las relaciones de influencia de tales variables los datos se pueden presentar en tablas en las que no cabe el formato de doble entrada como hemos mostrado antes. Además se ha de distinguir entre variables que tengan pocas observaciones, con muchos o pocos valores, y variables donde hay muchas unidades de estuido
En el primer caso se elabora una tabla con tantas columnas como variables, descritas estas ya sea en todos sus datos o ya sea en intervalos. En esta tabla cada fila corresponde a unidad. En el segundo caso los datos se presentan describiendo las unidades por el procedimiento de agregación, es decir, agrupar los elementos de población por modalidades de atributo o valores de una variable en estudio. Los datos se presentan también en tantas columnas como variables se relacionen.
Estadística de atributos En los atributos las observaciones de las unidades de la población o de la muestra que se estudia se reúnen en modalidades. Un primer problema es la definición de las modalidades, ya que en muchos atributos éstas son formadas por el investigador según el criterio de la investigación dependiendo de la opción teórica y conceptual. Hay atributos cuyas modalidades son conocidas (sexo: varón y hembra), pero cuando hay que trabajar con actitudes y comportamientos las modalidades han de ser elaboradas comprendiendo todas las características del atributo y después se pueden cuantificar
Cuando las actitudes, comportamiento, percepciones, opiniones, se expresan en conceptos y se analizan de este modo, entonces se elaboran las tablas para los atributos Cuando la modalidad del atributo se expresa en un número de atributo pasa a ser una variable. Con relación a la presentación estadística se ha de distinguir entre: un atributo, dos atributos y más de dos, así como ver las estadísticas mixtas: combinación de atributo y variable
En las estadísticas de un atributo los datos se presentan en una tabla de dos columnas, en una las modalidades del atributo y en la otra las modalidades de observación Ortodoxia religiosa (atributo) Frecuencias Porcentaje Práctica y creencia 101 50, 50 Práctica sin creencia 42 21, 00 Creencia sin práctica 12 6, 00 Agnósticos 30 19, 50 Sin religión 6 3, 00 205 100 TOTAL
En las estadísticas de dos atributos se estudia el grado de dependencia entre dos atributos. Los datos se presentan al igual que en las variables por una tabla de doble entrada Tipos de actitud Hombres Mujeres Total Númer o % Número % Permisividad 630 70, 79 830 61, 39 1460 65, 12 Tolerancia 127 14, 27 181 13, 39 308 13, 74 Punición social 129 14, 49 297 21, 97 426 19, 00 Punición legal 4 0, 45 44 3, 25 48 2, 18 890 100 1352 100 2242 100 TOTAL
En las estadísticas de más de dos atributos se ha de ver la ligación entre todas ellas Ejemplo: relación que existe en las zonas de marginación entre la falta de escolaridad, el tipo de trabajo, un ingreso escaso o nulo y lo que produce un alto nivel de conductas muy perseguidas por las instancias de control Escolaridad, Trabajo, Ingreso, hábitat y conducta controlada pueden ser traducidas a atributos Es muy difícil presentar toda esta interrelación en tablas en las que se puedan incluir todas las posibilidades de cada atributo
Clasificación de la población por el sexo, el trabajo, el hábitat y control Sexo Trabajo marginado Hábitat Miseria Hombre Mujer TOTAL No Miseria Trabajo no marginado Hábitat Miseria No Miseria Total Delincuente 80 5 13 98 No delincuent 13 23 85 121 Delincuente 63 8 4 75 No delincuent 3 42 92 137 159 78 194 431
Análisis de las variables: una variable - los promedios - Moda - Media aritmética ponderada - Mediana - ¿problema con los intervalos?
Dispersión Desviación estándar y recorrido y el coeficiente de variación
Representaciones gráficas Diagrama de barras Muchas observaciones y pocos valores Histograma Cuando la variable se reduce en intervalos por haber muchas observaciones y muchos valores, si los intervalos son de amplitud constante. También sirve para los atributos con la única diferencia de que no hay continuidad entre las modalidades del atributo
Nube de puntos En estadísticas de dos variables en las que se clasifican parejas de valores, uno de una variable y otro de la otra, su representación gráfica se lleva a cabo por la denominada nube de puntos, que se efectúa sobre un par de ejes rectangulares y se coloca en cada uno una variable Pirámide Para representaciones gráficas de una población. Los intervalos pueden tener distinta amplitud pero se exigirá una corrección
Curvas o distribuciones campaniformes Los histogramas se suelen sustituir por una línea curva Las distribuciones (curva) pueden ser simétricas, moderadamente asimétrica y si gnificativamente asimétricas
- Descripción informativa ejemplos
- Tipos de polimetros
- Estrategia maxi maxi ejemplos
- Foda mini maxi
- Anlisis financiero
- Master memfi
- Ambientales
- Anlisis foda
- Direktang sipi
- Dato objetivo en enfermeria
- Que son los datos profesionales
- Auth_030
- Solo en dios confio los demas traigan datos
- Escribe los siguientes datos
- El calamar curioso
- Los datos objetivos
- Cuales son los datos personales
- Sobre de carta partes
- Timoteo 3 16
- Desventajas de los datos secundarios
- Como trabajar los unos los dieces y los cienes
- Triage cardiaco
- Bases de datos post-relacionales
- Ddl y dml ejemplos
- Tuning en base de datos
- Atributos de departamento
- Instrumentos de recolección de datos
- Teoria de la elasticidad sophie germain
- Firolux
- Sistema discreto e continuo
- Datos de un cheque
- Bases de datos conceptos
- Datos objetivos y subjetivos de enfermería
- Procesador de consultas base de datos