Anlisis de los datos La descripcin de los

  • Slides: 33
Download presentation
Análisis de los datos: La descripción de los datos

Análisis de los datos: La descripción de los datos

 Una vez ordenados y clasificados, los datos obtenidos pueden ser objeto de descripción

Una vez ordenados y clasificados, los datos obtenidos pueden ser objeto de descripción estadística Como los datos varían mucho, el reflejo de estos cambios en las variables y atributos se muestra en sus valores y modalidades a lo largo de la población o muestra Estas variaciones se especifican en distribuciones de frecuencia y en porcentajes y pueden representarse gráficamente La esencia de la Estadística radica en: reducir, describir y medir los datos referentes a las variaciones y relaciones entre variables

Estadística de variables Distribuciones de frecuencia: Cuando se obtienen valores de una variable o

Estadística de variables Distribuciones de frecuencia: Cuando se obtienen valores de una variable o las modalidades de un atributo por el “número de veces” en que se presentan en todas las unidades estudiadas Estás distribuciones se presentan descritas en tablas, que pueden contener y presentar casos de frecuencias para una sola o más variables Las frecuencias de una sola variable pueden ser de tres tipos: pocas observaciones, muchas observaciones pero distribuidas en pocos valores y muchas observaciones y muchos valores

Familiares condenados Número % 1 98 49. 0 2 67 33. 5 3 25

Familiares condenados Número % 1 98 49. 0 2 67 33. 5 3 25 12. 5 4 7 3. 5 5 3 1. 5 TOTAL 200 100. 0 Delincuentes distribuidos por el número de familiares condenados una vez

 Cuando hablamos de la frecuencia estamos trabajando con porcentajes El porcentaje se calcula

Cuando hablamos de la frecuencia estamos trabajando con porcentajes El porcentaje se calcula a partir de una frecuencia y de su proporción: la proporción es el cociente de dividir un sumando por el total y multiplicarlo por 100 Con los porcentajes se observa más fácilmente el nivel de representatividad de una frecuencia Con los mismos datos podemos trabajar por frecuencias acumuladas, con ellas se forma una distribución de datos. Los datos se presentan no por el número de veces en que se distribuyen en cada valor de la variable sino con relación “al número de observaciones que corresponden a un valor y a todos los anteriores a él”

Familiares condenados Número % Hasta 1 98 49. 0 Hasta 2 165 82. 5

Familiares condenados Número % Hasta 1 98 49. 0 Hasta 2 165 82. 5 Hasta 3 190 95 Hasta 4 197 98. 5 Hasta 5 200 100 Delincuentes de frecuencias acumuladas y porcentajes del número de familiares de delincuentes condenados una vez

 Los límites de la variable se puede también expresar por el límite superior

Los límites de la variable se puede también expresar por el límite superior de cada intervalo. Así, según los datos sobre los familiares de delincuentes condenados, también pueden expresarse eliminando el límite superior de cada intervanlo

Familiares condenados Número Menos de 2 98 Menos de 3 165 Menos de 4

Familiares condenados Número Menos de 2 98 Menos de 3 165 Menos de 4 190 Menos de 5 197 Menos de 6 200 Distribución de frecuencia acumulada de familiares de delincuentes condenados una vez

 La acumulación puede expresarse en sentido creciente o decreciente. Los datos de las

La acumulación puede expresarse en sentido creciente o decreciente. Los datos de las Tablas 2 y 3 están descritos en forma creciente Este tipo de frecuencias acumuladas también se efectúa cuando la variable tiene muchas observaciones y muchos valores distintivos. Estos valores se agrupan en clases formándose los intervalos La elaboración de los grupos de valores se ha de realizar reduciendo las informaciones para que revelen las características importantes de la distribución. En ello surgen distintos problemas:

 1. Fijar el número de clases o grupos de valores, que dependen de

1. Fijar el número de clases o grupos de valores, que dependen de las características de la variable. Se evitará el excesivo detalles así como el poco detalle. El criterio será utilitario: aquel número que sea suficiente para ser manejable y exprese las características de la variable. 2. Fijar los intervalos: a) Fijar los extremos de la variable; b) Dividir las expresiones de la variable en tantas partes o intervalos como clases quieran observarse

 3. El intervalo tiene dos límites: uno superior y otro inferior, que definen

3. El intervalo tiene dos límites: uno superior y otro inferior, que definen al intervalo en sí mismo y a su amplitud Se han de fijar los límites de los intervalos. Un problema consiste en evitar que el límite superior y el inferior de dos intervalos contiguos estén expresados por el mismo valor De 4 a 8 De 8 a 12 De 12 a 16 Una solución es De 4 a 7, 99 De 8 a 11, 99 De 12 a 15, 99

 Otra cuestión en este punto es el de los intervalos mal especificados Intervalos

Otra cuestión en este punto es el de los intervalos mal especificados Intervalos Poblaciones Penitenciarías Ante de 12 años 38 4 De 12 a 16 45 14 De 17 a 21 17 7 Después de 21 6 2 Total 106 27 Antes de 12 y después de 21 no está limitados y no se puede calcular su amplitud

 4. Amplitud de los intervalos pueden ser de la misma amplitud o puede

4. Amplitud de los intervalos pueden ser de la misma amplitud o puede ser variable, ya que lo más importante es que la estadística obtenida exprese lo más fielmente posible las características de la variable estudiada Intervalos Prisión 1 Condenas Prisión 2 preventi Hasta 2 años 45 10 De 2 y 1 día a 6 35 1 De 6 y 1 día a 10 15 0 De 10 y 1 día a 17 1 0 De 17 y 1 día a 30 5 0 De 30 y 1 día a 40 1 0 TOTAL 102 11

 Se forman estadísticas de dos variables cuando en cada unidad estudiada se observan

Se forman estadísticas de dos variables cuando en cada unidad estudiada se observan la relación de dos variables, de modo que se obtienen parejas de valores. Los datos resultantes se han de describir de modo que se exprese la ligación de los dos valores de la pareja Hay tres métodos estadísticos que describen esta relación de variables:

 1. Para las variables de pocas observaciones la tabla se forma poniendo los

1. Para las variables de pocas observaciones la tabla se forma poniendo los pares de valores en dos columnas, una para cada variable haciendo corresponder las parejas de valores, de tal forma que las columnas pueden colocarse en el orden que se quiere.

Edad en años (9 sujetos) Número de condenas 21 2 22 2 25 2

Edad en años (9 sujetos) Número de condenas 21 2 22 2 25 2 27 3 28 4 29 2 32 2 39 4

 2. Para las variables en que hay muchos pares de valores pero pocas

2. Para las variables en que hay muchos pares de valores pero pocas parejas de valores distintas, se forma una tabla donde hay tres columnas: dos columnas para las parejas distintas y una tercera para las frecuencias de las observaciones

Edad en años Número de condenas Número de reincidentes 21 2 25 22 2

Edad en años Número de condenas Número de reincidentes 21 2 25 22 2 18 23 7 35 25 2 41 29 2 30 34 3 9 35 2 24 42 3 18 TOTAL 200

 3. El número de observaciones puede ser muy elevado y el número de

3. El número de observaciones puede ser muy elevado y el número de parejas distintas también. Efectuada la reducción de datos se presenta en una tabla de doble entrada. Puede ocurrir que ambas variables tomen muchos valores distintos o que los tome sólo una, en este caso se presentará a intervalos

 En una muestra de 800 se requiere ver la relación entre años de

En una muestra de 800 se requiere ver la relación entre años de escolaridad y salario Años de escolaridad Salarios mensuales De 18 -30 De 30 -60 De 60 -100 Unidades de muestra 6 años 143 59 0 202 8 años 96 170 32 298 10 años 0 123 56 179 12 años 0 17 104 121 TOTAL 239 369 192 800

 Con las estadísticas de más de dos variables se pretenden conocer la relación

Con las estadísticas de más de dos variables se pretenden conocer la relación que liga más de dos variables, hasta un conjunto de ellas. Ejemplo: los gastos mensuales de una familia es una variable que está relacionada con: ingresos familiares, número de hijos, edad de los hijos, nivel de precios. En un estudio que se consideren las relaciones de influencia de tales variables los datos se pueden presentar en tablas en las que no cabe el formato de doble entrada como hemos mostrado antes. Además se ha de distinguir entre variables que tengan pocas observaciones, con muchos o pocos valores, y variables donde hay muchas unidades de estuido

 En el primer caso se elabora una tabla con tantas columnas como variables,

En el primer caso se elabora una tabla con tantas columnas como variables, descritas estas ya sea en todos sus datos o ya sea en intervalos. En esta tabla cada fila corresponde a unidad. En el segundo caso los datos se presentan describiendo las unidades por el procedimiento de agregación, es decir, agrupar los elementos de población por modalidades de atributo o valores de una variable en estudio. Los datos se presentan también en tantas columnas como variables se relacionen.

Estadística de atributos En los atributos las observaciones de las unidades de la población

Estadística de atributos En los atributos las observaciones de las unidades de la población o de la muestra que se estudia se reúnen en modalidades. Un primer problema es la definición de las modalidades, ya que en muchos atributos éstas son formadas por el investigador según el criterio de la investigación dependiendo de la opción teórica y conceptual. Hay atributos cuyas modalidades son conocidas (sexo: varón y hembra), pero cuando hay que trabajar con actitudes y comportamientos las modalidades han de ser elaboradas comprendiendo todas las características del atributo y después se pueden cuantificar

 Cuando las actitudes, comportamiento, percepciones, opiniones, se expresan en conceptos y se analizan

Cuando las actitudes, comportamiento, percepciones, opiniones, se expresan en conceptos y se analizan de este modo, entonces se elaboran las tablas para los atributos Cuando la modalidad del atributo se expresa en un número de atributo pasa a ser una variable. Con relación a la presentación estadística se ha de distinguir entre: un atributo, dos atributos y más de dos, así como ver las estadísticas mixtas: combinación de atributo y variable

 En las estadísticas de un atributo los datos se presentan en una tabla

En las estadísticas de un atributo los datos se presentan en una tabla de dos columnas, en una las modalidades del atributo y en la otra las modalidades de observación Ortodoxia religiosa (atributo) Frecuencias Porcentaje Práctica y creencia 101 50, 50 Práctica sin creencia 42 21, 00 Creencia sin práctica 12 6, 00 Agnósticos 30 19, 50 Sin religión 6 3, 00 205 100 TOTAL

 En las estadísticas de dos atributos se estudia el grado de dependencia entre

En las estadísticas de dos atributos se estudia el grado de dependencia entre dos atributos. Los datos se presentan al igual que en las variables por una tabla de doble entrada Tipos de actitud Hombres Mujeres Total Númer o % Número % Permisividad 630 70, 79 830 61, 39 1460 65, 12 Tolerancia 127 14, 27 181 13, 39 308 13, 74 Punición social 129 14, 49 297 21, 97 426 19, 00 Punición legal 4 0, 45 44 3, 25 48 2, 18 890 100 1352 100 2242 100 TOTAL

 En las estadísticas de más de dos atributos se ha de ver la

En las estadísticas de más de dos atributos se ha de ver la ligación entre todas ellas Ejemplo: relación que existe en las zonas de marginación entre la falta de escolaridad, el tipo de trabajo, un ingreso escaso o nulo y lo que produce un alto nivel de conductas muy perseguidas por las instancias de control Escolaridad, Trabajo, Ingreso, hábitat y conducta controlada pueden ser traducidas a atributos Es muy difícil presentar toda esta interrelación en tablas en las que se puedan incluir todas las posibilidades de cada atributo

 Clasificación de la población por el sexo, el trabajo, el hábitat y control

Clasificación de la población por el sexo, el trabajo, el hábitat y control Sexo Trabajo marginado Hábitat Miseria Hombre Mujer TOTAL No Miseria Trabajo no marginado Hábitat Miseria No Miseria Total Delincuente 80 5 13 98 No delincuent 13 23 85 121 Delincuente 63 8 4 75 No delincuent 3 42 92 137 159 78 194 431

Análisis de las variables: una variable - los promedios - Moda - Media aritmética

Análisis de las variables: una variable - los promedios - Moda - Media aritmética ponderada - Mediana - ¿problema con los intervalos?

 Dispersión Desviación estándar y recorrido y el coeficiente de variación

Dispersión Desviación estándar y recorrido y el coeficiente de variación

Representaciones gráficas Diagrama de barras Muchas observaciones y pocos valores Histograma Cuando la variable

Representaciones gráficas Diagrama de barras Muchas observaciones y pocos valores Histograma Cuando la variable se reduce en intervalos por haber muchas observaciones y muchos valores, si los intervalos son de amplitud constante. También sirve para los atributos con la única diferencia de que no hay continuidad entre las modalidades del atributo

 Nube de puntos En estadísticas de dos variables en las que se clasifican

Nube de puntos En estadísticas de dos variables en las que se clasifican parejas de valores, uno de una variable y otro de la otra, su representación gráfica se lleva a cabo por la denominada nube de puntos, que se efectúa sobre un par de ejes rectangulares y se coloca en cada uno una variable Pirámide Para representaciones gráficas de una población. Los intervalos pueden tener distinta amplitud pero se exigirá una corrección

 Curvas o distribuciones campaniformes Los histogramas se suelen sustituir por una línea curva

Curvas o distribuciones campaniformes Los histogramas se suelen sustituir por una línea curva Las distribuciones (curva) pueden ser simétricas, moderadamente asimétrica y si gnificativamente asimétricas