Descripcin y tratamientos de datos multivariantes Descripcin y

  • Slides: 13
Download presentation
Descripción y tratamientos de datos multivariantes

Descripción y tratamientos de datos multivariantes

Descripción y tratamientos de datos multivariantes variable nº 4 Persona nº 8 Dato x

Descripción y tratamientos de datos multivariantes variable nº 4 Persona nº 8 Dato x 84 = 57. 00

Descripción y tratamientos de datos multivariantes Si tenemos n personas, y a cada persona

Descripción y tratamientos de datos multivariantes Si tenemos n personas, y a cada persona le medimos p atributos, esto es que tenemos definidas p variables, entonces tendremos np datos, que conformarán la matriz de datos X, como se indica: i = 1, . . . , n representa el individuo; j = 1, . . . , p representa la variable

Descripción y tratamientos de datos multivariantes Análisis descriptivo preliminar de la variable categoría de

Descripción y tratamientos de datos multivariantes Análisis descriptivo preliminar de la variable categoría de ingresos

Descripción y tratamientos de datos multivariantes p proporción de casados media varianza no tiene

Descripción y tratamientos de datos multivariantes p proporción de casados media varianza no tiene sentido el cálculo de la media y la varianza

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables “El examen de

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables “El examen de la distribución de una variable es esencial, pero muchas veces el investigador está interesado en examinar las relaciones entre dos o más variables. El método más popular de análisis de las relaciones bivariantes es el gráfico de dispersión, un gráfico de puntos de datos basados en dos variables. Se presenta una variable en el eje horizontal y la otra en el vertical. Las variables pueden ser valores observados, valores esperados o incluso residuos. Los puntos del gráfico representan los correspondientes valores conjuntos de las variables para cualquier caso dado. El patrón de los puntos representa la relación entre las variables. Cuando los untos se organizan a lo largo de una línea recta, tenemos una relación lineal de correlación. Un conjunto de puntos curvados puede indicar una relación no lineal, que se puede tratar de varias formas. . . O puede que no existan patrones, sólo un conjunto de puntos aparentemente aleatorios. En este caso, no hay relación. ” (c. f. Análisis Multivariante, Hair et al. 1999, p. 35)

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables Correlación bivariada Nota:

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables Correlación bivariada Nota: ya sabemos, si el coeficiente de correlación de Pearson está cerca del valor entonces hay una dependencia lineal

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de la diferencia entre grupos Es importante

Descripción y tratamientos de datos multivariantes Análisis de la diferencia entre grupos Es importante saber como se distribuyen los valores para cada grupo y si existen diferencias significativas, así como también saber los casos atípicos que resaltan cuando se separan en grupos. El método rápido para resolver ambos problemas es el gráfico boxplot (“caja y bigotes”). Es una caja que consiste en o siguiente: Los límites superior e inferior de la caja marcan los cuartiles superior e inferior en la distribución de los datos. Por lo tanto, la longitud de la caja es la distancia entre el primer y el tercer cuartil, de forma que la caja contiene el 50% de los datos centrales de la caja. La línea dentro de la caja señala la posición de la mediana. Si ésta cae cerca del final de la caja, se indica la presencia de asimetría. Cuanto mayor es la caja, mayor es la extensión de las observaciones. Las líneas que se extienden desde la caja (“bigotes”) representan la distancia entre la mayor y la menor de las observaciones que están a menos de un cuartil de la caja. Los casos atípicos son observaciones que se sitúan entre 1, 0 y 1, 5 cuartiles fuera de la caja. Estos valores están marcados con una X.

Descripción y tratamientos de datos multivariantes “caja y bigotes” para la variable ingresos familiares

Descripción y tratamientos de datos multivariantes “caja y bigotes” para la variable ingresos familiares según grupos de casados y solteros.