4 Anlisis de Correspondencias Mltiples Generalizacin del ACS

  • Slides: 13
Download presentation
4. Análisis de Correspondencias Múltiples Generalización del ACS. Permite describir grandes tablas binarias, referidas

4. Análisis de Correspondencias Múltiples Generalización del ACS. Permite describir grandes tablas binarias, referidas por ejemplo a ficheros de encuestas socio-económicas. Líneas: individuos u observaciones. Columnas: Modalidades de variables nominales. El ACM es un Análisis de Correspondencias Simple aplicado, no a tablas de contingencia sino a una tabla disyuntiva completa Z, en la que para cada modalidad de cada variable hay sólo dos valores posibles: 0 = el encuestado no contesta esa modalidad. 1= es la respuesta elegida por él. Las propiedades de Z son interesantes y los procedimientos de cálculo y sus reglas de interpretación de las representaciones obtenidas son simples y específicas. La mayoría de los ficheros de encuestas presentan las respuestas a las preguntas bajo la forma de una tabla disyuntiva completa. 1

La tabla disyuntiva completa La forma de la matriz Z (Tabla disyuntiva completa) será:

La tabla disyuntiva completa La forma de la matriz Z (Tabla disyuntiva completa) será: p Si hay alguna variable continua, debe transformarse en nominal, ordenándose en intervalos a los que se da un rango de valores. Las frecuencias marginales de las líneas de la tabla disyuntiva completa son iguales al número de preguntas, s, y las frecuencias marginales de las columnas corresponden al número de sujetos que han elegido la modalidad j de la pregunta q, por lo que para cada subtabla, el número total de individuos es n. En consecuencia, si para n individuos se dispone de respuestas respecto a, por ejemplo, dos variables nominales que tienen respectivamente p 1 y p 2 modalidades, entonces es equivalente someter a un Análisis de Correspondencias Simples la tabla de contingencia (p 1, p 2) y analizar la tabla binaria de n líneas y (p 1 + p 2) columnas que describe las respuestas. 2

La tabla de Burt A partir de la tabla disyuntiva completa se puede construir

La tabla de Burt A partir de la tabla disyuntiva completa se puede construir la tabla de contingencia de Burt, B, que es una tabla simétrica de orden (p, p): B = Z´Z B es una yuxtaposición de tablas de contingencia y está formada de s 2 bloques de la forma: Cada bloque es una p 1 p 2 ps submatriz formada por tablas de 0 p 1 0 contingencia de las p 2 variables dos a dos, 0 p 0 salvo los bloques que B = Z´Z = se están en la 0 ps diagonal que son las tablas de 0 contingencia de cada variable consigo misma. p 3

Principios del análisis de correspondencias múltiples Es el análisis de correspondencias de una tabla

Principios del análisis de correspondencias múltiples Es el análisis de correspondencias de una tabla disyuntiva completa, estudiándose la nube de los individuos y la nube de las modalidades. Sus principios son, por tanto, los del análisis de correspondencias: Iguales transformaciones de la tabla en los perfiles líneas y columnas Igual criterio de ajuste con ponderación de los puntos por sus frecuencias marginales Igual distancia, la chi-cuadrado Presenta propiedades particulares debido a la naturaleza misma de la tabla disyuntiva completa. La Tabla disyuntiva completa es equivalente a la tabla de Burt y ambos producen los mismos factores 4

Caso: Estudio de los turistas en función del lugar de residencia, sexo y alojamiento

Caso: Estudio de los turistas en función del lugar de residencia, sexo y alojamiento A partir de la base de datos referida a los turistas que vienen a Tenerife, se quiere estudiar la asociación existente entre el lugar donde residen en la isla, el sexo y el tipo de alojamiento en el que se quedan, con sus respectivas modalidades. 5

Con estas tres variables se ha construido la tabla de Burt. A partir de

Con estas tres variables se ha construido la tabla de Burt. A partir de ella se ha creado una hoja de cálculo en spss (corres multiple turismo. sav). 6

Resultados Utilizaremos una tabla de Burt. Con ella se podrán obtener las puntuaciones (distancias

Resultados Utilizaremos una tabla de Burt. Con ella se podrán obtener las puntuaciones (distancias al centro de gravedad), contribuciones absolutas de cada modalidad y variable a los ejes o factores obtenidos (contribución de cada modalidad o variable a la inercia de los nuevos ejes) y contribuciones relativas o correlaciones de cada modalidad con los nuevos ejes. El número de ejes considerado fue de 2. Como en la Tabla de Burt las filas y las columnas representan las mismas modalidades, el estudio de ambas ofrece iguales resultados, por lo que sólo presentaremos los de las filas. Para la resolución en el SPSS, en primer lugar hay que introducir los datos de la misma forma que en el análisis de correspondencias simples, creando por tanto tres variables. Las dos primeras corresponden a los rangos de todas las modalidades y, en la tercera, se incluirán las frecuencias conjuntas de los pares de modalidades, las cuales funcionarán como ponderaciones. 7

Los valores singulares, inercia, porcentajes de varianza explicada y sus acumulados fueron: Los valores

Los valores singulares, inercia, porcentajes de varianza explicada y sus acumulados fueron: Los valores singulares son los valores propios que se obtendrían si hubiéramos partido de una tabla disyuntiva completa, cuyo cuadrado es igual a la Inercia o valores propios resultantes de la matriz de Burt. En el Análisis de Correspondencias Múltiples, los porcentajes de varianza explicada suelen ser pequeños para cada eje y no se pueden explicar de igual forma que en el análisis de correspondencias simples. 8

Examen de los puntos Las distancias de las modalidades, mientras más alejadas se encuentren

Examen de los puntos Las distancias de las modalidades, mientras más alejadas se encuentren del origen, mejor representados estarán. Mientras más alejadas estén las modalidades entre sí en el gráfico menos asociación existirá entre ellas y cuanto más cercanas, más asociación existirá entre ellas. La contribución de los puntos a la inercia de cada dimensión o contribución de cada una de las filas a la inercia o varianza explicada en cada uno de los ejes considerados La contribución de las dimensiones a la inercia de cada punto. Se refiere a la correlación existente entre cada uno de los caracteres y los nuevos ejes. A continuación se presentan los resultados y el diagrama de dispersión de los dos ejes obtenidos. 9

10

10

11

11

Eje 1: Se contraponen los turistas que se quedan en el Puerto de la

Eje 1: Se contraponen los turistas que se quedan en el Puerto de la Cruz y que destacan por alojarse en hoteles de 1, 2 y 4*, todos ellos en el lado positivo, a los turistas que van al Sur y que se alojan en hoteles de 5*, aparthoteles de 4 y 5* y apartamentos de 1, 3, 4 y 5 llaves, todos ellos en el lado negativo. Las variables con mayor contribución absoluta a la inercia del eje 1 son Puerto de la Cruz, Sur y Hoteles de 4*. Las variables más correlacionadas con el eje 1 son Puerto Cruz, Sur y Hoteles de 4*. Eje 2: Sobresalen en el lado positivo los turistas mujeres, que se alojan en hoteles de 3*, apartamentos de dos llaves y Time sharing y propiedad, contraponiéndose a los turistas hombres que se alojan en hoteles de 1 y 2*, apartamentos de 1, 3, 4 y 5 llaves, todas ellas en el lado negativo. Las variables con mayor contribución absoluta a la inercia del eje 2 son: Hombres, mujeres y apartamentos de 2 llaves. Las variables más correlacionadas con el eje 2 son hombre y mujer. Por tanto, podemos decir que el eje 1 viene afectado por la variable lugar de 12 residencia, mientras que en el eje 2 influye la variable sexo.

CONCLUSIONES En cuanto al lugar de residencia y al sexo de los turistas, éstos

CONCLUSIONES En cuanto al lugar de residencia y al sexo de los turistas, éstos residen en el Puerto de La Cruz y en el Sur, independientemente del sexo. Las diferencias se encuentran en el tipo de alojamiento que utilizan. Así, en el Puerto de la Cruz se caracterizan los que se quedan en hoteles de 4*, frente al Sur, que se caracterizan por alojarse en aparthoteles de 4 y 5* y en hoteles de 5*. En cuanto al tipo de alojamiento por sexo, las mujeres se caracterizan por preferir especialmente los apartamentos de 2 llaves y el Time sharing y propiedad, frente a los hombres, que prefieren especialmente los apartamentos de 1, 3, 4 y 5 llaves. Nos referimos a que en esos tipos de alojamientos se diferencian hombres y mujeres o Puerto de la Cruz y Sur. 13