Anlisis de correlacin y regresin lineal Introduccin En



















- Slides: 19
Análisis de correlación y regresión lineal
Introducción En el análisis de procesos empresariales y económicos se utilizan a menudo las relaciones entre variables. Estas relaciones funcionales pueden adoptar muchas formas lineales y no lineales. En muchos casos la forma de la relación no se conoce exactamente, sin embargo las relaciones lineales son una buena aproximación.
Análisis de Correlación Definición Grupo de técnicas para medir la asociación entre dos variables. Representación Mediante un diagrama de dispersión. Variable dependiente La que se predice o estima. Variable independiente Proporciona la base para la estimación. Es la variable de pronóstico. Se muestra en el eje Y. Se muestra en el eje X. (Tomado de Lind, Marchal & Wathen, 2008)
Coeficiente de correlación Describe la fuerza de la relación entre dos variables. Las variables deben ser de nivel de intervalo o de razón. Se designa por r. Puede adoptar cualquier valor entre -1 y 1. Si el valor es -1 o 1 indica una correlación perfecta positiva o negativa. Un valor de cero indica que no hay ninguna relación entre las variables. Se calcula mediante la fórmula (Tomado de Lind, Marchal & Wathen, 2008)
Ejemplo El gerente de ventas de una compañía desea determinar si hay alguna relación entre el número de llamadas de ventas y el número de copiadoras vendidas. Se selecciona una muestra aleatoria de 10 vendedores y determina el número de llamadas de ventas que cada uno hizo durante el mes pasado y el número de copiadoras vendidas. La información se muestra en la siguiente tabla:
Ejemplo Representante Número de llamadas Número de computadoras vendidas Tom 20 30 Jeff 40 60 Brian 20 40 Greg 30 60 Susan 10 30 Carlos 10 40 Rich 20 40 Mike 20 50 Mark 20 30 Soni 30 70 (Tomado de Lind, Marchal & Wathen, 2008)
Paso 1. Determinar las variables Variable independiente: número de llamadas de ventas Variable dependiente: número de copiadoras vendidas
Paso 2. Hacer un diagrama de dispersión 80 Número de computadoras vendidas 70 60 50 40 30 20 10 0 0 5 10 15 20 25 Número de llamadas 30 35 40 45 (Fuente propia)
Paso 3. Representar gráficamente el tipo de relación entre las variables Se obtiene la media de ambas variables. Número de llamadas Número de computadoras vendidas 20 30 40 60 20 40 30 60 10 30 10 40 20 50 20 30 30 70 Se grafican dos rectas en el diagrama de dispersión que representen a la media de cada una de las variables. La media de la variable independiente (X) es una recta vertical, la media de la variable dependiente (Y) es horizontal. Total Media = 220 22 450 45
Paso 4. Graficar las medias variable de cada 80 IV Número de computadoras vendidas 70 I 60 50 40 30 20 10 II III 0 0 5 10 15 20 25 Número de llamadas 30 35 40 45
Paso 5. Determinar el tipo de relación. • Las rectas de las medias dividen al diagrama de dispersión en 4 cuadrantes: I, III, IV. • Una relación será directa si los puntos se encuentran localizados: v. Ambos arriba de su media, es decir, en el cuadrante I. v. Ambos por debajo de su media, es decir en el cuadrante III. • Una relación será inversa si una variable está arriba de su media y la otra debajo de su media, es decir en los cuadrantes II y IV. • Si los puntos aparecen en todos los cuadrantes esto significa que NO hay una relación lineal entre las variables.
Graficar las medias de cada variable 80 IV Número de computadoras vendidas 70 I 60 50 40 30 20 10 III 0 0 5 En este caso, la mayoría de los puntos están en los cuadrantes I y III, por lo que se puede concluir que existe una relación directa entre el número de y 25 el número de 35 10 llamadas 15 de ventas 20 30 de llamadas computadoras. Número vendidas. II 40 45
Paso 6. Calcular el coeficiente de correlación (Fuente propia) Número de llamadas total Media = D. Estándar = 20 40 20 30 10 10 20 20 20 30 22 9. 189 Número de computadoras vendidas 30 60 40 60 30 40 40 50 30 70 45 14. 337 (X-media) (Y-media) -2 18 -2 8 -12 -2 -2 -2 8 -15 15 -15 -5 -5 5 -15 25 (X-media)(Y-media) 30 270 10 120 180 60 10 -10 30 200 900 Esto implica que existe una relación directa entre el número de llamadas y el número de computadoras vendidas.
Regresión lineal Es un procedimiento mediante el cual se obtiene la ecuación de una recta que permite expresar la relación lineal entre dos variables. A esta ecuación se le llama Ecuación de regresión. A partir de esta ecuación se puede predecir el valor de la variable dependiente a partir del valor de la variable independiente. Esta recta es la que mejor ajusta al conjunto de datos. (Tomado de Lind, Marchal & Wathen, 2008)
Ecuación de regresión
Ejemplo Del ejemplo de las llamadas telefónicas para vender computadoras se tiene que:
Recta de regresión
Predicción con la recta de regresión Supóngase que se quiere investigar el número de computadoras que se venderán si se hacen 45 llamadas telefónicas para ventas. En este caso se utiliza la recta de regresión con el valor de X = 45 Esto quiere decir que si se hacen 45 llamadas para ventas se venderán 72 computadoras.
Fuentes de consulta • Lind, D. , Marchal, W. & Wathen, S. (2008). Estadística aplicada a los negocios y la economía. México: Mc. Graw Hill Interamericana. (Disponible en la Biblioteca Virtual ULA, colección Mc. Graw Hill).