Estadstica I Finanzas y Contabilidad Temario de la
Estadística I. Finanzas y Contabilidad Temario de la asignatura • Introducción. • Análisis de datos unívariantes. • Análisis de datos bivariantes. • Series temporales y números índice. • Probabilidad. • Modelos probabilísticos. • Introducción a la inferencia estadística. • Contrastes de hipótesis. 1
Tema 3: Análisis de datos bivariantes 1. Representaciones y gráficos: 1. Tabla de frecuencia absoluta / tabla de frecuencia relativa; Marginales; Condicionales 2. Diagrama de dispersion 2. Resumen numérico: Covarianza Coeficiente de correlación Recta de regresión lineal Lecturas recomendadas: § Capítulos 7 a 9 del libro de Peña y Romo (1997) 2
3. 1 Representaciones y gráficos n VARIABLES ESTADÍSTICAS BIDIMENSIONALES: X: x 1, x 2, . . . , x. N (xi , yj) i=1, 2, …N; j=1, 2, …M Y: y 1, y 2, . . . , y. M TABLAS DE DOBLE ENTRADA: TABLAS SIMPLES: Total bibl. NºBibl. Púb. Y/X [5, 7) [7, 9) [9, 11) [11, 13) Andalucía 884 649 [25, 30) 4 3 1 Aragón 318 227 [30, 35) 2 7 2 Asturias 156 115 [35, 40) 1 1 11 1 Baleares 188 128 [40, 45) 2 6 Canarias 213 149 [45, 50) 3 Cantabria 58 39 X=enciclopedia Y=libros de bolsillo (libros solicitados diariamente en la biblioteca de un IES) 3
3. 1. 1 Tablas de frecuencias TABLA DE FRECUENCIA ABSOLUTA: Y/X [5, 7) [7, 9) [9, 11) [11, 13) [25, 30) 4 3 1 8 [30, 35) 2 7 2 11 [35, 40) 1 1 14 [40, 45) 2 6 8 [45, 50) 3 3 7 13 13 11 44 TABLA DE FRECUENCIA RELATIVA: Y/X [5, 7) [7, 9) [9, 11) [11, 13) [25, 30) 0. 09 0. 07 0. 02 [30, 35) 0. 05 0. 16 0. 05 [35, 40) 0. 02 0. 25 0. 02 [40, 45) 0. 05 0. 14 [45, 50) 0. 07 1 4
3. 1. 1 Tablas de frecuencias TABLA DE FRECUENCIA ABSOLUTA: Y/X [5, 7) [7, 9) [9, 11) [11, 13) [25, 30) 4 3 1 8 [30, 35) 2 7 2 11 [35, 40) 1 1 14 [40, 45) 2 6 8 [45, 50) 3 3 7 13 13 11 44 MARGINAL DE Y: MARGINAL DE X: X ni Y fi ni fi [5, 7) 7 7/44 [25, 30) 8 8/44 [7, 9) 13 13/44 [30, 35) 11 11/44 [9, 11) 13 13/44 [35, 40) 14 14/44 [11, 13) 11 11/44 [40, 45) 8 8/44 [45, 50) 3 3/44 5
3. 1. 1 Tablas de frecuencias TABLA DE FRECUENCIA ABSOLUTA: Y/X [5, 7) [7, 9) [9, 11) [11, 13) [25, 30) 4 3 1 8 [30, 35) 2 7 2 11 [35, 40) 1 1 14 [40, 45) 2 6 8 [45, 50) 3 3 7 13 13 11 44 X ni fi Supongamos queremos restringirnos al valor Y=[25, 30); mientras que la variable X sigue tomando todos sus valores. [5, 7) 4 4/8 [7, 9) 3 3/8 En este caso tenemos las frecuencias condicionadas de X dado Y=[25, 30). [9, 11 ) 0 0/8 [11, 1 6
3. 1. 1 Tablas de frecuencias TABLA DE FRECUENCIA ABSOLUTA: Y/X [5, 7) [7, 9) [9, 11) [11, 13) [25, 30) 4 3 1 8 [30, 35) 2 7 2 11 [35, 40) 1 1 14 [40, 45) 2 6 8 [45, 50) 3 3 7 13 13 11 44 Ahora supongamos queremos restringirnos al valor X=[7, 9); mientras que la variable Y sigue tomando todos sus valores. En este caso tenemos las frecuencias condicionadas de Y dado X=[7, 9). Y ni fi [25, 30) 3 3/13 [30, 35) 7 7/13 [35, 40) 1 1/13 [40, 45) 2 2/13 [45, 50) 0 0/13 7
3. 1 Representaciones y gráficos 1ªcolumna: Comunidad Autónoma 2ªcolumna: Total de bibliotecas 3ªcolumna: Nº bibliotecas públicas Andalucía Aragón Asturias Baleares Canarias Cantabria Casti. León Casti. Man Catalunya Valencia Extremadura Galicia Madrid Murcia Navarra Euskadi Rioja Ceuta-Meli 884 318 156 188 216 58 500 412 893 636 354 444 720 127 116 435 35 32 649 227 115 128 149 39 304 342 468 474 308 282 321 85 81 285 23 21 8
3. 1. 2 Gráficos 9
3. 1. 2 Gráficos DIAGRAMA DE DISPERSIÓN 10
3. 2 Resumen numérico Notas de 10 alumnos/as en matemáticas y lenguaje 11
3. 2. 1 Covarianza y correlación n La covarianza mide la fuerza de la relación lineal entre dos variables n La covarianza muestral puede calcularse mediante: n Una alta covarianza no implica efecto causal 12
3. 2. 1 Covarianza y correlación INTERPRETACIÓN DE LA COVARIANZA n La covarianza entre dos variables: Cov(x, y) > 0: X e Y tienden a moverse en la misma dirección Cov(x, y) < 0: X e Y tienden a moverse en direcciones opuestas. Cov(x, y) = 0: X e Y no están relacionadas linealmente. 13
3. 2. 1 Covarianza y correlación Relación lineal entre variables cuantitativas COVARIANZA Dato Xi Yi Xi * Yi Xi^2 Yi^2 1 6 6, 5 39 36 42, 25 2 4 4, 5 18 16 20, 25 3 8 7 56 64 49 4 5 5 25 25 25 5 3, 5 4 14 12, 25 16 6 7 8 56 49 64 7 5 7 35 25 49 8 10 10 100 100 9 5 6 30 25 36 10 4 5 20 16 25 57, 5 63 393 368, 25 426, 5 Suma 14
3. 2. 1 Covarianza y correlación Inconvenientes de la COVARIANZA: Depende de las unidades de medida. ¿Qué es pequeño o grande en covarianza? COEFICIENTE DE CORRELACIÓN: -1 1 =-1: =0: 0< <1: -1< <0: asociación lineal positiva perfecta asociación lineal negativa perfecta no existe relación lineal: Incorreladas relación lineal positiva relación lineal negativa 15
3. 2. 1 Covarianza y correlación Y Y r = -1 X Y Y r = -. 6 X Y Y r = +1 X r=0 X r = +. 3 X r=0 X 16
3. 2. 1 Covarianza y correlación r = 0, 92, por tanto existe una alta relación entre las calificaciones de ambas materias Los estudiantes que obtienen buenas notas en Matemáticas tienden a obtenerlas en Lengua 17
3. 2 Resumen numérico Recta de regresión lineal (x 1, y 1), (x 2, y 2), . . . , (xn, yn) : n pares de puntos observados Hemos de encontrar una recta: y = α + β x que se ajuste “lo mejor posible” a nuestros puntos: 18
3. 2. 2 Recta de regresión lineal n n n Estimadores para los coeficientes α and β pueden calcularse minimizando la suma de cuadrados de los residuos La recta de mínimos cuadrados es: Donde b es la pendiente de la recta y a es el intercepto: 19
3. 2. 2 Recta de regresión lineal Coeficientes Intercepción 1, 60066445 Variable X 1 0, 81727575 Y = 1, 60 + 0, 81 X Estadísticas de la regresión Coeficiente de correlación múltiple 0, 92142 Coeficiente de determinación R^2 0, 84902 R^2 ajustado 0, 83015 Error típico 0, 74739 Observaciones 10 20
3. 2. 2 Recta de regresión lineal Y = 1, 60 + 0, 81 X • ¿Cómo interpretarías al parámetro a = 1, 60? • ¿Cómo interpretaría el parámetro b = 0, 81? • ¿Cuál es la predicción de la nota en Lengua de un estudiante que obtenga 5 puntos en Matemáticas? 21
- Slides: 21