BI 1 TNG QUAN V PH N TCH
BÀI 1: TỔNG QUAN VỀ PH N TÍCH DỮ LIỆU THỐNG KÊ 1
Phần mềm phân tích dữ liệu & dự báo? l SPSS Eviews STATA Excel Forecast. X SAS Metastock l … l l l 2
Thống kê là gì? Thống kê: là ngành khoa học nghiên cứu hệ thống các phương pháp thu thập, xử lý và phân tích các mặt lượng của hiện tượng số lớn để tìm hiểu bản chất và tính qui luật vốn có của chúng trong điều kiện thời gian và địa điểm cụ thể. 3 3
Caùc loaïi döõ lieäu l l l 4 Döõ lieäu – Cheùo (cross-sectional data): thu thập trong cùng hay gần cùng một thời điểm – Chuoãi thôøi gian (time-series data): thu thập trong các thời điểm liên tiếp nhau – Baûng (Panel Data): các quan sát của dữ liệu bao gồm quan sát chéo và các quan sát chéo này lại được quan sát theo thời gian Döõ lieäu – sô caáp: trực tiếp thu thập – thöù caáp: đã qua xữ lý Döõ lieäu ñònh tính/ ñònh löôïng
Chi tiêu và thu nhập của hộ gia đình: X Y 80 100 120 140 160 180 200 55 65 79 80 102 105 120 60 70 84 93 107 110 136 65 74 90 95 110 140 70 80 94 103 116 115 144 75 85 98 108 118 120 145 113 125 130 88 115 325 462 445 707 678 690 685 E(Y/Xi) 65 77 89 101 113 115 137 5
6 Năm Mức tiêu dùng (Yi) Thu nhập (Xi) 1971 48. 34 52. 02 1981 57. 17 63. 36 1972 48. 54 52. 41 1982 60. 84 67. 42 1973 47. 44 51. 55 1983 60. 73 67. 86 1974 54. 58 58. 88 1984 76. 04 83. 39 1975 55 59. 66 1985 76. 42 84. 26 1976 63. 49 68. 42 1986 69. 34 77. 41 1977 59. 22 64. 27 1987 61. 75 70. 08 1978 57. 77 63. 01 1988 68. 78 77. 44 1979 60. 22 65. 61 1989 67. 07 75. 79 1980 55. 4 61. 05 1990 72. 94 81. 89
Quy trình chuaån bò, phaân tích döõ lieäu 7
Caùc loaïi bieán l l 8 Bieán ñònh tính (nhaõn hieäu, giôùi tính, ngheà nghieäp …) Bieán ñònh löôïng - Rôøi raïc : soá ngöôøi trong hoä, soá baøn ghi ñöôïc trong moät traän boùng ñaù - Lieân tuïc: chieàu cao cuûa thanh nieân, troïng löôïng cuûa saûn phaåm, giaù saûn phaåm …
Caùc loaïi thang ño l l l Thang ño ñònh danh (Nominal) Thang ño thöù baäc (Ordinal) Thang ño khoaûng (Interval) – – – l 9 Likert, daïng Likert, thang ño ñoái nghóa (thang ño tính töø cöïc, Osgood) … Thang ño tyû leä (Ratio)
Các loại thang đo Thang đo định danh Ví dụ: Giới tính 10 Mã số hóa Nước ngọt Mã số hóa Nam 1 Pepsi 1 Nữ 2 Coke 2 Tribeco 3 Sprite 4 Khác 5 10
Các loại thang đo Thang đo thứ bậc Cũng được sử dụng cho biến định tính, khi mà các biểu hiện của dữ liệu có sự hơn kém, khác biệt về thứ bậc. Ví dụ: 11 Mã số hóa Bậc thợ Mã số hóa Trung cấp 1 3 1 Đại học 2 4 2 Thạc sĩ 3 5 3 Tiến sĩ 4 6 4 7 5 Trình độ văn hóa 11
Các loại thang đo Thang đo khoảng Ví dụ: Mã số hóa Thang điểm Mã số hóa Rất không thích 1 9 -> 10 1 Không thích 2 8 ->9 2 Bình thường 3 7 -> 8 3 Thích 4 5 -> 7 4 Rất thích 5 <5 5 Sở thích 12 12
13
Phaân tích ñôn bieán l l 14 Thoáng keâ moâ taû Baûng taàn soá One-sample T-test …
Phaân tích nhò bieán l l l 15 Phaân tích quan heä giöõa 2 bieán ñònh tính: Chi-square Phaân tích quan heä giöõa 2 bieán ñònh löôïng: Correlation, Simple Regression Phaân tích aûnh höôûng cuûa moät bieán ñònh tính ñeán moät bieán ñònh löôïng: - Independent samples t-test - ANOVA
Phaân tích ña bieán l l l 16 Phaân tích aûnh höôûng cuûa caùc bieán ñoäc laäp (bieán giaûi thích) ñeán 1 bieán phuï thuoäc Y=f(X 1, X 2, X 3, …Xm) Khi Y laø bieán ñònh löôïng: Multiple regression Model Khi Y laø bieán ñònh tính coù 2 thuoäc tính: Logit Model/ Probit Model/ Discriminant Analysis Nhoùm caùc quan saùt theo töøng cuïm: Cluster Analysis Ruùt goïn caùc bieán: Factor Analysis Kieåm ñònh ñoä tin caäy cuûa thang ño: Cronbach’s Alpha Caùc coâng cuï phaân tích ña bieán khaùc: MDS, CFA, SEM…
Chuù yù l l l 17 Caùc kyõ thuaät treân söû duïng cho caû 3 loaïi döõ lieäu Tuy nhieân, ngöôøi ta ñaõ phaùt trieån nhieàu moâ hình kinh teá löôïng chuyeân saâu hôn daønh cho döõ lieäu baûng (Pooled, FEM, ECM…) Nhieàu moâ hình hinh teá löôïng chuyeân saâu daønh cho döõ lieäu chuoãi thôøi gian: ARIMA, SARIMA, ARCH-GARCH, VAR, moâ hình ñoäng, heä phöông trình …
Phân tích dữ liệu để làm gì? l l l 18 Để hỗ trợ quá trình ra quyết định Kiểm định lý thuyết Gợi ý chính sách Dự báo …
Các kỹ thuật dự báo định lượng trong kinh doanh Mô hình chuỗi thời gian - Đơn giản - Hàm xu thế - San mũ - Phân tích các thành phần của chuỗi thời gian - ARIMA - ARCH/GARCH l Mô hình nhân quả Nguồn: Wilson (2007) l 19
- Slides: 19