CHNG 9 CHN M HNH V KIM NH

  • Slides: 40
Download presentation
CHƯƠNG 9 CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH

CHƯƠNG 9 CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH

CHỌN MÔ HÌNH MỤC TIÊU 1. Biết cách tiếp cận để lựa chọn mô

CHỌN MÔ HÌNH MỤC TIÊU 1. Biết cách tiếp cận để lựa chọn mô hình 2. Biết cách kiểm định việc chọn mô hình 2

NỘI DUNG 1 Chọn mô hình- Các sai lầm khi chọn mô hình 2

NỘI DUNG 1 Chọn mô hình- Các sai lầm khi chọn mô hình 2 Cách tiếp cận để lựa chọn mô hình 3 Kiểm định việc chọn mô hình 4 3

Chọn mô hình và kiểm định chọn mô hình 1. Chọn mô hình -

Chọn mô hình và kiểm định chọn mô hình 1. Chọn mô hình - Tiết kiệm: Mô hình đơn giản nhưng phải chứa các biến chủ yếu ảnh hưởng đến biến phụ thuộc nhằm giải thích bản chất của vấn đề nghiên cứu. - Tính đồng nhất: Với một tập dữ liệu đã cho, các tham số ước lượng phải duy nhất. -Tính thích hợp (R 2): Mô hình có R 2 ( hoặc càng gần 1 được coi càng thích hợp. - Tính bền vững về mặt lý thuyết: mô hình phải phù hợp với lý thuyết nền tảng. - Khả năng dự báo cao 4

2. Các sai lầm khi chọn mô hình- Hậu quả • Bỏ sót biến

2. Các sai lầm khi chọn mô hình- Hậu quả • Bỏ sót biến thích hợp: dẫn đến một số hậu quả như i. Các tham số ước lượng sẽ bị chệch và không vững. ii. Khoảng tin cậy và các kiểm định không chính xác. iii. Dự báo dựa trên mô hình sai sẽ không đáng tin cậy. 5

2. Các sai lầm khi chọn mô hình- Hậu quả • Đưa vào mô

2. Các sai lầm khi chọn mô hình- Hậu quả • Đưa vào mô hình những biến không phù hợp: các ước lượng thu được từ mô hình thừa biến không hiệu quả, khoảng tin cậy rộng. 6

2. Các sai lầm khi chọn mô hình- Hậu quả • Lựa chọn mô

2. Các sai lầm khi chọn mô hình- Hậu quả • Lựa chọn mô hình không chính xác: i. Ước lượng chệch các hệ số hồi quy, thậm chí dấu của hệ số hồi quy có thể sai. ii. Có ít hệ số hồi quy ước lượng được có ý nghĩa thống kê iii. R 2 không cao iv. Phần dư các quan sát lớn và biểu thị sự biến thiên có tính hệ thống. 7

Ví dụ • Về hàm chi phí của doanh nghiệp, dạng hàm đúng Yi

Ví dụ • Về hàm chi phí của doanh nghiệp, dạng hàm đúng Yi = b 1 + b 2 Xi + b 3 Xi 2 + b 4 Xi 3 + u 1 i • Bỏ sót biến quan trọng (Xi 3): Yi = a 1 + a 2 Xi + a 3 Xi 2 + u 2 i • Đưa biến không liên quan vào mô hình (Xi 4): Yi = l 1 + l 2 Xi + l 3 Xi 2 + l 4 Xi 3 + l 5 Xi 4 + u 3 i • Dạng hàm sai. ln. Y = g 1 + g 2 Xi + g 3 Xi 2 + g 4 Xi 3 + u 4 i 8

Cách tiếp cận để lưa chọn mô hình 1. Xác định số biến độc

Cách tiếp cận để lưa chọn mô hình 1. Xác định số biến độc lập: có hai hướng tiếp cận: Từ đơn giản đến tổng quát: bổ sung biến độc lập từ từ vào mô hình Từ tổng quát đến đơn giản: Xét mô hình hồi quy có đầy đủ các biến độc lập đã được xác định, sau đó loại trừ những biến không quan trọng ra khỏi mô hình 2. Kiểm định mô hình có vi phạm giả thiết như đa cộng tuyến, phương sai thay đổi, tự tương quan. Nếu mô hình vi phạm thì cần có biện pháp khắc phục. 3. Chọn dạng hàm; dựa vào Các lý thuyết kinh tế Các kết quả nghiên cứu thực nghiệm 4. Sử dụng các tiêu chuẩn thông dụng để chọn mô hình 9

Kiểm định việc chọn mô hình a. Kiểm định thừa biến (kiểm định Wald)

Kiểm định việc chọn mô hình a. Kiểm định thừa biến (kiểm định Wald) Xét hai mô hình: (U): mô hình không bị ràng buộc (Unrestricted model) (R): mô hình bị ràng buộc (Restricted model). Điều kiện ràng buộc là các hệ số hồi quy của các biến Xm , Xm+1 , Xk đồng thời bằng 0 10

a. Kiểm định Wald Xây dựng giả thiết để kiểm định đk ràng buộc

a. Kiểm định Wald Xây dựng giả thiết để kiểm định đk ràng buộc H 1: có ít nhất một khác 0 B 1: Hồi quy mô hình (U) có k tham số, tính RSSU có n-k bậc tự do B 2: Hồi quy mô hình (R) có m tham số, tính RSSR có n-m bậc tự do B 3: Tính F 11

a. Kiểm định Wald B 4: Tra bảng F với mức ý nghĩa α

a. Kiểm định Wald B 4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k) Quy tắc quyết định: Nếu F> Fα (k-m, n-k): bác bỏ Ho, tức mô hình (U) không thừa biến. Nếu dùng kết quả p-value thì quy tắc quyết định như sau: • Nếu p ≤ : Bác bỏ H 0 • Nếu p > : Chấp nhận H 0 12

b. Kiểm định bỏ sót biến giải thích Để kiểm định các biến giải

b. Kiểm định bỏ sót biến giải thích Để kiểm định các biến giải thích bỏ sót, ta dùng kiểm định Reset của Ramsey, gồm các bước: Bước 1: Dùng OLS để ước lượng mô hình Yi = 1 + 2 X 2 i + ui Từ đó ta tính và R 2 old Bước 2: dùng OLS để ước lượng mô hình Tính R 2 new Kiểm định giả thiết H 0: 3 = 4 =… = k = 0 13

b. Kiểm định bỏ sót biến giải thích Bước 3: Tính n: số quan

b. Kiểm định bỏ sót biến giải thích Bước 3: Tính n: số quan sát, k: số tham số trong mô hình mới; m: số biến đưa thêm vào. Bước 4: Nếu F > F (m, n-k): Bác bỏ H 0, tức các hệ số 3, 4, … k không đồng thời bằng 0, mô hình cũ đã bỏ sót biến. Nếu dùng kết quả p-value thì quy tắc quyết định như sau: Nếu p ≤ : Bác bỏ H 0 Nếu p > : Chấp nhận H 0 14

c. Kiểm định giả thiết phân phối chuẩn của ui Để kiểm định phân

c. Kiểm định giả thiết phân phối chuẩn của ui Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm định χ2, hay kiểm định Jarque-Bera: Kiểm định giả thiết H 0: ui có phân phối chuẩn Nếu JB > χ2, Bác bỏ H 0, ngược lại, chấp nhận H 0 15

Tiêu chuẩn lựa chọn mô hình • • • R 2, R 2 điều

Tiêu chuẩn lựa chọn mô hình • • • R 2, R 2 điều chỉnh, Giá trị của hàm hợp lý log-likelihood (L), Tiêu chuẩn thông tin Akaike (AIC), Tiêu chuẩn thông tin Schwarz (SIC) 16

Tiêu chuẩn R 2 • R 2 đo lường % biến động của Y

Tiêu chuẩn R 2 • R 2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình. • R 2 càng gần 1, mô hình càng phù hợp. • Lưu ý: – Nó chỉ đo lường sự phù hợp “trong mẫu” – Khi so sánh R 2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau. – R 2 không giảm khi tăng thêm biến độc lập. 17

Tiêu chuẩn R 2 điều chỉnh ( R 2) • Ta thấy R 2

Tiêu chuẩn R 2 điều chỉnh ( R 2) • Ta thấy R 2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến được thêm vào mô hình lớn hơn 1. • Do vậy, R 2 là tiêu chuẩn tốt hơn R 2. • Lưu ý, các biến phụ thuộc cũng phải giống nhau. 18

Giá trị của hàm hợp lý log-likelihood (L) • Giá trị L càng lớn

Giá trị của hàm hợp lý log-likelihood (L) • Giá trị L càng lớn chứng tỏ mô hình càng phù hợp 19

Tiêu chuẩn thông tin Akaike (AIC) hay • Trong đó k là số biến

Tiêu chuẩn thông tin Akaike (AIC) hay • Trong đó k là số biến được ước lượng (gồm cả hệ số tự do) và n là cỡ mẫu. • Giá trị AIC càng nhỏ chứng tỏ mô hình càng phù hợp. 20

Tiêu chuẩn thông tin Schwarz (SC) hay • SC còn khắt khe hơn AIC.

Tiêu chuẩn thông tin Schwarz (SC) hay • SC còn khắt khe hơn AIC. • SC càng nhỏ, mô hình càng tốt. 21

6. Các chỉ tiêu đánh giá mô hình dự báo • Sai số dự

6. Các chỉ tiêu đánh giá mô hình dự báo • Sai số dự báo • Mẫu chia thành hai phần Mẫu khởi động: gồm các quan sát t=1, 2, 3. . . S-1 Mẫu kiểm tra: gồm các quan sát t=S, S+1, …S+h 22

6. 1 Trung bình sai số bình phương Mean Squared Error 23

6. 1 Trung bình sai số bình phương Mean Squared Error 23

6. 2 Căn bậc hai của trung bình sai số bình phương • Root

6. 2 Căn bậc hai của trung bình sai số bình phương • Root Mean Squared Error 24

6. 3 Trung bình sai số tuyệt đối • Mean Absolute Error • Các

6. 3 Trung bình sai số tuyệt đối • Mean Absolute Error • Các chỉ tiêu MSE, RMSE, MAE phụ thuộc đơn vị đo của biến dự báo. 25

6. 4 Trung bình của phần trăm sai số tuyệt đối • Mean Absolute

6. 4 Trung bình của phần trăm sai số tuyệt đối • Mean Absolute Percentage Error 26

6. 5 Hệ số bất đẳng thức Theil • Mean Absolute Error • TIC

6. 5 Hệ số bất đẳng thức Theil • Mean Absolute Error • TIC thuộc [0; 1] • TIC =0: hàm hồi quy dự báo chính xác 27

6. 6 Tỷ lệ độ chệch • Bias Proportion: trung bình của giá trị

6. 6 Tỷ lệ độ chệch • Bias Proportion: trung bình của giá trị dự báo khác so với trung bình giá trị thực tế 28

6. 7 Tỷ lệ phương sai • Variance Proportion: cho biết mức độ biến

6. 7 Tỷ lệ phương sai • Variance Proportion: cho biết mức độ biến thiên của giá trị dự báo khác mức độ biến thiên của giá trị thiực tế 29

6. 8 Tỷ lệ hiệp phương sai • Covariance Proportion: cho biết tỷ lệ

6. 8 Tỷ lệ hiệp phương sai • Covariance Proportion: cho biết tỷ lệ phần sai số của dự báo không mang tính hệ thống • BP+VP+CP=1 • Mô hình dự báo tốt: BP và VP nhỏ 30

Ví dụ 1 • Cho Y: lượng hàng bán được của mặt hàng A

Ví dụ 1 • Cho Y: lượng hàng bán được của mặt hàng A (kg/tháng) • X 2: giá bán mặt hàng A (ngàn đồng/kg) • X 3: giá bán của mặt hàng B (ngàn đồng/kg) • Z= 0 nếu khu vực khảo sát ở nông thôn, Z=1 nếu kv khảo sát ở thành phố Sử dụng Eviews, hãy kiểm định Wald để phát hiện thừa biến 31

X 2 2 3 3 4 4 5 5 5 6 6 7 7

X 2 2 3 3 4 4 5 5 5 6 6 7 7 5 4 7 8 8 X 3 14 13 15 16 11 16 10 17 13 12 14 15 13 14 12 16 15 18 16 20 Z 1 0 1 0 1 0 1 Y 20 19 18 18 17 17 16 16 15 15 14 14 13 12 12 15 16 12 10 11 32

B 1. Chạy mô hình U 33

B 1. Chạy mô hình U 33

B 2 Chạy mô hình R 34

B 2 Chạy mô hình R 34

B 3 Tính F • B 4 Tra bảng F (α, k-m, n-k) và

B 3 Tính F • B 4 Tra bảng F (α, k-m, n-k) và quyết định bác bỏ hoặc chấp nhận Ho. Ho: Thừa biến H 1: Không thừa biến 35

Ví dụ 1 Giả sử mô hình hồi quy B 1: Chạy mô hình

Ví dụ 1 Giả sử mô hình hồi quy B 1: Chạy mô hình hồi quy mẫu B 2: Xác định hệ số hồi quy không có ý nghĩa thống kê (có p>α). Lập giả thuyết Ho B 3: Chạy kiểm định Wald, xem giá trị F và p của F để quyết định bác bỏ hay chấp nhận Ho 36

B 1: Chạy hồi quy 37

B 1: Chạy hồi quy 37

 • Giả sử α=5%, ta thấy hệ số hồi quy của biến X

• Giả sử α=5%, ta thấy hệ số hồi quy của biến X 3 và Z có p > α nên biến X 3 và Z khác 0 không có ý nghĩa. • B 2: Chạy kiểm định Wald cho giả thiết H 0: β 3=β 4 =0 , ta có kết quả 38

39

39

 • Ta có F= 0. 082219, p=0. 9215> α nên ta chấp nhận

• Ta có F= 0. 082219, p=0. 9215> α nên ta chấp nhận giả thuyết H 0: β 3=β 4 =0. Tức biến X 3, Z không cần thiết đưa vào mô hình. • Kết luận: Lượng hàng trung bình bán được của mặt hàng A chỉ phụ thuộc vào giá bán của mặt hàng A, không phụ thuộc vào giá bán mặt hàng B và khu vực bán. 40