Bi ging tin ng dng Gv Trn Trung
Bài giảng tin ứng dụng • Gv: Trần Trung Hiếu • Bộ môn CNPM – Khoa CNTT – ĐH Nông Nghiệp Hà Nội • Email: tthieu@hua. edu. vn • Website: http: //ccd. hua. edu. vn/tthieu
CHƯƠNG IV: PH N TÍCH PHƯƠNG SAI, SO SÁNH VÀ KIỂM ĐỊNH Nội dung: Ø Phân tích phương sai Ø Kiểm định sự bằng nhau của 2 phương sai Ø So sánh trung bình 2 mẫu
Phân tích phương sai • Ví dụ • Công cụ chủ yếu để phân tích số liệu khi theo dõi ảnh hưởng của các mức nhân tố khác nhau tới kết quả hay ảnh hưởng tương tác của các nhân tố tới kết quả 3
1. 1 Phân tích phương sai một nhân tố • Được sử dụng để phân tích số liệu khi theo dõi ảnh hưởng của các mức nhân tố tới kết quả § Ví dụ: » Nhân tố: Công thức cho lợn ăn Mức nhân tố là các công thức khác nhau Xem ảnh hưởng tới năng suất như thế nào § Bài toán: Kiểm định giả thuyết về tác động giống nhau của các mức nhân tố » H 0: m 1 = m 2 =. . . =mn » H 1: tồn tại i, j mà mi khác mj • Các bước thực hiện • Chuẩn bị dữ liệu • Dữ liệu có thể bố trí dưới dạng cột hay hàng • Dữ liệu ứng với mỗi mức nhân tố có thể khác nhau • • Sử dụng công cụ Anova: Single Factor Phân tích kết quả • Nếu F thực nghiệm > F lý thuyết (Fcrit) thì các mức nhân tố có tác động khác nhau tới kết quả (chấp nhận H 1) Cần so sánh các công thức để rút ra công thức nào tốt nhất (sử dụng LSD) • Ngược lại: các mức nhân tố không có khác biệt đáng kể trong tác động tới kết quả (chấp nhận H 0) 4
So sánh các trung bình dùng chỉ số LSD • • • § § § 1. Sử dụng trong trường hợp kết luận các mức nhân tố có tác động khác nhau tới kết quả Sử dụng để chỉ rõ tác động khác nhau của các mức nhân tố tới kết quả là ntn: xếp thứ tự về sự tác động của các mức nhân tố tới kết quả Nếu cần so sánh trung bình CT Ti (với ri lần lặp) với trung bình CT Tj (với rj lần lặp) có thể tính thêm chỉ số LSD = tα, f * SQRT(s 2(1/ ri + 1/ rj ) tα, f = TINV(α, f) với α = 1 – p; f = df & within groups s 2= MS within groups: Phương sai chung ri, rj: số lần lặp lại dữ liệu đối với các mức nhân tố i, j Căn cứ kết luận § § Nếu |mi-mj| > LSD(i, j) thì tác động của mức nhân tố i, j là khác nhau và ngược lại Trong TH khác nhau, nếu mi > mj thì KLuan mức nhân tố i tốt hơn mức nhân tố j
Phân tích phương sai hai nhân tố 1. Ví dụ: Điều tra về chiều dài của cây, hai nhân tố xét đến là phân bón và nhiệt độ 2. Xảy ra hai trường hợp: § § § Nhân tố A và B không tương tác, biến động gây nên bởi tác động đồng thời của A và B gần sát 0. Nhân tố A và B có tương tác. Bài toán 1: Xét riêng tác động của các mức nhân tố A » H 0: m 1 = m 2 =. . . =mn » H 1: tồn tại i, j mà mi khác mj Bài toán 2: Xét riêng tác động của các mức nhân tố B » H 0: m 1 = m 2 =. . . =mn » H 1: tồn tại i, j mà mi khác mj Bài toán 3: Xét riêng tác động đồng thời của (A, B) » H 0: Tác động đồng thời của 2 nhân tố không có tác động đáng kể tới kết quả » H 1: Tác động đồng thời của 2 nhân tố có tác động đáng kể tới kết quả 6
Phân tích phương sai hai nhân tố không tương tác 1. Không xét đến tác động đồng thời của hai nhân tố A, B 2. Cần giải quyết bài toán 1, bài toán 2 3. Các bước thực hiện § Bố trí dữ liệu § Sử dụng công cụ: Anova: Two-Factor Without Replication § Phân tích kết quả: » Xét giá trị F thực nghiệm và F lý thuyết tương ứng với các nhân tố, nếu F thực nghiệm > F lý thuyết thì kết luận các mức của nhân tố tương ứng có ảnh hưởng khác nhau tới kết quả và ngược lại 7
Phân tích phương sai hai nhân tố tương tác 1. Xét đến cả tác động đồng thời của 2 nhân tố A, B 2. Cần giải quyết 3 bài toán về phân tích phương sai 3. Các bước thực hiện § § § Bố trí dữ liệu Sử dụng công cụ Anova: Two Factor With Replication Phân tích kết quả » Xét giá trị F thực nghiệm và F lý thuyết tương ứng với các nhân tố, nếu F thực nghiệm > F lý thuyết thì kết luận các mức của nhân tố tương ứng có ảnh hưởng khác nhau tới kết quả (chấp nhận H 1) và ngược lại (chấp nhận H 0) » Xét giá trị F tn và F lt tương ứng với tác động đồng thời của hai nhân tố (interaction), nếu Ftn > Flt thì chấp nhận H 1, tác động đồng thời là đáng kể tới kết quả, ngược lại chấp nhận H 0 8
2. Kiểm định sự bằng nhau của hai phương sai § Kiểm định hai phía » H 0: δ 12 = δ 22 (phương sai của biến X bằng phương sai của biến Y) » Đối thuyết H 1: δ 12 ≠ δ 22 § Kiểm định một phía » H 0: δ 12 = δ 22 (phương sai của biến X bằng phương sai của biến Y) » Đối thuyết H 1: δ 12 > δ 22 9
Phân tích kết quả Trong Excel, sử dụng công cụ F-Test Two Sample for Variances để kiểm định một phía 1. Nếu F < 1 § nếu F > F Critical one-tail thì chấp nhận H 0 (δ 12 = δ 22 ) § ngược lại bác bỏ H 0, chấp nhận H 1 δ 12 > δ 22 2. Nếu F >= 1 § nếu F < F Critical one-tail thì chấp nhận H 0 (δ 12 = δ 22 ) § ngược lại bác bỏ H 0, chấp nhận H 1 δ 12 > δ 22 10
3. So sánh trung bình 2 mẫu • Với X, Y là 2 DLNN độc lập, có phân phối chuẩn N(m. X; σ2 X), N(m. Y; σ2 Y) ta có thể gặp các bài toán về kiểm định giả thuyết giá trị trung bình của 2 mẫu như sau: - Kiểm định hai phía: - Giả thuyết H 0: m. X = m. Y+d Đối thuyết H 1: m. X ≠ m. Y+d Kiểm định một phía: Giả thuyết H 0: m. X = m. Y+d Đối thuyết H 1: m. X > m. Y+d hoặc Giả thuyết H 0: m. X = m. Y+d Đối thuyết H 1: m. X < m. Y+d * Khi giá trị sai khác d=0 ta có bài toán kiểm định sự bằng nhau của 2 giá trị trung bình
3. So sánh trung bình 2 mẫu Các trường hợp: 1. Lấy mẫu độc lập § § TH biết phương sai σ2 X, σ2 Y dữ liệu của 2 mẫu được lấy ngẫu TH không biết phương nhiên, 2 sai mẫu là độc lập với nhau » Kích thước mẫu lớn (n. X>=30; n. Y>=30) » Kích thước mẫu nhỏ • • Hai phương sai bằng nhau dữ liệu của 2 mẫu lấy theo từng cặp Hai phương sai khác nhau tương ứng 2. Lấy mẫu theo cặp
3. So sánh trung bình 2 mẫu 1. So sánh TB 2 mẫu độc lập khi biết phương sai σ 2 X , σ 2 Y § Qui tắc kiểm định trong xác suất » » Xét đại lượng Z=(Xtb-Ytb-(m. X-m. Y)-d)/sqrt(σ2 X/n. X+ σ2 Y/n. Y) có phân phối chuẩn tắc Sử dụng khi trong một tình huống nào đó ta đã biết Nếu giả thuyết H 0 đúng thì Z=(Xtb-Ytb-d)/sqrt(σ2 X/n. X+ σ2 Y/n. Y) được phương sai (thường xảy ra khi điều tra lại một có phân tổng phốithể chuẩn tắc thời khi đó có bảng quyphương tắc kiểm sau một giantachưa lâu, nên saiđịnh sau: chưa thay đổi, do đó lấy phương sai của lần điều tra trước để tính toán) * Trường hợp này được trình bày chi tiết, các trường hợp khác tương tự
H 0: m. X = m. Y+d H 1: m. X ≠ m. Y+d H 0: m. X = m. Y+d H 1: m. X > m. Y+d H 0: m. X = m. Y+d H 1: m. X < m. Y+d Ta có: P(|Z|>Zα/2)=α từ đây có quy tắc bác bỏ H 0 là: +Nếu |Z|>Zα/2 quyết định bác bỏ H 0 +Nếu |Z|<=Zα/2 quyết định chấp nhận H 0 Ta có: P(Z>Zα)=α từ đây có quy tắc bác bỏ H 0 là: +Nếu Z>Zα quyết định bác bỏ H 0 +Nếu Z<=Zα quyết định chấp nhận H 0 Ta có: P(Z<-Zα)=α từ đây có quy tắc bác bỏ H 0 là: +Nếu Z<-Zα quyết định bác bỏ H 0 +Nếu Z>=-Zα quyết định chấp nhận H 0 * Zα/2, Zα được tra cứu trong bảng phân phối chuẩn tắc N(0, 1) * Trong excel có thể tính Zα=normsinv(1 -α), ngược lại biết Zα có thể tính α =1 -normsdist(Zα)
3. So sánh trung bình 2 mẫu 1. So sánh TB 2 mẫu độc lập khi biết phương sai σ2 X, σ2 Y § Ví dụ: » So sánh giá trị trung bình của số cừu mắc bệnh trong 8 nhóm tiêm phòng và 8 nhóm đối chứng. Mẫu được lấy độc lập, biết phương sai tương ứng là 22, 18. » Các bước thực hiện trong Excel:
Tool Data Analysis, chọn công cụ phân tích: z-Test: Two Sample for Means
Hiện cửa sổ Miền biến 1 Miền biến 2 Giả thiết về sự khác nhau của hai trung bình (d) Phương sai của biến 1 Phương sai của biến 2 Nếu có nhãn thì chọn Nơi để kết quả
Kết quả Trung bình Phương sai Số quan sát Giả thiết sự khác nhau của hai trung bình (d) Z thực nghiệm P một phía và hai phía Z lý thuyết (tới hạn) một phía (Zα) và hai phía (Zα/2)
1. So sánh TB 2 mẫu độc lập khi biết phương sai σ2 X, σ2 Y * Căn cứ để kết luận 1. Kiểm định 2 phía § § 2. Nếu |Ztn|> Zhai phía (z critical two-tail) thì bác bỏ giả thuyết H 0, chấp nhận H 1 (m. X≠m. Y+d) Nếu |Ztn|<= Zhai phía (z critical two-tail) thì chấp nhận giả thuyết H 0 (m. X=m. Y+d) Kiểm định một phía § Nếu Ztn>0 ta có bài toán kiểm định » § H 0: m. X = m. Y+d H 1: m. X > m. Y+d Nếu Ztn> Zmột phía (z critical one-tail) thì bác bỏ H 0 và ngược lại Nếu Ztn<0 ta có bài toán kiểm định » H 0: m. X = m. Y+d H 1: m. X < m. Y+d Nếu Ztn<-Zmột phía (z critical one-tail) thì bác bỏ H 0 và ngược lại
Phân tích kết quả Kiểm định 2 phía: Ta có |z|=2. 068>z 2 phía nên bác bỏ giả thiết H 0 (m. X=m. Y) Kiểm định 1 phía: Vì z<0 nên ta xét bài toán kiểm định với đối thuyết H 1: m. X<m. Y Ta có z=-2. 068<-zmột phía=-1. 644 nên bác bỏ H 0, chấp nhận H 1 (m. X<m. Y) Nhận xét về giá trị của Pmột phía và Phai phía so với mức xác suất α=0. 05 ? ?
Thực hành 1. Sinh viên thực hành ví dụ vừa rồi với dữ liệu đảo ngược như sau (σ2 X =22, σ2 Y=18):
3. So sánh trung bình 2 mẫu 2. So sánh trung bình 2 mẫu độc lập trường hợp không biết phương sai và kích thước mẫu lớn (n. X>=30, n. Y>=30) § Xét đại lượng Z=(Xtb-Ytb-(m. X-m. Y)-d)/sqrt(s 2 X/n. X+ s 2 Y/n. Y) có phân phối xấp xỉ phân phối chuẩn tắc § (trong đó s 2 X, s 2 Y là các giá trị xấp xỉ của phương sai σ2 X, σ 2 Y có thể tính được bằng hàm VAR) § Tương tự trường hợp đã biết phương sai, thay thế s 2 X bởi σ2 X, s 2 Y bởi σ2 Y và sử dụng công cụ z-Test: two sample for means ta có thể giải quyết bài toán này.
3. So sánh trung bình 2 mẫu độc lập trường hợp không biết phương sai và kích thước mẫu nhỏ (n. X<30 và n. Y<30) § § Để giải quyết bài toán này ta cần có giả thiết về sự bằng nhau hay khác nhau của 2 phương sai σ2 X, σ2 Y Nếu đề bài chưa cho biết thông tin đó, cần kiểm định thêm một giả thuyết phụ về sự bằng nhau hay khác nhau của 2 phương sai σ2 X, σ2 Y đã học ở bài trước (sử dụng công cụ F-Test: Two. Sample for Variances) » » Nếu σ2 X = σ2 Y ta giải quyết bài toán sử dụng công cụ phân tích t. Test: Two-Sample Assuming Equal Variances Nếu σ2 X ≠ σ2 Y ta giải quyết bài toán sử dụng công cụ phân tích t. Test: Two-Sample Assuming Unequal Variances
Ví dụ 1: t-Test: Two-Sample Assuming Equal Variances (giả thiết đề bài cho hoặc sau khi kiểm định có kết quả 2 phương sai bằng nhau)
Ví dụ 1: Kết quả Trung bình Phương sai Số quan sát Phương sai chung Giả thiết sự khác nhau của hai trung bình Bậc tự do = n 1 + n 2 -2 t thực nghiệm P một phía và hai phía t lý thuyết (tới hạn) một phía và hai phía
t-Test: Two-Sample Assuming Equal Variances 1. Căn cứ để kết luận § Kiểm định 2 phía » » § Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H 0 và ngược lại Trong ví dụ 1: |ttn|=1. 5187<thai phía=2. 009 nên chấp nhận H 0 (m. X=m. Y). Giá trị Phai phía> α là phù hợp với kết luận trên Kiểm định một phía » » Nếu ttn>0 ta có bài toán kiểm định H 0: m. X = m. Y+d H 1: m. X > m. Y+d • Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H 0 và ngược lại Nếu ttn<0 ta có bài toán kiểm định H 0: m. X = m. Y+d H 1: m. X < m. Y+d • Nếu ttn<-tmột phía (t critical one-tail) thì bác bỏ H 0 và ngược lại
Ví dụ 2: t-Test: Two-Sample Assuming Unequal Variances (giả thiết đề bài cho hoặc sau khi kiểm định có kết quả 2 phương sai không bằng nhau)
t-Test: Two-Sample Assuming Unequal Variances 1. Căn cứ để kết luận (giống trường hợp 2 phương sai bằng § nhau, chỉ khác ở giá trị ttn do khác về công thức tính) Kiểm định 2 phía » » § Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H 0 và ngược lại Trong ví dụ 2: |ttn|=1. 7133<thai phía=2. 009 nên chấp nhận H 0 (m. X=m. Y). Giá trị Phai phía> α là phù hợp với kết luận trên Kiểm định một phía » » Nếu ttn>0 ta có bài toán kiểm định H 0: m. X = m. Y+d H 1: m. X > m. Y+d • Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H 0 và ngược lại Nếu ttn<0 ta có bài toán kiểm định H 0: m. X = m. Y+d H 1: m. X < m. Y+d • Nếu ttn<-tmột phía (t critical one-tail) thì bác bỏ H 0 và ngược lại
3. So sánh trung bình 2 mẫu 1. So sánh trung bình 2 mẫu được lấy theo cặp § Ví dụ:
Vào Tools/Data Analysis
Hiện ra của sổ Miền của biến 1, kể cả hàng đầu của mẫu quan sát. Miền của biến 2 Giả thiết về hiệu hai trung bình của hai tổng thể. H 0: m 1 = m 2 thì ghi 0. Nếu H 0: m 1 = m 2 + d thì ghi d Nếu có nhãn thì chọn Chọn miền đặt kết quả
Kết quả
t-Test: Paired Two Sample for Means 1. Căn cứ để kết luận (giống trường hợp so sánh trung bình 2 mẫu độc lập có kích thước mẫu nhỏ) § Kiểm định 2 phía » » § Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H 0 và ngược lại Trong ví dụ trên: |ttn|=3. 3105>thai phía=2. 3646 nên chấp nhận H 1 (m. X≠m. Y). Giá trị Phai phía<α là phù hợp với kết luận trên Kiểm định một phía » » Nếu ttn>0 ta có bài toán kiểm định H 0: m. X = m. Y+d H 1: m. X > m. Y+d • Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H 0 và ngược lại • Trong ví dụ trên: ttn>0 và ttn> tmột phía=1. 8945 nên chấp nhận H 1 (m. X > m. Y). Giá trị Pmột phía<α là phù hợp với kết luận trên Nếu ttn<0 ta có bài toán kiểm định H 0: m. X = m. Y+d H 1: m. X < m. Y+d • Nếu ttn<-tmột phía (t critical one-tail) thì bác bỏ H 0 và ngược lại
- Slides: 34