Thng K Trong Nghin Cu Khoa Hc CITAR
- Slides: 81
Thống Kê Trong Nghiên Cứu Khoa Học CITAR Workshop – Hue , Vietnam July 2008 Hao Duong
Nội Dung n n n Đo lường tần suất bệnh Thiết kế nghiên cứu và các đo lường tương quan Một số test thống kê thường gặp
Đo lường tần suất bệnh n n Xác định tần suất bệnh hoặc những vấn đề sức khoẻ khác trong những nhóm dân số quan tâm. Hai loại đo lường tần suất bệnh: tình trạng mới mắc và tỷ lệ lưu hành.
Đo lường tần suất bệnh n Định nghĩa: n n Tình trạng mới mắc đo lường những trường hợp mới mắc bệnh trong một khoảng thời gian. Tỷ lệ lưu hành đo lường những trừơng hợp bệnh hiện có tại một thời điểm đặc biệt hoặc trong một khoảng thời gian.
Đo lường tần suất bệnh Dân số có nguy cơ
Đo lường tần suất bệnh n P=C/N n n P: Tỷ lệ lưu hành C: Số lượng bệnh hiện có N: Số lượng dân số ổn định Loại nghiên cứu: n n Nghiên cứu cắt ngang Đăng kí bệnh
Đo lường tần suất bệnh n CI=I/N n n CI: Tỷ lệ phát sinh tích luỹ I: Số lượng bệnh mới mắc N: Số lượng dân số không bị bệnh được theo dõi trong một khoảng thời gian IR=I/PT n n n IR: Tỷ suất phát sinh I: Số lượng bệnh mới mắc PT: Thời gian trải nghiệm của dân số có nguy cơ
Đo lường tần suất bệnh n Loại nghiên cứu: n n n Đăng kí bệnh Nghiên cứu cohort Nghiên cứu thử nghiệm
Đo lường tần suất bệnh D+ D- n E+ a b a+b E- c d c+d a+c b+d a+b+c+d n n n D+ : bệnh D- : không bệnh E+ : phơi nhiễm E- : không phơi nhiễm
Đo lường tần suất bệnh n n Nếu a+b là số ngươì có nguy cơ thì đây là tỷ lệ phát sinh tích luỹ Nếu a+b là số người năm có nguy cơ thì đây là tỷ suất phát sinh/mật độ phát sinh Re = a/a+b Rne= c/c+d
Tỷ lệ phát sinh tích luỹ
Tỷ lệ phát sinh tích luỹ n Ví dụ: Sử dụng thuốc giảm ăn Nhồi máu cơ tim có không tổng có 30 470 500 không 11 489 500 tổng 41 959 1000
Tỷ lệ phát sinh tích luỹ n n Re=a/a+b 95% CI of Re= Re ±Z*SE(Re) n n SE(Re) là phương sai của Re. Phương sai của Re là:
Sự phân bố Z (Sự phân bố bình thường chuẩn) http: //www. sjsu. edu/faculty/gerstman/Stat. Primer/negative-z. pdf
Bảng Z n http: //www. sjsu. edu/faculty/gerstma n/Stat. Primer/negative-z. pdf 2. 5% -1. 96 2. 5% 1. 96
Tỷ lệ phát sinh tích luỹ Re=30/500=0. 06, or 6 per 100 95% CI for Re=0. 06± 1. 96*0. 01 95% CI for the risk estimate of 6 per 100 is 4 -8 per 100
Tỷ suất phát sinh/Mật độ phát sinh
Tỷ suất phát sinh/Mật độ phát sinh a: số bệnh PT: người-thời gian E+: phơi nhiễm E-: không phơi nhiễm case PT E+ a PT 1 E- c PT 2 a+c PT 1+PT 2
Tỷ suất phát sinh/Mật độ phát sinh
Tỷ suất phát sinh/Mật độ phát sinh n Ví dụ: Ung thư vùng miệng Người thời gian (năm) Hút thuốc lá 15 4768. 5 Không hút thuốc lá 5 4872. 5
Tỷ suất phát sinh/Mật độ phát sinh 95% CI for IR=3. 1± 1. 96*0. 8 95% CI for the rate estimate of 3. 1 per 1000 person-years is 1. 4 -4. 6 per 1000 person-years
Đo lường tần suất bệnh n n P=I*D nếu dân số ổn định và bệnh hiếm gặp. P=(I*D)/[(I*D)+1] nếu bệnh không hiếm gặp.
Thiết kế nghiên cứu và các đo lường tương quan
Thiết kế nghiên cứu và các đo lường tương quan n Nghiên cứu cohort: n n Câu hỏi nghiên cứu: So với những người không phơi nhiễm, những người phơi nhiễm có xu hướng dễ mắc bệnh hơn? Đo lường: n Nguy cơ tương đối (Tỷ số nguy cơ)
Nghiên cứu cohort Tình trạng bệnh có Tình trạng phơi nhiễm có không tổng a b a +b c d c +d a +c b +d N
Nghiên cứu cohort n Ví dụ: Sử dụng thuốc giảm ăn Nhồi máu cơ tim có không tổng có 30 470 500 không 11 489 500 tổng 41 959 1000 Nguy cơ tương đối (Tỷ số nguy cơ)
Nghiên cứu cohort
Nghiên cứu cohort RR=(30/100)/(11/100)=2. 7 95% CI for the relative risk of 2. 7 is 1. 4 -5. 3
Nghiên cứu cohort n Giải thích: Những người dùng thuốc hạn chế ăn có nguy cơ bị nhồi máu cơ tim gấp 2. 7 lần so với những người không sử dụng thuốc.
Nghiên cứu cohort n Ví dụ: Ung thư vùng miệng Hút thuốc lá 15 Người thời gian (năm) 4768. 5 Không hút thuốc lá 5 4872. 5 Tỷ số của tỷ xuất phát sinh
Nghiên cứu cohort
Nghiên cứu cohort n Giải thích: Những người hút thuốc lá có 3. 1 lần tỷ xuất mắc bệnh ung thư vùng miệng so với những người không hút thuốc.
Thiết kế nghiên cứu và đo lường mối liên quan n Nghiên cứu bệnh-chứng: n n Câu hỏi nghiên cứu: So sánh với nhóm không bị bệnh, nhóm bị bệnh có xu hướng bị phơi nhiễm với một yếu tố nào đó hơn? Đo lường: n Tỷ số số chênh
Nghiên cứu bệnh chứng Tình trạng bệnh có Tình trạng phơi nhiễm không tổng có a b a +b không c d c +d a +c b +d N
Nghiên cứu bệnh chứng
Nghiên cứu bệnh chứng n Ví dụ: Còn khả năng miễn dịch HIV + ung thư cổ tử (CD 4 count>200 cung cells/micro. L and a VL<10, 000 copies/m. L) HIV tổng có 1 35 36 không tổng 13 14 20 55 33 69 Leitao et al. , Cancer 2008
Nghiên cứu bệnh chứng OR=(1*20)/(13*35)=0. 04 95% CI for the odds ratio of 0. 04 is 0. 01 -0. 33
Nghiên cứu bệnh chứng n Giải thích: Những bệnh nhân HIV mà phát triển ung thư cổ tử cung, có 0. 04 lần số chênh (odds) “có khả năng miễn dịch” so với bệnh nhân HIV không có ung thư cổ tử cung.
Nghiên cứu cắt ngang Tình trạng bệnh có Tình trạng có phơi nhiễm không tổng a b a +b c d c +d a +c b +d N
Nghiên cứu cắt ngang n Thiết kế nghiên cứu cắt ngang: n Câu hỏi nghiên cứu: n n n So với nhóm không bị phơi nhiễm, nhóm phơi nhiễm có xu hướng bị bệnh hơn? So với nhóm không bị bệnh, nhóm bị bệnh có xu hướng bị phơi nhiễm hơn? Đo lường: n Tỷ số lưu hành (giống RR) or Tỷ số chênh lưu hành (giống OR)
Nghiên cứu cắt ngang n n Tỷ số lưu hành bệnh trong nhóm phơi nhiễm và nhóm không phơi nhiễm: Tỷ số chênh lưu hành:
Nghiên cứu cắt ngang n Tỷ số tình trạng phơi nhiễm trong nhóm bệnh và nhóm không bị bệnh:
Thiết kế nghiên cứu và đo lường mối liên quan n RR, OR (PR, POR) = 1: n Không có mối liên quan RR, OR (PR, POR) > 1: n Liên quan thuận RR, OR (PR, POR) < 1: n Liên quan nghịch
Thiết kế nghiên cứu và đo lường mối liên quan n 95% CI chứa giá trị 1: n n Không liên quan có ý nghĩa 95% CI không chứa giá trị 1: n Liên quan có ý nghĩa: n n Liên quan thuận hoặc Liên quan nghịch
Lệnh trong Stata Cohort studies cs var_case var_exposed [if] [in] [weight] [, cs_options] csi #a #b #c #d [, csi_options] ir var_case var_exposed var_time [if] [in] [weight] [, ir_options] iri #a #b #N 1 #N 2 [, tb level(#)] Case-control studies cc var_case var_exposed [if] [in] [weight] [, cc_options] cci #a #b #c #d [, cci_options] Matched case-control studies mcc var_exposed_case var_exposed_control [if] [in] [weight] [, tb level(#)] mcci #a #b #c #d [, tb level(#)]
Test thống kê
Test thống kê n t-tests: n n n t-test một mẫu t-test hai mẫu: t-test cặp đôi và t-test không cặp test sự đồng nhất hoặc (không) liên quan: n n n test chi bình phương test chính xác của Fisher test của Mc. Nemar
t-test một mẫu n So sánh giá trị trung bình của một mẫu với giá trị trung bình của dân số giả định : trung bình mẫu : sai số chuẩn : trung bình dân số với n-1 độ tự do
t-test một mẫu n Gỉa thuyết: n n Các giá trị của mẫu phải độc lập Sự phân bố của các giá trị trong dân số là chuẩn
t-test một mẫu n n n Ví dụ: df=n-1=10 -1=9 Chọn alpha
Bảng giá trị t http: //oak. snr. missouri. edu/nr 3110/pdf/table 1. pdf
t-test một mẫu trong Stata. ttest hypertension=100 One-sample t test ---------------------------------------Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] -----+----------------------------------hypert~n | 10 112 4. 358899 13. 78405 102. 1395 121. 8605 ---------------------------------------mean = mean(hypertension) t = 2. 7530 Ho: mean = 100 degrees of freedom = 9 Ha: mean < 100 Pr(T < t) = 0. 9888 Ha: mean != 100 Pr(|T| > |t|) = 0. 0224 Ha: mean > 100 Pr(T > t) = 0. 0112
t-test 2 mẫu độc lập n n So sánh giá trị trung bình của một biến giữa 2 nhóm cá nhân Ví dụ: n n So sánh huyết áp trung bình của nam và nữ So sánh huyết áp trung bình sau khi điều trị thuốc A và thuốc B
t-test 2 mẫu độc lập (đồng phương sai) with n(x)+n(y)-2 degree of freedom
t-test 2 mẫu độc lập n Gỉa thuyết: n n n Sự độc lập của các giá trị quan sát Sự phân bố chuẩn của dân số Đồng phương sai
t-test 2 mẫu độc lập (khác phương sai)
t-test 2 mẫu độc lập n Thường sử dụng t-test đồng phương sai trừ trường hợp kích thước mẫu không giống nhau và: (a) mẫu nhỏ có phương sai lớn và; (b) và phương sai mẫu nhỏ lớn hơn gấp đôi phương sai của mẫu lớn, thì dùng t-test khác phương sai.
Phương sai
t-test 2 mẫu độc lập trong Stata (đồng phương sai). ttest hypertension, by(gender) Two-sample t test with equal variances ---------------------------------------Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] -----+----------------------------------female | 10 112 4. 358899 13. 78405 102. 1395 121. 8605 male | 10 123. 5 3. 253204 10. 28753 116. 1407 130. 8593 -----+----------------------------------combined | 20 117. 75 2. 957484 13. 22627 111. 5599 123. 9401 -----+----------------------------------diff | -11. 5 5. 439056 -22. 92703 -. 0729668 ---------------------------------------diff = mean(female) - mean(male) t = -2. 1143 Ho: diff = 0 degrees of freedom = 18 Ha: diff < 0 Pr(T < t) = 0. 0244 Ha: diff != 0 Pr(|T| > |t|) = 0. 0487 Ha: diff > 0 Pr(T > t) = 0. 9756
t-test 2 mẫu độc lập trong Stata (khác phương sai). ttest hypertension, by(gender) unequal Two-sample t test with unequal variances ---------------------------------------Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] -----+----------------------------------female | 10 112 4. 358899 13. 78405 102. 1395 121. 8605 male | 10 123. 5 3. 253204 10. 28753 116. 1407 130. 8593 -----+----------------------------------combined | 20 117. 75 2. 957484 13. 22627 111. 5599 123. 9401 -----+----------------------------------diff | -11. 5 5. 439056 -22. 9937 -. 0063045 ---------------------------------------diff = mean(female) - mean(male) t = -2. 1143 Ho: diff = 0 Satterthwaite's degrees of freedom = 16. 6521 Ha: diff < 0 Pr(T < t) = 0. 0249 Ha: diff != 0 Pr(|T| > |t|) = 0. 0499 Ha: diff > 0 Pr(T > t) = 0. 9751
t-test cặp đôi (phụ thuộc) n n Còn được gọi là test đo lường lặp lại, test mẫu liên quan. Một biến được đo lường ở một nhóm cá nhân tại 2 thơì điểm khác nhau.
t-test cặp đôi (phụ thuộc) : trung bình của những giá trị khác nhau Sd: độ lệch chuẩn của những giá trị khác nhau với n-1 độ tự do
t-test cặp đôi (phụ thuộc) n Gỉa thuyết: n Sự phân bố của những giá trị khác nhau trong dân số là chuẩn.
Bảng giá trị t http: //oak. snr. missouri. edu/nr 3110/pdf/table 1. pdf
t-test cặp đôi trong Stata. ttest hypertension 1= hypertension 2 Paired t test ---------------------------------------Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] -----+----------------------------------hypert~1 | 10 123. 5 3. 253204 10. 28753 116. 1407 130. 8593 hypert~2 | 10 112 4. 358899 13. 78405 102. 1395 121. 8605 -----+----------------------------------diff | 10 11. 5 6. 193635 19. 58599 -2. 510975 25. 51098 ---------------------------------------mean(diff) = mean(hypertension 1 - hypertension 2) t = 1. 8567 Ho: mean(diff) = 0 degrees of freedom = 9 Ha: mean(diff) < 0 Pr(T < t) = 0. 9518 Ha: mean(diff) != 0 Pr(|T| > |t|) = 0. 0963 Ha: mean(diff) > 0 Pr(T > t) = 0. 0482
Những trường hợp đặc biệt của t-test n n t-test cặp đôi (phân bố không chuẩn): signed-rank test t-test 2 mẫu độc lập (phân bố không chuẩn): rank-sum test So sánh giá trị trung bình của nhiều nhóm (phân bố chuẩn): One way ANOVA So sánh giá trị trung bình của nhiều nhóm (phân bố không chuẩn): Kruskal-Wallis analysis of ranks
Test chi bình phương n n n Áp dụng cho hai biến phân loại So sánh phần trăm hoặc tỷ lệ Thường được sử dụng trong nghiên cứu cohort hoặc nghiên cứu bệnh chứng
Test chi bình phương D+ D- E+ a b a+b E- c d c+d a+c b+d n df=(row-1)*(colum-1)
Test chi bình phương n Ví dụ: Sử dụng thuốc chán ăn Nhồi máu cơ tim có không tổng có 30 470 500 không 11 489 500 tổng 41 959 1000
Bảng chi bình phương http: //www. ento. vt. edu/~sharov/Pop. Ecol/tables/chisq. html
Test chi bình phương n n n Với 1 độ tự do và 95% CI, giá trị tương ứng là 3. 84 = (1. 96)*(1. 96) 9. 2 > 3. 84: loại bỏ giả thuyết “null” Kết luận: Có mối liên quan có ý nghĩa giữa sự dụng thuốc chán ăn và nhồi máu cơ tim.
Chi bình phương trong Stata. tabi 30 47011 959, chi col row | 1 2 | Total ------+-----------+-----1 | 30 470 | 500 | 6. 00 94. 00 | 100. 00 | 73. 17 32. 89 | 34. 01 ------+-----------+-----2 | 11 959 | 970 | 1. 13 98. 87 | 100. 00 | 26. 83 67. 11 | 65. 99 ------+-----------+-----Total | 41 1, 429 | 1, 470 | 2. 79 97. 21 | 100. 00 | 100. 00 Pearson chi 2(1) = 28. 8127 Pr = 0. 000
Chi bình phương trong Stata. tabi 30 47011 95913 400, chi expect +----------+ | Key | |----------| | frequency | | expected frequency | +----------+ | col row | 1 2 | Total ------+-----------+-----1 | 30 470 | 500 | 14. 3 485. 7 | 500. 0 ------+-----------+-----2 | 11 959 | 970 | 27. 8 942. 2 | 970. 0 ------+-----------+-----3 | 13 400 | 413 | 11. 8 401. 2 | 413. 0 ------+-----------+-----Total | 54 1, 829 | 1, 883 | 54. 0 1, 829. 0 | 1, 883. 0 Pearson chi 2(2) = 28. 1940 Pr = 0. 000
Test chính xác của Fisher n Áp dụng khi giá trị mong đợi nhỏ hơn 1 hoặc hơn 20% của các nhóm (cells) có giá trị nhỏ hơn 5.
Test chính xác của Fisher trong Stata. tabi 3 2012 15, chi exact expect +----------+ | Key | |----------| | frequency | | expected frequency | +----------+ | col row | 1 2 | Total ------+-----------+-----1 | 3 20 | 23 | 6. 9 16. 1 | 23. 0 ------+-----------+-----2 | 12 15 | 27 | 8. 1 18. 9 | 27. 0 ------+-----------+-----Total | 15 35 | 50 | 15. 0 35. 0 | 50. 0 Pearson chi 2(1) = 5. 8316 Pr = 0. 016 Fisher's exact = 0. 029 1 -sided Fisher's exact = 0. 016
Test chính xác của Fisher trong Stata. tabi 3 277 40, chi exact expect +----------+ | Key | |----------| | frequency | | expected frequency | +----------+ | col row | 1 2 | Total ------+-----------+-----1 | 3 27 | 30 | 3. 9 26. 1 | 30. 0 ------+-----------+-----2 | 7 40 | 47 | 6. 1 40. 9 | 47. 0 ------+-----------+-----Total | 10 67 | 77 | 10. 0 67. 0 | 77. 0 Pearson chi 2(1) = 0. 3881 Pr = 0. 533 Fisher's exact = 0. 732 1 -sided Fisher's exact = 0. 399
Test chính xác của Fisher trong Stata. tabi 3 277 4012 50, chi exact expect +----------+ | Key | |----------| | frequency | | expected frequency | +----------+ | col row | 1 2 | Total ------+-----------+-----1 | 3 27 | 30 | 4. 7 25. 3 | 30. 0 ------+-----------+-----2 | 7 40 | 47 | 7. 4 39. 6 | 47. 0 ------+-----------+-----3 | 12 50 | 62 | 9. 8 52. 2 | 62. 0 ------+-----------+-----Total | 22 117 | 139 | 22. 0 117. 0 | 139. 0 Pearson chi 2(2) = 1. 3745 Pr = 0. 503 Fisher's exact = 0. 544
Test của Mc. Nemar n n Mẫu không độc lập. Cặp đôi (e. g. cặp đôi giữa bệnh và chứng liên quan đến tuổi, chủng tộc, giới). Controls Cases E+ E- E+ a c Eb d
Test của Mc. Nemar OR=b/c
Test của Mc. Nemar trong Stata. mcci 8 8 3 8 | Controls | Cases | Exposed Unexposed | Total -----------------+-----------Exposed | 8 8 | 16 Unexposed | 3 8 | 11 -----------------+-----------Total | 11 16 | 27 Mc. Nemar's chi 2(1) = 2. 27 Prob > chi 2 = 0. 1317 Exact Mc. Nemar significance probability = 0. 2266 Proportion with factor Cases. 5925926 Controls. 4074074 [95% Conf. Interval] --------------difference. 1851852 -. 0822542. 4526246 ratio 1. 454545. 891101 2. 374257 rel. diff. . 3125 -. 0243688. 6493688 odds ratio 2. 666667. 6400364 15. 6064 (exact)
Tài liệu tham khảo 1. 2. 3. 4. 5. Principles of Biostatistics, 2000. Marcello Pagano and Kimberlee Gauvreau. Activ. Epi Companion Textbook. David G. Kleinbaum, Kevin M. Sullivan, Nancy D. Barker. Statistics with Stata, for Version 9 by Lawrence C. Hamilton. Lecture notes. Dr. Kay Dunn, Department of Biostatistics, UT SPH. Lecture notes. Dr. Tarwater, Department of Biostatistics, UT SPH, El paso Regional Campus.
- Thng
- Mẹ mua cho lan một chiếc cặp sách giá 15000
- Chu nghia xa hoi khoa hoc
- Hộp khóa nòng
- Tạo thuộc tính lookup cho các trường khóa ngoại
- Tạo thuộc tính lookup cho các trường khóa ngoại
- Bìa tiểu luận trường đại học đà lạt
- Como referenciar una imagen
- Citar ulima
- "autor, a.a., & autor, b."
- Formato ensayo apa
- Como citar nanda en vancouver
- Cmo citar
- Como citar un articulo de la ley
- Como citar autores en un ensayo
- Como hacer una cita textual en un ensayo
- Cita directa e indirecta
- Citar una imagen
- Cmo citar
- Ejercicios de citas textuales
- Las citas de mas de 40 palabras
- Doi apa
- Apa
- Một đời lần trong đêm tối
- Vẽ con gà trống
- So sánh hơn và so sánh nhất
- Layout trong java
- điền số thích hợp vào ô trống
- Slide người trong bao
- Kìa trông huy hoàng
- Raiserror trong sql
- Nhân giống cây trồng
- đường đi của máu trong vòng tuần hoàn nhỏ
- đàng trong đàng ngoài
- Nguyên tố phổ biến nhất trong vỏ trái đất
- Bảng âm vị tiếng việt
- Runnable trong java
- Công thức biến đổi z
- ông mặt trời rực rỡ chiếu ngàn tia nắng vàng
- Trọng lượng riêng của một số chất
- Gió hun hút lạnh lùng trong đêm khuya phố vắng
- Trồng cây thành băng dải
- Tun tit tun tit
- đường đi của máu trong hệ tuần hoàn hở
- Nhà nguyễn ra đời trong hoàn cảnh nào
- Chính tả gà và vịt
- Chiếc lá thoáng tròng trành chú nhái bén loay hoay
- Công thức tính độ biến thiên đông lượng
- Hình ảnh đường tròn trong thực tế
- Cha ơi trong nơi vinh quang này
- Vertical-align trong css
- Mức view trong kiến trúc 3 mức
- Từ trần gian con ngước trông lên
- Thầy, cô hãy mô tả bảng ma trận mục tiêu?
- Thanh cánh thượng thanh cánh hạ
- Nhân vật rùa trong logo có hình dạng gì
- đàng trong đàng ngoài
- đứng bên sông mà trông chú cò
- Kể tên các bộ phận của con gà trống
- Ra về trong hy vọng và mừng vui
- Các bộ phận của con gà trống
- Vào trong nơi chí thánh
- Xin dâng lời cảm tạ
- 1be16=
- Kìa nhìn xem trên kia có cái con chi to ghê
- Người trồng na
- Total query trong access
- Xin cho lòng chúng con luôn
- Khi trong phương đông vừa hé
- Chonext
- Kỹ năng định vị trong giao tiếp sư phạm
- Bảng đo khối lượng
- Chuẩn ieee 754
- Hệ thống thông tin logistics là gì
- đổi radian sang độ trong excel
- Mâu thuẫn cơ bản của quá trình dạy học
- Các loại kho bãi trong logistics
- Bs quách trọng đức
- Các câu lệnh trong stata
- Dự trữ trong logistics
- Khi trong phương đông vừa hé