MTODOS DE INVESTIGAO EM SADE ESTATSTICA NA INVESTIGAO

  • Slides: 46
Download presentation
MÉTODOS DE INVESTIGAÇÃO EM SAÚDE. ESTATÍSTICA NA INVESTIGAÇÃO EPIDEMIOLÓGICA: EXEMPLOS PRÁTICOS SOBRE A SUA

MÉTODOS DE INVESTIGAÇÃO EM SAÚDE. ESTATÍSTICA NA INVESTIGAÇÃO EPIDEMIOLÓGICA: EXEMPLOS PRÁTICOS SOBRE A SUA IMPORT NCIA E APLICAÇÃO AULA TEÓRICA-PRÁTICA 4 Paulo Nogueira | Andreia Leite Faculdade de Medicina de Lisboa 12, 15 e 16 Novembro 2018 Epidemiologia | 3º ano | MIM 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 1

SUMÁRIO Introdução n Noções de inferência estatística. n Como decidir os testes estatísticos e

SUMÁRIO Introdução n Noções de inferência estatística. n Como decidir os testes estatísticos e metodologias estatísticas a aplicar com base no número e tipologia das variáveis disponíveis. n Alguns exemplos retirados da literatura científica. n 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 2

INTRODUÇÃO n Para que serve a estatística? n Qual o seu principal objetivo? 11

INTRODUÇÃO n Para que serve a estatística? n Qual o seu principal objetivo? 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 3

PARA QUE SERVE A ESTATÍSTICA? n obter conclusões sobre a população usando uma amostra

PARA QUE SERVE A ESTATÍSTICA? n obter conclusões sobre a população usando uma amostra População Amostragem µ 11 -mar-21 Amostra média Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 4

DESAFIOS DA INFERÊNCIA 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano |

DESAFIOS DA INFERÊNCIA 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 5

NOÇÕES DE INFERÊNCIA ESTATÍSTICA n Estimativas Pontuais n Intervalos de Confiança n Testes de

NOÇÕES DE INFERÊNCIA ESTATÍSTICA n Estimativas Pontuais n Intervalos de Confiança n Testes de Hipóteses 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 6

INTERVALOS DE CONFIANÇA Estimação em forma de intervalo do parâmetro populacional, com base na

INTERVALOS DE CONFIANÇA Estimação em forma de intervalo do parâmetro populacional, com base na informação amostral disponível e no conhecimento da distribuição amostral do estimador do parâmetro X para µ S 11 -mar-21 2 para σ2 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 7

INTERVALOS DE CONFIANÇA Média 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano

INTERVALOS DE CONFIANÇA Média 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 8

INTERVALOS DE CONFIANÇA PARA UMA MÉDIA σ conhecido σ desconhecido 11 -mar-21 Aula TP

INTERVALOS DE CONFIANÇA PARA UMA MÉDIA σ conhecido σ desconhecido 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 9

EXEMPLO 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM |

EXEMPLO 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 10

OUTRO EXEMPLO Amostra e sub-amostras Estimativa do nível médio da trigliceridemia populacional 11 -mar-21

OUTRO EXEMPLO Amostra e sub-amostras Estimativa do nível médio da trigliceridemia populacional 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 11

TESTES DE HIPÓTESES Hipótese H 0: Não existe efeito vs. H 1: Existe efeito

TESTES DE HIPÓTESES Hipótese H 0: Não existe efeito vs. H 1: Existe efeito Hipótese nula Hipótese alternativa Estatística de teste Varia conforme a natureza do problema Distribuição da estatística de teste Decisão Ou rejeito a hipótese nula o que significa que existe um efeito de tratamento Ou não rejeito a hipótese nula o que significa que não existem evidências de um efeito de tratamento 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 12

ACEITAR OU NÃO REJEITAR n Do ponto de vista estatístico puro não se diz

ACEITAR OU NÃO REJEITAR n Do ponto de vista estatístico puro não se diz “Aceito H 0”, porque existem sempre erros. n O facto de não se rejeitar H 0 pode ter duas causas: • Ou o efeito não existe • Ou não existe potência para mostrar o efeito. 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 13

INTERPRETAÇÃO DOS P-VALUES O p-value é a probabilidade de observar os dados quando a

INTERPRETAÇÃO DOS P-VALUES O p-value é a probabilidade de observar os dados quando a hipótese nula é verdadeira. Por exemplo num ensaio clínico Estamos interessados na diferença observada entre dois grupos de tratamentos. Relacionamos então os dados com a provável variação numa ao acaso quando a hipótese nula é verdadeira na população. Regra geral, Se o p-value > 0, 05 amostra devida o resultado do teste não é significativo Se o p-value < 0, 05 o resultado do teste é significativo (rejeita-se a hipótese nula) Se o p-value < 0, 01 Pode-se dizer que o resultado é muito significativo 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 14

ERROS DE TIPO II Existem sempre erros ao fazer um teste de hipóteses. Realidade:

ERROS DE TIPO II Existem sempre erros ao fazer um teste de hipóteses. Realidade: H 0 Decisão: H 0 Verdadeira Falsa 11 -mar-21 Verdadeira Falsa confiança Erro II Erro I Potência Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 15

 P erro de tipo I P Rejeitar H 0 | H 0 é

P erro de tipo I P Rejeitar H 0 | H 0 é verdadeira P erro de tipo II P Não Rejeitar H 0 | H 0 é falsa Potência 1 P Rejeitar H 0 | H 0 é Falsa 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 16

TESTES PARAMÉTRICOS Sample vs. … vs. Sample ANOVA 11 -mar-21 Aula TP 4 |

TESTES PARAMÉTRICOS Sample vs. … vs. Sample ANOVA 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 17

TESTES PARAMÉTRICOS Sample vs. … vs. Sample ANOVA académico 11 -mar-21 académico Aula TP

TESTES PARAMÉTRICOS Sample vs. … vs. Sample ANOVA académico 11 -mar-21 académico Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 académico 18

TESTES PARAMÉTRICOS E TESTES NÃO PARAMÉTRICOS Testes paramétricos Teste de Kruskal-Wallis Teste de Mann-Whitney

TESTES PARAMÉTRICOS E TESTES NÃO PARAMÉTRICOS Testes paramétricos Teste de Kruskal-Wallis Teste de Mann-Whitney Teste de Levene Testes não paramétricos 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 19

A normalidade é verificada usando o teste de Shapiro-Wilks (n <50) ou Kolmogorov-Smirnov (n>=50)

A normalidade é verificada usando o teste de Shapiro-Wilks (n <50) ou Kolmogorov-Smirnov (n>=50) Uma amostra Normalidade da distribuição de cada grupo Teste t Médias Duas amostras Várias amostras Igualdade de variâncias desigualdade de variâncias Igualdade de desigualdade variâncias Teste t ANOVA (teste de welsh) Não Normalidade da distribuição de pelo menos um grupo / uma das amostra com tamanho muito pequeno (teste não paramétrico) 11 -mar-21 Teste de Mann-Whitney Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 Teste de Kruskal-Wallis 20

COMO DECIDIR OS TESTES ESTATÍSTICOS E METODOLOGIAS ESTATÍSTICAS A APLICAR COM BASE NO NÚMERO

COMO DECIDIR OS TESTES ESTATÍSTICOS E METODOLOGIAS ESTATÍSTICAS A APLICAR COM BASE NO NÚMERO E TIPOLOGIA DAS VARIÁVEIS DISPONÍVEIS n Variável única n Duas variáveis n Mais de duas variáveis 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 21

QUANTAS VARIÁVEIS? • 1 – Análise descritiva • Variável numérica – Medidas de localização,

QUANTAS VARIÁVEIS? • 1 – Análise descritiva • Variável numérica – Medidas de localização, medidas de disperssão – Gráficos » Variável discreta com poucos valores Barras, linhas, sectogramas » Variável contínua Histograma, caixa de bigodes, etc. • Variável qualitativa – Frequências, moda – Gráficos (barras, linhas, sectogramas, etc) 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 22

QUANTAS VARIÁVEIS? • 1 – Inferência estatística • Variável numérica – Teste z –

QUANTAS VARIÁVEIS? • 1 – Inferência estatística • Variável numérica – Teste z – Teste t – Teste para uma variância » A comparação é feita com um valor para o parâmetro populacional “externo” • Variável qualitativa – Teste do Qui-quadrado » Teste que avalia a homogeneidade das observações pelas diferentes categorias – Teste para uma proporção » Teste que avalia se a proporção observada está de acordo com uma hipótese populacional 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 23

QUANTAS VARIÁVEIS? • 2 v. categorial vs v. categorial – Análise descritiva bivariada •

QUANTAS VARIÁVEIS? • 2 v. categorial vs v. categorial – Análise descritiva bivariada • Crosstabs • Frequências cruzadas • Proporções (por linha, por coluna, totais) 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 24

QUANTAS VARIÁVEIS? • 2 v. categorial vs v. categorial – Inferência estatística • Qui-quadrado

QUANTAS VARIÁVEIS? • 2 v. categorial vs v. categorial – Inferência estatística • Qui-quadrado – Teste de independência (não associação) » Pressupostos: o número esperado em cada célula da tabela é maior que 5 • Qui-quadrado com correcção para a continuidade (correcção de Yates) – Quando se trata de uma tabela 2 x 2 • Teste exacto de Fisher – Quando se trata de uma tabela 2 x 2, sempre aplicável mesmo quando falha o pressuposto de aplicação do quiquadrado 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 25

QUANTAS VARIÁVEIS? • 2 v. numérica vs v. categorial – A v. numérica toma

QUANTAS VARIÁVEIS? • 2 v. numérica vs v. categorial – A v. numérica toma o lugar de v. dependente ou v. de teste – Análise descritiva bivariada • Medidas de localização e de dispersão por cada nível da v. categorial • Histogramas por painel • Caixas de bigodes paralelas 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 26

QUANTAS VARIÁVEIS? • 2 v. Numérica vs v. Categorial a v. categorial tem 2

QUANTAS VARIÁVEIS? • 2 v. Numérica vs v. Categorial a v. categorial tem 2 níveis – Inferência estatística • Teste t – Comparação das duas média populacionais – Existem dois teste t » 1 teste que assume a igualdade das variâncias populacionais » 1 teste que assume a desigualdade das variâncias populacionais • Teste F ou teste de Levene – Comparação de duas variâncias populacionais • Teste de Mann-Whitney – Teste não paramétrico » Compara as duas distribuições 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 27

QUANTAS VARIÁVEIS? • 2 v. Numérica vs v. Categorial a v. categorial tem mais

QUANTAS VARIÁVEIS? • 2 v. Numérica vs v. Categorial a v. categorial tem mais de 2 níveis – Inferência estatística • ANOVA – Testa a igualdade de todas as médias populacionais – Pressupostos: » Todas as amostras são normais » Homocedaticidade: as variâncias de todos os grupos são iguais • teste de Levene – Testa a igualdade das variâncias » Este teste deve ser sempre feito antes de analisar os resultados da igualdade das médias • Teste de Kruskal-Wallis – Teste não paramétrico » Compara as distribuições • Nota: quando existem diferenças estatísticas usam-se teste de comparações múltiplas para perceber em que níveis ocorrem as diferenças: testes Post-Hoc 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 28

QUANTAS VARIÁVEIS? • 2 v. numérica vs v. numérica – Coeficiente de correlação de

QUANTAS VARIÁVEIS? • 2 v. numérica vs v. numérica – Coeficiente de correlação de Pearson • O teste associado é um teste t e assume normalidade das variáveis para efectuar o teste – Coeficiente de correlação de Spearman • Teste não paramétrico • Usa as ordens dos valores e não os valores 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 29

QUANTAS VARIÁVEIS? • Mais de 2 variáveis – Análise multifactorial • Temos uma variável

QUANTAS VARIÁVEIS? • Mais de 2 variáveis – Análise multifactorial • Temos uma variável dependente e queremos explicar a sua variação usando as restantes variáveis – Análise multivariada • Queremos estudar a variação conjunta de mais do que uma variável 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 30

QUANTAS VARIÁVEIS? n Mais de 2 variáveis Análise Multifactorial ¨ A variável dependente (explicada)

QUANTAS VARIÁVEIS? n Mais de 2 variáveis Análise Multifactorial ¨ A variável dependente (explicada) n é numérica (assumida normal) Regressão linear múltipla – Só são admitidas variáveis numéricas » Para variáveis categoriais é necessário usar variáveis mudas/indicadoras » Exemplo: sexo criar uma v. Com 1 - Masculino e 0 - feminino • ANOVA Multifactorial/ MANCOVA – – 11 -mar-21 São admitidas variáveis categoriais FACTORES Existem factores fixos todos os possíveis valores presentes Existem factores aleatórios não todos os possiveis valores representados São admitidas variáveis numéricas Covariáveis (MANCOVA) Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 31

QUANTAS VARIÁVEIS? • Mais de 2 variáveis Análise Multifactorial – A variável dependente (explicada)

QUANTAS VARIÁVEIS? • Mais de 2 variáveis Análise Multifactorial – A variável dependente (explicada) é dicotómica • Regressão logistica (binária) – São admitidas variáveis categoriais FACTORES – São admitidas variáveis numéricas Covariáveis – A variável dependente (explicada) é dicotómica e tem associado um tempo até ao evento • Análise de Sobrevivência / Regressão de Cox – Muito semelhante à regressão logistica 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 32

QUANTAS VARIÁVEIS? • Mais de 2 variáveis Análise Multifactorial – Existem outros métodos menos

QUANTAS VARIÁVEIS? • Mais de 2 variáveis Análise Multifactorial – Existem outros métodos menos usuais • Modelos linear generalizados – Regressão de poisson – Logit – Probit • Modelos lineares aditivos • etc 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 33

QUANTAS VARIÁVEIS? • Mais de 2 variáveis Análise multivariada – Análise exploratória de dados

QUANTAS VARIÁVEIS? • Mais de 2 variáveis Análise multivariada – Análise exploratória de dados multivariados • Não são metodos de inferência estatística • Análise factorial • Componentes principais • Etc. 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 34

ALGUNS EXEMPLOS RETIRADOS DA LITERATURA CIENTÍFICA n Acta Médica Portuguesa n Eurosurveillance n International

ALGUNS EXEMPLOS RETIRADOS DA LITERATURA CIENTÍFICA n Acta Médica Portuguesa n Eurosurveillance n International Journal of Epidemiology 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 35

Rocha, et al. Acta Med Port, 2017 n n STATISTICS Travelers were divided by

Rocha, et al. Acta Med Port, 2017 n n STATISTICS Travelers were divided by age groups: < 25, 26 to 30, 31 to 35, 36 to 40, 41 to 45, 46 to 50, 51 to 55 and > 56 years old. The absolute (n) and relative (%) frequencies were presented for qualitative variables. n The non-parametric chi-square (χ2) test was used to check if the distribution of variables was similar in the different groups for immunity. The significant level established was 0. 05. n EPIDEMIOLOGY Cross-sectional study or seroprevalence n 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 36

11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018

11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 37

Huo X, et al. Eurosurveillance, 2017 n n STATISTICS Median and interquartile ranges (IQRs)

Huo X, et al. Eurosurveillance, 2017 n n STATISTICS Median and interquartile ranges (IQRs) were calculated for continuous variables and absolute numbers and proportions for categorical variables. n Selected demographic, epidemiological and clinical characteristics of H 7 N 9 patients were compared among five epidemic waves: Pearson chi-squared test was used for comparing proportions and continuity correction or Fisher’s exact test was used if appropriate. Kruskal–Wallis test was used for comparing medians among multiple groups. n All cases with missing data on a certain characteristic were excluded when this characteristic was analysed. Information of total and missing data for each studied variable is shown in detail n EPIDEMIOLOGY Cross-sectional studies n 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 38

11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018

11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 39

Seidman JC, et al. International Journal of Epidemiology, 2014 STATISTICS • Crosssectional resistance prevalence

Seidman JC, et al. International Journal of Epidemiology, 2014 STATISTICS • Crosssectional resistance prevalence was compared by treatment group and time-point using t-tests • To better characterize the impact of MDA on macrolide resistance, Wilcoxon signed rank tests were used to compare the distributions of AZM MICs and ERY ZDs by treatment group. • To identify an epidemiologically relevant resistance cutoff, a receiver operating characteristic (ROC) curve was generated • Descriptive analyses compared the distribution of demographic and water characteristics in the MDA and non-MDA villages at each follow-up using Fisher’s exact tests and t-tests • Using logistic regression, the odds of conservatively-defined AZM resistance were modelled. Generalized estimating equations with exchangeable correlation were used to adjust for village-level clustering, EPIDEMIOLOGY • Longitudinal cohort study 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 40

11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018

11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 41

SUMMARIZE Statistics The absolute (n) and relative (%) frequencies Non-parametric chi-square (χ2) test Study

SUMMARIZE Statistics The absolute (n) and relative (%) frequencies Non-parametric chi-square (χ2) test Study design Cross-sectional study or seroprevalence Statistics Absolute numbers and proportions Median and interquartile ranges Pearson chi-squared test Fisher’s exact test Kruskal–Wallis H test Study design Cross-sectional studies Statistics Wilcoxon signed rank tests Receiver operating characteristic (ROC) curve Fisher’s exact tests and t-tests Logistic regression Generalized estimating equations Unadjusted odds ratios Random-effects meta-analysis of proportions Study design Longitudinal cohort study Meta-analysis 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 42

ASPECTOS-CHAVE DA AULA n n n 11 -mar-21 A inferência estatística permite obter conclusões

ASPECTOS-CHAVE DA AULA n n n 11 -mar-21 A inferência estatística permite obter conclusões sobre uma população, partindo de uma amostra; A inferência pode ser realizada com recurso a intervalos de confiança e a testes de hipóteses; Ao realizar um teste de hipóteses é possível cometer erros de tipo I e de tipo II; A escolha dos testes estatísticos depende do número e tipo de variáveis a serem analisadas. Quando o interesse é em apenas uma variável ou duas variáveis, a análise pode ser descritiva ou pretender realizar inferência; A análise de mais de duas variáveis independentes designa-se de análise multifactorial, enquanto que a análise de mais de duas variáveis dependentes é conhecida por análise multivariada. Esta última não se inclui na inferência estatística. Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 43

BIBLIOGRAFIA n Obrigatória - Jekel's Epidemiology, Biostatistics, Preventive Medicine, and Public Health. By Katz,

BIBLIOGRAFIA n Obrigatória - Jekel's Epidemiology, Biostatistics, Preventive Medicine, and Public Health. By Katz, Elmore, Wild e col. Elsevier. 2014 Capítulo 10 – pg 119 -133 ¨ Capítulo 11 (excepto IV - G. ) – pg 134 -147 ¨ Capítulo 13 – pg 163 -70 ¨ n Complementar ¨ Bonita R, Beaglehole R, Kjellström T. Basic Epidemiology. 2 nd edition. WHO 2006 – Capítulo 4 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 44

QUESTÕES? Paulo Nogueira: pnogueira@medicina. ulisboa. pt Andreia Leite: andreiaheitorleite@gmail. com 11 -mar-21 Aula TP

QUESTÕES? Paulo Nogueira: pnogueira@medicina. ulisboa. pt Andreia Leite: andreiaheitorleite@gmail. com 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 45

AVALIAÇÃO DA AULA n Antes de sair, em 2 -3 minutos, pede-se a todos

AVALIAÇÃO DA AULA n Antes de sair, em 2 -3 minutos, pede-se a todos os alunos façam agora a avaliação anónima da aula pelo link https: //tinyurl. com/EPI-TP-4 -18 FMUL pelo telemóvel, tablet ou computador portátil. Quem não tiver telemóvel com acesso à net, pode pedir a um colega. Obrigado! 11 -mar-21 Aula TP 4 | Epidemiologia | 3º ano | MIM | 2018 -19 46