Aula Introdutria Autoria de Prof Carlos Alberto Caio
Aula Introdutória Autoria de Prof. Carlos Alberto (Caio) Dantas FORMATAÇÃO & DESIGN Cléber da Costa Figueiredo figuecl@usp. br Thiago Rodrigo Alves Carneiro thiagorodrigo@ime. usp. br
O Que é Estatística? • A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. • A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística.
Estatística População Características Técnicas de amostragem Amostra Análise descritiva Conclusões sobre as características da população Inferência estatística Informações contidas nos dados
Amostragem É a area da Estatística que trata da obtenção de amostras que sejam representativas da população Exemplos de utilização: Pesquisa de Mercado, Pesquisa de opinião pública, Ensaios de medicamentos e em praticamente todo experimento.
Estatística Descritiva A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou esta área da Estatística.
Inferência Estatística A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a população.
Probabilidade A inferência estatística baseiase na Teoria das Probabilidades que constrói modelos para os fenômenos aleatórios, isto é , aqueles em que está presente a incerteza.
Exemplo: Intenção de voto Numa pesquisa eleitoral, um Instituto de Pesquisa procura, com base nos resultados de um levantamento aplicado a uma amostra da população, prever o resultado da eleição.
Considere o Candidato “A” Denomine por p a proporção de pessoas que votarão em “A” na eleição. ^ Denomine por p a proporção de pessoas no levantamento de opinião (amostra) que expressam intenção de voto em “A”.
Estimação ^ Podemos usar o valor de p para estimar a proporção p da população.
Evolução da intenção de voto para prefeito de São Paulo realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno). Pesquisa contratada pela TV Globo, em % do total de votos. A pesquisa ouviu 2. 000 eleitores - Margem de erro de 2 % com 95% de confiança.
Estatística Descritiva Etapa inicial da análise utilizada para descrever e resumir os dados
Exemplo Arquivo Pulse do Minitab Refere-se a um experimento feito por alunos. Cada aluno registrou sua altura, peso, sexo, hábito de fumar, nível de atividade física usual e pulsação em repouso. Então todos eles jogaram moedas e aqueles que tiraram cara fizeram corrida estacionária por um minuto. Depois disso todos os alunos mediram novamente sua pulsação.
Informações do arquivo Pulse MTB > INFO Information of the worksheet Column C 1 C 2 C 3 C 4 C 5 C 6 C 7 C 8 Count Name 92 Pulse 1 (Pulsação antes de correr) 92 Pulse 2 (Pulsação depois de correr) 92 Ran (1: correu, 2: não correu) 92 Smokes (1: fumante, 2: não fumante) 92 Sex (1: masculino, 2: feminino) 92 Height 92 Weight 92 Activity (1: leve, 2: moderada, 3: forte)
Informações do arquivo Pulse 1 Pulse 2 Ran Smokes Sex 64 88 1 2 1 58 70 1 2 1 62 76 1 1 1 66 78 1 1 1 64 80 1 2 1 74 84 1 2 1 84 84 1 2 1 68 72 1 62 75 1 2 1. . . Height Weight Activity 66. 00 140 2 72. 00 145 2 73. 50 160 3 73. 00 190 1 69. 00 155 2 73. 00 165 1 72. 00 150 3 74. 00 190 2 72. 00 195 2
Arquivo “Trees” do Minitab Diâmetro 8, 3 8, 6 8, 8 10, 5 10, 7 10, 8 11, 0 11, 1 11, 2 11, 3 11, 4 11, 7 12, 0 12, 9 Altura 70 65 63 72 81 83 66 75 80 75 79 76 76 69 75 74 Volume 10, 3 10, 2 16, 4 18, 8 19, 7 15, 6 18, 2 22, 6 19, 9 24, 2 21, 0 21, 4 21, 3 19, 1 22, 2 12, 9 13, 3 13, 7 13, 8 14, 0 14, 2 14, 5 16, 0 16, 3 17, 5 17, 9 18, 0 20, 6 85 86 71 64 78 80 74 72 77 81 82 80 80 80 87 33, 8 27, 4 25, 7 24, 9 34, 5 31, 7 36, 3 38, 3 42, 6 55, 4 55, 7 58, 3 51, 5 51, 0 77, 0
Variável Qualquer característica associada a uma população. Classificação NOMINAL sexo, cor dos olhos ORDINAL classe social, grau de instrução QUALITATIVA CONTÍNUA peso, altura QUANTITATIVA DISCRETA número de filhos, número de carros
Variáveis Quantitativas MEDIDAS DE POSIÇÃO: Mínimo, Máximo, Moda, Média, Mediana, Quartis MEDIDAS DE DISPERSÃO: Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação
Medidas de Posição Máximo (max): a maior observação Mínimo (min): a menor observação Moda (mo): é o valor (ou atributo) que ocorre com maior frequência. Ex. : 4, 5, 4, 6, 5, 8, 4 max = 8 min = 4 mo = 4
Média Ex: 2, 5, 3, 7, 8 -X = 2+5+3+7+8 = 5 5
Mediana (Md) Valor que deixa 50% das observações à sua esquerda A mediana pode ser obtida ordenando-se os dados e encontrando-se o valor que corresponde a posição (n+1)/2, se n for ímpar. Se n for par, a mediana corresponde a média aritmética dos valores da posição anterior e posterior a (n+1)/2. Ex(A): 2, 5, 3, 7, 8 Ex(B): 3, 5, 2, 1, 8, 6 Dados ordenados: 2, 3, 5, 7, 8 Dados ordenados: 1, 2, 3, 5, 6, 8 Md = 5 Md = (3 + 5) / 2 = 4
1º e 3º Quartil Primeiro Quartil (Q 1): valor que deixa 25% das observações à sua esquerda. Terceiro Quartil (Q 3): valor que deixa 75% das observações à sua esquerda. Ex(A): 1, 9 2, 0 2, 1 2, 5 3, 0 3, 1 3, 3 3, 7 6, 1 7, 7 Md = 3, 05 Q 1 = 2, 05 Q 3 = 4, 9 Ex(B): 0, 9 1, 0 1, 7 2, 9 3, 1 5, 3 5, 5 12, 2 12, 9 14, 0 33, 6 Md = 5, 3 Q 1 = 1, 7 Q 3 = 12, 9
Exemplo: Considere as notas de um teste de 3 grupos de alunos Grupo 1: 3, 4, 5, 6, 7 G 1 G 2 G 3 Grupo 2: 1, 3, 5, 7, 9 * * * 0 0 * * 0 Temos: x 1 = x 2 = x 3 = 5 * * * Grupo 3: 5, 5, 5 10 * * 10 10 md 1= md 2= md 3 = 5
Medidas de Dispersão Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados Amplitude (A): máximo - mínimo [máx - min] Para os grupos anteriores, temos: Grupo 1, A=4 Grupo 2, A=8 Grupo 3, A=0
Intervalo-Interquartil É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q 3 - Q 1 Ex. (A): 1, 9 2, 0 2, 1 2, 5 3, 0 3, 1 3, 3 3, 7 6, 1 7, 7 Q 1 = 2, 05 e Q 3= 4, 9 Q 3 - Q 1 = 4, 9 - 2, 05 = 2, 85
Variância e Desvio Padrão
Exemplo: Considere as notas de um teste de 3 grupos de alunos Grupo 1: 3, 4, 5, 6, 7 G 1 G 2 G 3 Grupo 2: 1, 3, 5, 7, 9 * * * 0 0 * * 0 Temos: x 1 = x 2 = x 3 = 5 * * * Grupo 3: 5, 5, 5 10 * * 10 10 md 1= md 2= md 3 = 5
Variância para os Grupos 1, 2 e 3 G 1: s 2= 2, 0 s = 1, 41 G 2: s 2 = 8 s = 2, 83 G 3: s 2 = 0 s=0
Fórmulas Alternativas Exemplo: Considere o grupo G 1
Coeficiente de Variação (CV) • é uma medida de dispersão relativa • elimina o efeito da magnitude dos dados • exprime a variabilidade em relação à média
Exemplo 1 Altura e peso de alunos Média Altura 1, 143 m Peso 50 kg Desvio Padrão 0, 063 m 6 kg Coef. de Variação 5, 5% 12% Conclusão: Os alunos são duas vezes mais dispersos quanto ao peso do que quanto à altura
Exemplo 2 Alturas de meninos e homens adultos de uma população. Média Meninos 50 Homens 160 Desvio Padrão 6 16 Coef. De Variação 12% 10% Conclusão: Em relação às médias, as alturas dos homens e dos meninos apresentam variabilidade quase iguais.
- Slides: 33