Slide n 1 Festa Estatstica Bsica Jorge Festa
Slide nº 1 Festa
Estatística Básica Jorge Festa 11/1/2020 Slide nº 2 2 Festa
Análise Exploratória de Dados l Slide nº 3 Capítulo 1 - Resumo de Dados l Introdução l Tipos de Variáveis l Distribuição de Freqüências l Representação Gráfica das Variáveis Quantitativas l Ramo-e-folhas Festa
INTRODUÇÃO l O que é ESTATÍSTICA ? – É fundamental na análise de dados provenientes de quaisquer processos onde exista VARIABILIDADE. – Uso de informações na: coleção, apresentação, análise e tomada de decisões, para solucionar problemas. Slide nº 4 Festa
Estatística l Uma estatística é uma quantidade que é calculada dos dados amostrados. Ela é usada para dar informações a respeito de valores desconhecidos da correspondente população. Por exemplo, a média dos dados amostrados é utilizada para dar informações sobre toda a média da população da qual a amostra foi retirada. Slide nº 5 Festa
GRANDES ÁREAS DA ESTATÍSTICA l l l Slide nº 6 Amostragem e planejamento de experimentos l coleção ou coleta de dados Estatística descritiva l organização, apresentação e sintetização de dados Estatística inferencial l métodos para tomada de decisões, nas situações onde existem incertezas e VARIAÇÕES. Festa
AMOSTRAGEM É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico. Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. – Ex. Pesquisas sobre tendências de votação. l escolha da amostra, redação do questionário, a entrevista, a codificação dos dados, a apuração dos resultados são ETAPAS FUNDAMENTAIS deste tipo de pesquisa. l Slide nº 7 Festa
ESTATÍSTICA DESCRITIVA l É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão freqüente é o uso de média, índices e gráficos nas notícias. – Exemplo: l O INPC, Índice Nacional de Preços ao Consumidor – Aumento dos produtos da cesta básica. l Anuário Estatístico Brasileiro – educação, saúde, transporte, economia, cultura etc. Slide nº 8 Festa
Estatística Inferencial l. A estatística Inferencial faz uso das informações retiradas da amostra para conclusões (inferências), a respeito da população da qual a amostra foi retirada. Slide nº 9 Festa
POPULAÇÃO E AMOSTRA l O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e análise de dados estatísticos. – População é a coleção de todas as observações sobre determinado fenômeno. – Amostra é o conjunto de dados efetivamente observados, ou extraídos da população. l Exemplo: Determinação do consumo de óleo diesel em ônibus, avaliação de um programa de ensino, renda média per capita em diversas regiões do país etc. Slide nº 10 Festa
INFERÊNCIA l l A tomada de decisões sobre a população, com base nos dados da amostra, constitui o problema central da INFERÊNCIA ESTATÍSTICA. A tais decisões estão sempre associados um grau de incerteza e, conseqüentemente, uma probabilidade de erro. – Exemplo: Teste sobre medicamentos, experimentos agrícolas, análise financeira, consumo de energia etc. Slide nº 11 Festa
APRESENTAÇÃO DE DADOS l Técnicas que permitem detectar e corrigir erros e inconsistências ocorridos durante um processo de coleta de dados e determinar as principais características destes dados. – Grupamento de dados; – Construção de distribuições de freqüência; – Gráficos. Slide nº 12 Festa
Tipos de Variáveis l l Qualitativa – Nominal l Região de Procedência – Ordinal l Educação, Classe Social Quantitativa – Discreta l Número de Filhos – Contínua l Peso de Indivíduos, Salários em R$ Slide nº 13 Festa
GRUPAMENTO DE DADOS Alturas, expressas em centímetros de 30 atletas de um clube. Slide nº 14 Festa
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Alturas em cm. de 30 atletas Slide nº 15 Festa
GRÁFICOS Slide nº 16 Festa
GRÁFICOS Slide nº 17 Festa
GRÁFICOS Slide nº 18 Festa
GRUPAMENTO DE DADOS Número de filhos em 25 famílias observadas Slide nº 19 Festa
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Número de filhos em 25 famílias observadas Slide nº 20 Festa
GRÁFICOS Slide nº 21 Festa
GRÁFICOS Slide nº 22 Festa
Análise Exploratória de Dados l Capítulo 2 - Algumas medidas associadas a variáveis Quantitativas l Medidas de Posição l Medidas de Dispersão l Outra Estratégia de Análise l Desenho Esquemático Slide nº 23 Festa
Estatísticas Descritivas 4 4 4 4 4 Slide nº 24 Tamanho da Amostra Média Mediana Moda Média Geométrica Variância Desvio-padrão Erro-padrão Mínimo Máximo 4 4 4 4 4 Amplitude Quartil Inferior Quartil Superior Intervalo Inter-quartil Assimetria “Skewnwss” Assimetria Padronizada Curtose “Kurtosis” Curtose Padronizada Coeficiente de Variação Somatório Festa
Estatística Clássica l. Suposições Probabilísticas das Variáveis Envolvidas l. Declarações sobre os Parâmetros ou Modelo Utilizado l. Noções Assintóticas de – Consistência – Variância “Grandes Amostras” – Eficiência “USE A ESTATÍSTICA COMO O BÊBADO USA OS POSTES - MAIS PELO APOIO QUE PELA ILUMINAÇÃO” Slide nº 25 Festa Andew Lang
Análise Exploratória de Dados l Tukey J. W. (1977) – Técnicas Visuais Dados = Modelo + Resíduos Modelo = parte Suave Resíduos = parte Grosseira Slide nº 26 Festa
Análise Exploratória de Dados l Ferramentas Principais – Ramo-e-folhas - “Stem-and. Leaf” – Esquema de cinco números - “ 5 number summary” – Desenho Esquemático - “Box-Plot” Slide nº 27 Festa
Ramo-e-folhas l Apresentação RAMO - à esquerda da linha vertical FOLHAS - à direita da linha vertical l Vantagem sobre a Tabela de Freqüência: – Não perdemos informação – Número de linhas é equivalente ao número de classes Slide nº 28 Festa
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Alturas em cm. de 30 atletas Slide nº 29 Festa
RAMO-E-FOLHAS Slide nº 30 Festa
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Número de filhos em 25 famílias observadas Slide nº 31 Festa
RAMO-E-FOLHAS Slide nº 32 Festa
Esquema ou Resumo de 5 Números Sugestão (Tukey) - 1977 (i) a mediana (ii) os extremos (mínimo e máximo) (iii) os quartis ou juntas (inferior e superior) la A Mediana é uma Medida Resistente, não é afetada por valores extremos. Média amostral e o Desvio-padrão são afetados por valores extremos lnão temos idéia quanto a simetria da distribuição dos dados Slide nº 33 Festa
Desenho Esquemático “UM DESENHO ESQUEMÁTICO OU GRÁFICO DO ESQUEMA DE 5 NÚMEROS VALE MAIS QUE 1000 PALAVRAS” OUTLIERS lvalores abaixo da J 1 - 3/2 d. J lvalores acima da J 3 + 3/2 d. J, onde J 1 = 1º quartil, J 3 = 3º quartil e d. J = J 3 - J 1 Slide nº 34 Festa
Exemplo Slide nº 35 Festa
Exemplo Slide nº 36 Festa
Análise Exploratória de Dados l Slide nº 37 Capítulo 3 - Análise Bidimensional l Variáveis Multidimensionais l Independência de Variáveis l Medidas de Dependência entre Duas Variáveis l Diagrama de Dispersão l Coeficiente de Correlação Festa
Variáveis Multidimensionais l Em muitas situações observamos duas ou mais características simultaneamente, para analisar o seu comportamento. l A DISTRIBUIÇÃO CONJUNTA das freqüências será um poderoso instrumento na compreensão dos dados. Slide nº 38 Festa
Distribuição Conjunta do Grau de Instrução e Região Slide nº 39 Festa
Independência de Variáveis l Um dos principais objetivos de uma distribuição conjunta é descrever a ASSOCIABILIDADE existente ENTRE DUAS VARIÁVEIS, isto é, queremos conhecer o GRAU DE DEPENDÊNCIA entre elas, de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realização da outra. Slide nº 40 Festa
Independência de Variáveis Distribuição conjunta das freqüências e porcentagens segundo sexo e curso Slide nº 41 Festa
Medidas de Dependência entre Duas Variáveis l coeficientes de associação ou correlação – coeficiente de contingência de Karl Pearson Slide nº 42 Festa
Diagramas de Dispersão Slide nº 43 Festa
Coeficiente de Correlação Slide nº 44 Festa
Origem do Termo “Regressão” Slide nº 45 Festa
Probabilidades l Capítulo 4 - Probabilidades l. Introdução l. Algumas Propriedades l. Probabilidade Condicional e Independência l. Teorema de Bayes Slide nº 46 Festa
Probabilidades Uma das principais ferramentas da estatística é a probabilidade, que teve seu início formal com a escolha de jogos no início do século XVII. l Para seu entendimento necessitamos de alguns conhecimentos BÁSICOS que seguem: l Slide nº 47 Festa
Experimento lÉ qualquer processo ou estudo de coletar dados revelantes, os quais exibem variações em seus resultados, resultados estes desconhecidos de ante mão. – Ex. Lançamento de um dado honesto e observar a cada arremesso a face voltada para cima. Slide nº 48 Festa
l. O Espaço Amostral “W” espaço amostral “W”, é o conjunto de todos os resultados possíveis, elementares e indivisíveis do experimento, onde cada resultado é um evento simples. – Ex. Lançamento de um dado honesto W = { f 1, f 2, f 3, f 4, f 5, f 6 } Slide nº 49 Festa
Evento l Um evento, indicado pelas letras A, B, . . . , é qualquer subconjunto do espaço amostral “W”. – Exemplo 1: A ocorrência de face impar, no lançamento de um dado honesto. evento A = { f 1, f 3, f 5 } – Exemplo 2: A ocorrência de face par, no lançamento de um dado honesto. evento B = { f 2, f 4, f 6 } Slide nº 50 Festa
l Uma s-álgebra é uma classe de subconjuntos satisfazendo Slide nº 51 do espaço amostral, W, os seguintes axiomas: Festa
Definição de Probabilidade l. Definição Slide nº 52 Clássica Freqüentista Geométrica Axiomática Festa
Definição Axiomática Slide nº 53 Festa
Algumas Propriedades Slide nº 54 Festa
Probabilidade Condicional Slide nº 55 Festa
Teorema da Probabilidade Total Slide nº 56 Festa
Teorema de Bayes Slide nº 57 Festa
Regra da Multiplicação Slide nº 58 Festa
Independência Slide nº 59 Festa
Variável Aleatória l Uma variável aleatória, indicada por X, é uma função com domínio o espaço amostral e contradomínio o conjunto dos números Reais, tal que, o evento [ X £ x ] pertence a s-álgebra para todos os valores de x que pertencem aos no. s reais. Slide nº 60 Festa
Função Distribuição l Uma Função Distribuição, indicada por F(x), é uma função, com domínio os Reais e contradomínio o intervalo [0, 1], satisfazendo as seguintes propriedades: – F(x) é não decrescente; – F(x) é contínua à direita; – F(-¥) = 0 e F(¥) = 1 Slide nº 61 Festa
Função Distribuição Acumulada l Dada a variável aleatória X, chamaremos de função distribuição acumulada a função Slide nº 62 Festa
O Conceito de Variável Aleatória Discreta l Uma variável aleatória X, é dita discreta, se ela assume um número finito ou infinito enumerável. l A função, indicada por p(x), nós chamamos função de probabilidade da variável aleatória discreta X. Slide nº 63 Festa
Função de Probabilidade Slide nº 64 Festa
O Conceito de Variável Aleatória Contínua l Uma variável aleatória, indicada por X, é dita contínua, se existe uma função f(x), chamada função densidade de probabilidade, tal que: Slide nº 65 Festa
Função Densidade de Probabilidade Slide nº 66 Festa
Valor Esperado de uma Variável Aleatória l Dada uma variável aleatória X, chamamos valor médio ou esperança matemática de X ao valor Slide nº 67 Festa
Valor Esperado de Uma Função de uma Variável Aleatória X “g(X)” l Dada a variável aleatória X, chamamos esperança ou valor esperado da função g(x) ao valor: Slide nº 68 Festa
Propriedades l Se g(x) = a. X + b, – E[g(x)] = E(a. X + b) = a E(X) + b l Se g(x) =[X - E(X)]2 – E[g(x)] = Var(X) Slide nº 69 Festa
Alguns Modelos Discretos l Distribuição l Distribuição Slide nº 70 Uniforme Discreta Bernoulli Binomial Hipergeométrica Geométrica Binomial Negativa Poisson Festa
Alguns Modelos Contínuos l l l l Slide nº 71 Uniforme Contínua Normal Exponencial Gama Beta Cauchy Lognormal Dupla-exponencial l l l l Weibull Logística Pareto Gumbel (Valor Extremo) t-Student’s F-Snedecor’s Qui-quadrado Normal Bivariada Festa
Variáveis Aleatórias Multidimensionais l Capítulo 7 - Variáveis Aleatórias Multidimensionais – Distribuição Conjunta – Distribuições Marginais e Condicionais – Funções de Variáveis Aleatórias – Covarância de Duas Variáveis Aleatórias – Variáveis Contínuas Slide nº 72 Festa
Distribuição Conjunta l Em muitos experimentos, a um mesmo ponto amostral w, atribuímos valores de duas ou mais variáveis aleatórias. – Ex. Suponha queremos estudar a composição de famílias com 3 crianças, quanto ao sexo. l X = número de meninos l Y = 1 (se for homem) e 0 (se for mulher) l Z = no. de vezes que houve variação do sexo l W = número de meninas Slide nº 73 Festa
Função Densidade Conjunta Slide nº 74 Festa
Tabela de Probabilidades Slide nº 75 Festa
Distribuições Marginais Slide nº 76 Festa
Distribuições Condicionais Slide nº 77 Festa
Distribuições Independentes Slide nº 78 Festa
Covariância de duas variáveis aleatórias Slide nº 79 Festa
Coeficiente de Correlação de X e Y Slide nº 80 Festa
Referências Bibliográficas Montgomery, Douglas C. & Runger, George C. Applied statistics and probability for engineers. New York, Wiley, 1994. Montgomery, Douglas C. , Introduction to statistical quality control. New York, Wiley, 1991. Bussab, Wilton O. , Estatística Básica. 4. ed. São Paulo, 1987 Slide nº 81 Festa
- Slides: 81