Estatstica Prof Augusto Santana Noes Bsicas de Excel
Estatística Prof. Augusto Santana
Noções Básicas de Excel
Noções Básicas de Excel • Inserindo dados (idade, sexo, peso, altura, imc) • Barra de menus • Barra de ferramentas • Nomear
Noções Básicas de Excel • Sobre as células - Caixa de nome - Barra de fórmulas - Seleção de células - Arrastando - Shift + (seta) - Shift + Ctrl + (seta) F 2 Editar
Noções Básicas de Excel • Botão direito sobre células e colunas - Inserir/Excluir - Formatar - Tamanho - Ocultar/Re-exibir Ctrl + C Copiar Ctrl + V Colar
Noções Básicas de Excel Ctrl + X Recortar Ctrl + Z Desfazer Ctrl + B Salvar Ctrl + 1 Formatar
Noções Básicas de Excel • Organizar dados (Menu “Dados”) Organiza as informações de uma coluna em ordem crescente ou decrescente
Noções Básicas de Excel • Organizar dados (Menu “Dados”) Organiza as informações de um conjunto de colunas em ordem crescente ou decrescente
Noções Básicas de Excel • Organizar dados (Menu “Dados”) Filtra informações préselecionadas em uma ou mais colunas, simultaneamente
Noções Básicas de Excel • Inserir fórmulas - ( = ) - Categoria
Noções Básicas de Excel • Simbologia - Soma (+) - Subtração (-) - Multiplicação (*) - Divisão (/) - Raiz quadrada (raiz()) - Potenciação (^)
Noções Básicas de Excel • Precedência 3+2*6 = ? (3+2)*6 = ? • Preenchimento automático - O uso do $
Noções Básicas de Excel • Formatação de células - Tipo do número Alinhamento Tipo da fonte, estilo e tamanho Bordas Cores
Noções Básicas de Excel • Inserir gráficos - Tipos de gráficos - Ferramentas de gráfico - Formatação - Botão direito - Barra de fórmulas
Estatística
Introdução Sobre a natureza da Estatística… A Estatística trabalha com dados Os dados são analisados para: - Gerar informações - Compará-los com resultados - Verificar adequação a uma teoria O contexto situa nosso conhecimento prévio e nos permite fazer julgamentos
Introdução Sobre a utilidade da Estatística e os cuidados ao utilizá-la… A análise de dados bate as suposições crendices “Todo homem é safado” Cuidado com variáveis ocultas “Toda criança que gosta de música clássica e toca algum instrumento é mais inteligente”
Introdução Sobre a utiidade da Estatística e os cuidados ao utilizá -la… A origem dos dados é importante “Pesquisa aponta que o próximo prefeito de Nova Cruz será Chico Mendes” Há variações por toda parte “Uma empresa é muito ruim, pois vendeu neste mês 10% a menos que no mês passado ”
Introdução Sobre a utiidade da Estatística e os cuidados ao utilizá -la… Não há certezas nas conclusões “Amanhã vai chover”
Introdução • Conceitos Estatística Corpo de técnicas voltado para a coleta, classificação, análise e interpretação de dados quantitativos, tendo por finalidade o apoio à tomada de decisão Estatísticas Coleção de dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer
Introdução • Objeto de interesse da Estatística Conjunto muito numeroso de indivíduos, que são semelhantes quanto a pelo menos uma característica específica Análise Quantitativa X Análise Qualitativa Estatística Descritiva (Análise Exploratória) X Estatística Indutiva (Inferência)
Introdução • Conceitos População Conjunto de todos os indivíduos cujo comportamento interessa analisar Amostra Subconjunto da população através da qual se faz juízo ou inferência do todo Custo (menor confiabilidade) X Benefício (menor tempo e menos gasto)
Introdução • Conceitos Estudos Observacionais Observa indivíduos e mede variáveis de interesse, mas não procura influenciar a resposta Experimentos Impõem algum tratamento aos indivíduos para poder observar suas respostas Ex. : Reposição hormonal para mulheres na menopausa reduz o risco de ataque cardíaco Variáveis de Confundimento Duas varáveis (explicativas ou ocultas) são confundidas quando seus efeitos em uma variável de resposta não podem ser distinguidos um do outro
Introdução Variável independente (explanatória) É aquela que influencia no comportamento da variável resposta Variável dependente (resposta) É aquela que sobre a qual desejamos fazer uma estimativa
Introdução • O Método Estatístico Definição do Problema Planejamento Coleta de Apuração dos Apresentação dos Dados Análise e Interpretação
Introdução • O Método Estatístico Definição do Problema Analisar minuciosamente o problema de interesse e examinar outros levantamentos acerca do tema Planejamento - Determinar o procedimento necessário para resolver o problema (quais dados e como obtê-los) - Escolher as perguntas que serão feitas (correta formulação) - Definir se o trabalho será um censitário (população) ou uma amostra
Introdução • O Método Estatístico Coleta de Dados Obtenção, reunião e registro sistemático de dados Dados Primários X Dados Secundários
Introdução • O Método Estatístico Apuração de Dados Consiste em tabular, agrupar e contar os dados Apresentação de Dados - Tabelas - Gráficos
Introdução • O Método Estatístico Análise e Interpretação de Dados Envolve o cálculo de medidas (concentração e dispersão) visando descrever o fenômeno e auxiliar na tomada de decisões Ex. : Qual o nível de satisfação dos servidores do IFRN/Nova Cruz?
Amostragem Você deve evitar… Uma “boa” amostra não é uma amostra boa Ex. : Pesquisa com dados coletados de acordo com o resultado que se espera obter Amostra de resposta voluntária Ex. : Pesquisas de opinião na TV Amostra por conveniência Ex. : Pesquisas sobre o mercado consumidor como um todo, baseada em dados coletados em shoppings centers
Amostragem • Conceitos Amostragem Probabilística Ocorre quando todos os elementos da população tiverem probabilidade conhecida de fazerem parte da amostra, o que implica em um sorteio com regras bem definidas Amostragem Não-Probabilística Ocorre quando há uma escolhe proposital dos elementos que comporão a amostra
Amostragem • Amostragens Probabilísticas: Tipos Amostragem Aleatória Simples Consiste na escolha de indivíduos por sorteio Ex. : Selecionar os alunos do Téc. em Administração por sorteio, de acordo com o número da matrícula
Amostragem • Amostragens Probabilísticas: Tipos Amostragem Sistemática Escolhe-se um ponto de partida e então, sistematicamente, selecionam-se os indivíduos que comporão a amostra Ex. : Em uma sala, selecionar os alunos de 5 em 5, de acordo com a ordem em que estão sentados
Amostragem • Amostragens Probabilísticas: Tipos Amostragem Aleatória Estratificada Subdivide a população em estratos heterogêneos, sendo que, dentro de cada estrato, é possível identificar um comportamento homogêneo Ex. : Subdividir os alunos em Subsequente/Integrado e Homens/Mulheres e, depois, realizar um sorteio
Amostragem • Amostragens Não-Probabilísticas: Tipos Amostragem Por Conveniência Selecionam-se elementos que se tem acesso Ex. : Escolher, na minha turma, os alunos que tenho mais proximidade
Amostragem • Amostragens Não-Probabilísticas: Tipos Amostragem Intencional Escolher indivíduos que possam ser considerados representativos da população, com base em um conhecimento prévio de informações Ex. : Escolher junto com a Coordenadora os alunos mais envolvidos com o curso
Amostragem • Amostragens Não-Probabilísticas: Tipos Amostragem Por Cotas Após a classificação da população, determina-se a proporção de cada classe e selecionam-se cotas de acordo com estas proporções Ex. : O supermercado Barato faz umas pesquisa de mercado, selecionando os indivíduos respeitando a proporção por bairro e sexo
Representação de Dados Indivíduos São os objetos descritos por um conjunto de dados, podendo ser pessoas, animais ou objetos. Variáveis É qualquer característica de um indivíduo, que pode assumir valores diferentes para indivíduos diferentes. Ex. : Um aluno de uma sala é um exemplo de indivíduo, e seu peso, altura, idade são exemplos de variáveis
Representação de Dados Variáveis Qualitativas Apresentam como possíveis resultados uma qualidade (atributo) do indivíduo pesquisado. É também chamada de variável categórica. Variáveis Quantitativas Apresentam valores numéricos como resultados, frutos de contagem ou mensuração.
Representação de Dados
Representação de Dados Ex. : Classifique os seguintes dados: Tabela 1 - Informações sobre os funcionários da empresa X Fonte: Dados hipotéticos Obs. : Existem técnicas de representação apropriadas para cada tipo de variável Obs. : Em algumas situações, pode-se atribuir valores numéricos para variáveis qualitativas e analisá-las como quantitativas
Representação de Dados
Representação de Dados • Distribuições de Frequências (Tabelas) Regras básicas. . .
Representação de Dados • Distribuições de Frequências (Tabelas) Tabela 2 – Grau de instrução dos funcionários da empresa X Fonte: Dados hipotéticos
Representação de Dados • Distribuições de Frequências (Tabelas) Tabela 3 – Salário dos funcionários da empresa X Fonte: Dados hipotéticos DISTRIBUIÇÃO POR CLASSES (VARIÁVEIS QUANTITATIVAS CONTÍNUAS)
Representação de Dados • Distribuições de Frequências (Tabelas) Observações sobre a distribuição por classe. . . Perde-se conteúdo informacional A escolha das classes pode ser arbitrária Um dado não pode fazer parte de duas classes As classes devem ter o mesmo tamanho Ponderar: poucas classes (mais resumido e menos representativo) X muitas classes (menos resumido e mais representativo)
Representação de Dados • Gráficos para variáveis qualitativas - Gráfico de barras ou colunas Gráfico de pizza e suas variações Gráficos para variáveis quantitativas - Os gráficos qualitativos Gráfico de linha (temporal) Histograma
Representação de Dados • Gráficos Gráfico de barras ou colunas (valores absolutos) Gráfico 1 – Grau de instrução dos funcionários da empresa X 20 15 18 12 10 6 5 0 Fundamental Médio Superior Fonte: Dados hipotéticos
Representação de Dados • Gráficos Gráfico de pizza (valores relativos) Gráfico 2 – Grau de instrução dos funcionários da empresa X 16. 67% 33. 33% 50. 00% Fundamental Médio Superior Fonte: Dados hipotéticos
Representação de Dados • Gráficos Gráfico de barras (variável quantitativa) Gráfico 3 – Salário (SM) dos funcionários da empresa X 20, 00 |-- 24, 00 1 16, 00 |-- 20, 00 5 12, 00 |-- 16, 00 8 8, 00 |-- 12, 00 12 4, 00 |-- 8, 00 10 0 2 4 6 8 Fonte: Dados hipotéticos 10 12 14
Representação de Dados • Gráficos Gráfico de linha (temporal) Gráfico 4 – Produção de automóveis no Brasil – Jan/12 a Fev/13 20 12 20. 01 12 20. 02 12 20. 03 12 20. 04 12 20. 05 12 20. 06 12 20. 07 12 20. 08 12 20. 09 12 20. 10 12 20. 11 12 20. 12 13 20. 01 13. 0 2 270, 000 250, 000 230, 000 210, 000 190, 000 170, 000 150, 000 Fonte: Ipeadata (2015)
Representação de Dados • Gráficos Histograma Gráfico 5 – Gasto médio na lanchonete 33% 35. 00% 30. 00% 28% 22% 25. 00% 20. 00% 14% 15. 00% 10. 00% 3% 5. 00% 0. 00% 4, 00 |-- 8, 00 |-- 12, 00 |-- 16, 00 |-- 20, 00 Fonte: Ipeadata (2015) 20, 00 |-- 24, 00
Representação de Dados • Gráficos Histograma Através do histograma é possível analisar. . . - Concentração - Dispersão - Valor atípico
Representação de Dados Gráficos • Histograma Concentração 12 6 10 5 8 4 6 3 4 2 2 1 0 0 20 22 24 26 28 30 32 34 36 38 40 42 44 46 10 9 8 7 6 5 4 3 2 1 0 20 22 24 26 28 30 32 34 36 38 40 42 44 46
Representação de Dados • Gráficos Histograma Dispersão 8 6 7 5 6 4 5 4 3 3 2 2 1 1 0 0 20 22 24 26 28 30 32 34 36 38 40 42 44 46
Representação de Dados • Gráficos Histograma Valores atípicos 8 7 6 5 4 3 2 1 0 20 22 24 26 28 30 32 34 36 38 40 42 44 46
Medidas Resumo São valores representativos dados, que podem ser de: Centro Medidas representativas da posição em torno da qual os dados mais se concentram Moda, Média, Mediana Dispersão Medidas representativas do grau de dispersão dos dados em torno de seu valor central Variância e Desvio-Padrão Ex. : Calcule medidas resumo de 6, 2, 9, 4, 6, 8, 6, 7, 4 Obs. : Organize os dados em rol
Medidas de Centro
Medidas de Centro • Moda Ex. : Encontre a moda do seguinte conjunto de dados: 3, 5, 8, 10, 12, 13 (amodal) Ex. : Encontre a moda do seguinte conjunto de dados: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 (multimodal)
Medidas de Centro
Medidas de Centro
Medidas de Dispersão
Medidas de Dispersão
Medidas de Dispersão
Medidas Resumo • Fórmulas no Excel Moda MODO. MULT (para casos com mais de uma moda) SHIFT + CTRL + ENTER Média MEDIA Mediana MED Desvio-Padrão DESVPAD. A
Casos Especiais • Média Móvel - Considera o fato variação do tempo em seu cálculo - Segue a mesma lógica de cálculo da média aritmética, sendo que se “move” ao longo do tempo Ex. : Suponha as seguintes vendas de cachorros quentes. Com base nestes dados, diga para quantos produtos você compraria matéria-prima para o próximo dia de vendas. 23, 20, 22, 21, 28, 27, 24, 21, 23, 22, 27, 30, 25, 23, 24, 26, 27, 28, 32, 25, 28, 29, 34, 33, 36, 37, 33, 34, 36, 38, 40, 43, 41, 44, 46
Casos Especiais
Casos Especiais • Média Ponderada Ex. : Uma escola considera que as notas dos últimos bimestres são mais importantes do que as notas dos primeiros. Como fazer para que isto seja considerado no cálculo da média das notas de um aluno em uma determinada matéria? 1ºb (Nota 9) 2ºb (Nota 8) 3ºb (Nota 3) 4ºb (Nota 4)
Casos Especiais • Separatrizes São medidas que, assim como a mediana, dividem a série em partes iguais Podem ser… - Mediana (2 blocos de 50%) - Quartil (4 blocos de 25%) - Decil (10 blocos de 10%) - Percentil (100 blocos de 1%)
Casos Especiais • Resumo das Medidas
Casos Especiais
Casos Especiais
Medidas Resumo • Fórmulas no Excel Moda MODO. MULT (para casos com mais de uma moda) SHIFT + CTRL + ENTER Média MEDIA Mediana MED Desvio-Padrão DESVPAD. A Mínimo, Q 1, Mediana, Q 3, Máximo QUARTIL. INC
Interpretação de Resultados • Os Formatos das Curvas de Frequência Imagine o histograma de uma distribuição de frequências da seguinte forma: 6 5 4 3 2 1 0 161718192021222324252627282930313233343536373839404142434445464748495051
Interpretação de Resultados • Os Formatos das Curvas de Frequência Caso façamos o contorno do histograma, teremos o que chamamos de curva de frequência: Podemos analisar esta curva de frequência de acordo com sua assimetria e com sua curtose
Interpretação de Resultados • Assimetria • SIMÉTRICA • ASSIMÉTRICA À DIREITA (Positiva) • ASSIMÉTRICA À ESQUERDA (Negativa)
Interpretação de Resultados • Assimetria: Características
Interpretação de Resultados
Interpretação de Resultados
Interpretação de Resultados • Curtose • MESOCÚRTICA • LEPTOCÚRTICA • PLATICÚRTICA
Interpretação de Resultados
Interpretação de Resultados
Interpretação de Resultados • A Curva Normal Muitos dados da vida real têm distribuições que são aproximadamente simétricas e mesocúrticas, que formam uma curva de frequência que lembra um sino
Interpretação de Resultados • A Curva Normal Para estas curvas, podemos considerar a seguinte regra:
Interpretação de Resultados • Box-splot Também podemos analisar concentração e dispersão de dados, representando graficamente as medidas resumo (regra dos 5 números)
Interpretação de Resultados • Box-splot 4, 000 3, 500 3, 000 2, 500 2, 000 1, 500 1, 000 500 0 E 1 E 2
Interpretação de Resultados
Interpretação de Resultados
Correlação A correlação corresponde à relação entre duas variáveis Tabela 1 – Notas dos alunos do Curso Técnico em Adm. do IFRN Alunos 1 2 3 4 5 6 7 8 9 10 Estatística Matemática Literatura 5 6 5 8 9 2 7 8 3 10 10 1 6 5 4 7 7 4 9 8 2 3 4 6 8 6 2 2 2 8 Fonte : Dados fictícios (2015)
Correlação ü Diagramas de Dispersão
Correlação
Correlação
Análise de Regressão A Regressão Linear (Análise de Regressão) consiste em estimar a reta que melhor aproxima os pontos observados A Linha de Regressão é a aquela em que se obtém o valor mínimo para a soma dos quadrados resíduos A equação de uma Reta de Regressão permite que você use a variável independente (explanatória) par fazer previsões para a variável y dependente (resposta)
Análise de Regressão
Análise de Regressão
Análise de Regressão
Análise de Regressão
Análise de Regressão Variável independente (explanatória) (é aquela que influencia no comportamento da variável resposta) Variável dependente (resposta) (é aquela que sobre a qual desejamos fazer uma estimativa)
Análise de Regressão Uma Administradora de planos odontológicos estimou uma regressão, cuja variável independente é o preço de seu plano e a variável dependente é a quantidade de adesões ao plano, dada por: Se esta Administradora cobrar R$ 20 pelo plano, quantas adesões ela espera ter?
Análise de Regressão
- Slides: 100