Curso de Graduao em Administrao Prof Hubert Chamone
Curso de Graduação em Administração Prof. Hubert Chamone Gesser, Dr. Graduação em Administração - ESAG/UDESC Doutorado e Mestrado em Engenharia de Produção - UFSC
- SUMÁRIO - Conceitos Introdutórios Correlação Linear Técnicas de Amostragem Regressão Linear Medidas de Ordenamento Intervalo de Confiança Assimetria e Curtose Teste T (Diferença entre médias) Probabilidades Teste Qui-Quadrado Distribuição de Bernoulli Bibliografia
Conceitos Introdutórios Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA ADMINISTRAÇÃO A administração é o processo de planejar, organizar, liderar e controlar os esforços realizados pelos membros da organização e o uso de todos os recursos organizacionais para alcançar os objetivos estabelecidos. ESTATÍSTICA Origem no latim status (estado) + isticum (contar) Informações referentes ao estado Coleta, Organização, Descrição, Análise e Interpretação de Dados 4
ESTATÍSTICA O Que é Estatística? Para Sir Ronald A. Fisher (1890 -1962): Estatística é o estudo das populações, das variações e dos métodos de redução de dados. 5
ESTATÍSTICA O Que é Estatística? “Eu gosto de pensar na Estatística como a ciência de aprendizagem a partir dos dados. . . ” Jon Kettenring Presidente da American Statistical Association, 1997 6
ESTATÍSTICA BIOETATÍSTICA Elaborando a Definição de Estatística Coletar dados Obter informações Tomar decisões 7
ESTATÍSTICA O Que é Estatística (definição)? “Estatística é um conjunto de técnicas e métodos que auxilia o processo de tomada de decisão na presença de incerteza. ” Estatística Descritiva coleta, organização e descrição dos dados. Estatística Inferencial análise e interpretação dos dados. 8
ESTATÍSTICA EXPECTATIVA DE VIDA – Diferenças entre os países 9
ESTATÍSTICA Panorama Histórico Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos e óbitos, que hoje chamamos de “estatísticas”. Na Idade Média, colhiam-se informações, geralmente com finalidades tributárias ou bélicas. O Livro dos Impostos 10
ESTATÍSTICA À partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais. No século XVIII o estudo de tais fatos foi adquirindo feição verdadeiramente científica. Gottfried Achenwall batizou a nova ciência com o nome de Estatística, determinando o seu objetivo e suas relações com as ciências. O verbete “statistics” apareceu na Enciclopédia Britânica em 1797. 11
ESTATÍSTICA Método Científico Muitos dos conhecimentos que temos foram obtidos da Antiguidade por acaso e, outros, por necessidades práticas, sem aplicação de um método. Atualmente, quase todo acréscimo de conhecimento resultada da observação e do estudo. Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. 12
ESTATÍSTICA Método Estatístico O método estatístico, diante da impossibilidade de manter as causas constantes, variando-as, admitem registrando todas essas causas variações e presentes procurando determinar, no resultado final, que influências cabem a cada uma delas. 13
ESTATÍSTICA Fases do Método Estatístico 1) Coleta de dados A coleta direta de dados pode ser classificada relativamente ao fator tempo em: contínua: quando feita continuamente; periódica: quando feita em intervalos constantes de tempo; ocasional: quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência. 14
ESTATÍSTICA 2) Crítica dos dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições. A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; e é interna quando visa a observar os elementos originais dos da coleta. 3) Apuração dos dados Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica. 15
ESTATÍSTICA 4) Exposição ou apresentação dos dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas. 5) Análise dos resultados Para tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). 16
ESTATÍSTICA Uma representação didática … Dados Estatística Informação Conhecimento Decisão 17
ESTATÍSTICA 18
ESTATÍSTICA Fonte: http: //www. bocamaldita. com/1119733943/nova-charge-no-ar-contra-corrupcao/ 19
ESTATÍSTICA 20
ESTATÍSTICA A Estatística nas Empresas A direção de qualquer tipo de empresa, exige de seu administrador a tarefa de tomar decisões. O conhecimento e o uso da Estatística facilitarão seu trabalho de planejar, organizar, dirigir e controlar a empresa. Por meio da sondagem, da coleta de dados e de recenseamento de opiniões, pode-se conhecer a realidade geográfica e social da empresa, entre outros, e estabelecer suas metas, seus objetivos de curto, médio e longo prazos. 21
ESTATÍSTICA A Estatística ajudará também na seleção e organização da estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e qualidade do produto, e mesmo possíveis lucros e/ou perdas. Tudo que se pensou e se planejou precisa ficar registrado. O esquema do planejamento é o plano, que pode ser resumido, com auxílio da Estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatísticos que lhes deram origem. 22
ESTATÍSTICA SOFTWARES ESTATÍSTICOS • • SPSS Epidata Bioestat Excel STATA SAS Epi Info 23
Amostragem Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA APLICAÇÕES DE AMOSTRAGEM Pesquisa Mercadológica (Índice de satisfação na população) Pesquisa Eleitoral (Porcentagem de votos para cada candidato) Perfil Socioeconômico da População (Grau de escolaridade, Renda) População Amostra Na População Parâmetros Na Amostra Estatísticas Inferência Estatística 25
ESTATÍSTICA POR QUE USAR A AMOSTRAGEM? Economia (É mais barato levantar dados de uma parcela da população) Tempo (É mais rápido) QUANDO NÃO USAR A AMOSTRAGEM? Quando a população for pequena (n > 0, 8. N) Quando a característica for de fácil mensuração (Sim ou Não) Quando houver a necessidade de alta precisão (Censo IBGE) 26
ESTATÍSTICA 27
ESTATÍSTICA O Processo de Amostragem Definição da População Determinação da Estrutura da Amostragem Seleção da Técnica de Amostragem Determinação do Tamanho da Amostra Execução do Processo de Amostragem 28
ESTATÍSTICA Classificação das Técnicas de Amostragem Técnicas Não Probabilísticas Técnicas Probabilísticas 29
ESTATÍSTICA Técnicas de Amostragem Não Probabilísticas Amostragem por Conveniência Amostragem por Julgamento Amostragem por Quotas Amostragem Bola de Neve 30
ESTATÍSTICA Amostragem por Conveniência A seleção fica a cargo do entrevistador. Muitas vezes, os entrevistados são selecionados porque eles estão no lugar certo no momento certo. EXEMPLOS: - Entrevistar pessoas no meio da rua. - Entrevistas pelo correio sem qualificar os entrevistados. 31
ESTATÍSTICA Amostragem por Julgamento – É uma forma de amostragem por conveniência na qual os elementos da população selecionados com base no julgamento do Pesquisador. EXEMPLOS: - Engenheiros selecionados para definir uma compra de máquinas industriais. - Testemunhas utilizadas em um tribunal de juri. 32
ESTATÍSTICA Amostragem por Quotas É elaborada em dois estágios: 1) Desenvolver categorias de controle (quotas) da população Exemplo: Classe Social. 2) Os elementos da amostra são selecionados por conveniência ou julgamento. 33
ESTATÍSTICA Amostragem Bola de Neve Um grupo é inicialmente sorteado, depois esses participantes indicam outras pessoas da população alvo de interesse. Também chamada de Amostragem Autogerada. Ajuda a estimar características raras. 34
ESTATÍSTICA Técnicas de Amostragem Probabilísticas Amostragem Aleatória Simples Amostragem Sistemática Estratificada Amostragem por Conglomerados 35
ESTATÍSTICA Amostragem Aleatória Simples • Obedece a propriedade de qualquer elemento da população ter a mesma chance de pertencer à amostra. • • Cada elemento da amostra é selecionado de forma independente do outro. • Pode-se utilizar uma tabela de números aleatórios ou sorteios. 36
ESTATÍSTICA Amostragem Sistemática Após obter-se a lista dos elementos da população, sorteia-se a entrada e segue-se a relação N/n. EXEMPLO: - Em uma população de 100. 000 pessoas é desejada uma amostra de 1. 000 pessoas. - Neste caso, a relação N/n é 100. - É sorteado um número entre 1 e 100. - Se, por exemplo, este número é 23, a amostra consiste em elementos 23, 123, 223, 323, 423, 523 e assim por diante. 37
ESTATÍSTICA Amostragem Estratificada • Elabora-se a amostra através do perfil conhecido da população. • Divide-se a população em estratos e depois se faz sorteios nos estratos. • EXEMPLO: Se numa escola 80% são alunos, 10% são professores e 10% funcionários, a amostra é confeccionada obedecendose estes parâmetros. 38
ESTATÍSTICA Amostragem por Conglomerados Os conglomerados (clusters) devem ser internamente heterogêneos e externamente homogêneos. Cada cluster deve ser uma pequena representação da população. EXEMPLO: Em uma população de domicílios, um quarteirão é um Conglomerado. . 39
ESTATÍSTICA 40
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Sejam: n 0 = Primeira aproximação para o tamanho da amostra E 0 = Erro Amostral Tolerável n = Tamanho da Amostra N = Tamanho da População n 0 = 1 / (Eo)2 n = (N. n 0) / (N + no) 41
ESTATÍSTICA DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n) Populações Finitas com Parâmetros de Prevalência Conhecidos n= (N. z 2. p. (1 -p)) (E 02. (N-1) + z 2. p. (1 -p)) Onde: N = Tamanho da População z = Nível de confiança expresso em desvio padrão (95%) = 1, 96 E 0 = Erro Amostral Tolerável p = Prevalência do evento na População 42
ESTATÍSTICA RELAÇÃO ENTRE (n) E (N) Relação entre o tamanho da população e o tamanho da amostra n 600 500 O principal fator determinante no tamanho da amostra é a Margem de Erro do estudo 400 300 200 100 0 0 500 1000 1500 2000 2500 3000 3500 N 43
ESTATÍSTICA Procure respeitar o Plano de Amostragem para que seja alcançada uma amostra representativa da população. 44
ESTATÍSTICA Estudo de Caso 1) Determine o tamanho da amostra para uma pesquisa eleitoral em uma cidade com 200. 000 eleitores, adotando uma margem de erro de 2 pontos percentuais. n 0 = 1 / (Eo)2 n = (N. n 0) / (N + no) n 0 = 1 / (0, 02)2 n = (200000. 2500) / (200000 + 2500) n 0 = 2500 eleitores n = 2469, 1358 = 2470 eleitores 45
Medidas de Ordenamento Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA MEDIDAS DE ORDENAMENTO A mediana caracteriza uma série de valores devido à sua posição central, mas também separa a série em dois grupos que apresentam o mesmo número de valores. Assim, além das medidas de posição, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica. Essas medidas - os quartis, os percentis e os decis - são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes (medidas de ordenamento). 47
ESTATÍSTICA MEDIDAS DE ORDENAMENTO Roteiro de Cálculo: Ø Fazer a disposição em rol Ø Calcular a posição da medida de ordenamento Ø Encontrar o valor 48
ESTATÍSTICA Dr. William Mendenhall North Carolina State University Dr. Terry Sincich University of South Florida MEDIDAS DE ORDENAMENTO 49
ESTATÍSTICA Cálculo de posições pela definição de Mendenhall e Sincich 50
ESTATÍSTICA MEDIDAS DE ORDENAMENTO São os valores que subdividem uma disposição em rol Medidas: QUARTIS, DECIS E PERCENTIS Os Quartis dividem a disposição em 4 partes iguais Q 1, Q 2, Q 3 Os Decis dividem a disposição em 10 partes iguais D 1, D 2, D 3, D 4, D 5, D 6, D 7, D 8, D 9 Os Percentis dividem a disposição em 100 partes iguais P 1, P 2, P 3, P 4, P 5, P 6, . . . , P 99 51
ESTATÍSTICA QUARTIS Os Quartis dividem a disposição em 4 partes iguais Q 1, Q 2, Q 3 Entre cada quartil há 25% dos da disposição Posição do Primeiro Quartil (Q 1) = (n + 1) / 4 Posição do Segundo Quartil (Q 2) = 2. (n + 1) / 4 Posição do Terceiro Quartil (Q 3) = 3. (n + 1) / 4 O segundo quartil coincide com a Mediana (Q 2 = Md) 52
ESTATÍSTICA QUARTIS Os Quartis dividem a disposição em 4 partes iguais Q 1, Q 2, Q 3 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 9, 9, 9 n = 27 Q 1 7 o termo Q 2 14 o termo Q 3 21 o termo 53
ESTATÍSTICA DECIS Os Decis dividem a disposição em 10 partes iguais D 1, D 2, D 3, D 4, D 5, D 6, D 7, D 8, D 9 Entre cada decil há 10% dos da disposição Posição do Primeiro Decil (D 1) = (n + 1) / 10 Posição do Segundo Decil (D 2) = 2. (n + 1) / 10 Posição do Nono Decil (D 9) = 9. (n + 1) / 10 O Quinto Decil coincide com a Mediana (D 5 = Md) 54
ESTATÍSTICA PERCENTIS Os percentis dividem a disposição em 100 partes iguais P 1, P 2, P 3, P 4, P 5, P 6, . . . , P 99 Entre cada percentil há 1% dos da disposição Posição do Primeiro Percentil (P 1) = (n + 1) / 100 Posição do Segundo Percentil (P 2) = 2. (n + 1) / 100 Posição do Nonagésimo Nono Percentil (P 99) = 99. (n + 1) / 100 P 50 = Md P 25 = Q 1 P 75 = Q 3 55
ESTATÍSTICA EXERCíCIOS 1) Dado o conjunto de dados: a) apresente a disposição em rol; b) o Percentil 50, c) o Primeiro Quartil, d) a Média, e) a Moda e f) a Mediana 10 13 24 45 66 77 11 14 26 33 65 21 57 56
ESTATÍSTICA 2) Em uma amostra com 2789 valores qual é a posição do oitavo decil, da mediana, do segundo decil, do terceiro quartil e do segundo quartil? 57
Medidas de Assimetria e Curtose Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Análise Vertical: Assimétrica Positiva (cauda direita) Leptocúrtica (alta) Simétrica Mesocúrtica Assimétrica Negativa (cauda esquerda) Platicúrtica (baixa) Análise Conjunta: Assimétrica Positiva Leptocúrtica Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal” 59
ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Assimétrica Positiva (cauda direita é mais longa) f Curva Assimétrica à Direita x 60
ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Simétrica f x 61
ESTATÍSTICA CURVAS DE FREQUÊNCIA Análise Horizontal: Assimétrica Negativa (cauda esquerda é mais longa) f Curva Assimétrica à Esquerda x 62
ESTATÍSTICA CURVAS DE FREQUÊNCIA f Análise Vertical: Leptocúrtica (alta) x 63
ESTATÍSTICA CURVAS DE FREQUÊNCIA f Análise Vertical: Mesocúrtica x 64
ESTATÍSTICA CURVAS DE FREQUÊNCIA f Análise Vertical: Platicúrtica (baixa) x 65
ESTATÍSTICA MENSURANDO A ASSIMETRIA Em uma distribuição simétrica, a média e a moda coincidem; Na distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; Na assimétrica à direita ou positiva, a média é maior que a moda. 66
ESTATÍSTICA MEDINDO A ASSIMETRIA (Forma Simples) Baseando-nos nessas relações entre a média e a moda, podemos empregá-las para determinar o tipo de assimetria. Assim, calculando o valor da diferença: Se assimetria nula ou distribuição simétrica; Se assimetria negativa ou à esquerda; Se assimetria positiva ou à direita. 67
ESTATÍSTICA COEFICIENTE DE ASSIMETRIA A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo, daremos preferência ao coeficiente de assimetria de Pearson, dado por: Se 0, 15<|As|<1, a assimetria é moderada; Se |As|>1, a assimetria é forte. 68
ESTATÍSTICA ASSIMETRIA NAS CURVAS DE FREQUÊNCIA Simétrica Assimétrica à direita Assimétrica à esquerda 69
ESTATÍSTICA 70
ESTATÍSTICA MENSURANDO A CURTOSE Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal. 71
ESTATÍSTICA COEFICIENTE PERCENTÍLICO DE CURTOSE Se C = 0, 263, a curva é mesocúrtica; se C < 0, 263, a curva é leptocúrtica; se C > 0, 263, a curva é platicúrtica. Observação: no Microsoft Excel a interpretação é diferente. 72
ESTATÍSTICA COEFICIENTE PERCENTÍLICO DE CURTOSE 73
ESTATÍSTICA MEDINDO A CURTOSE NO Microsoft Excel No Microsoft Excel a interpretação é diferente, pois é observado se os valores do coeficiente são positivos ou negativos. Se Coef = 0, a curva é mesocúrtica; se Coef > 0, a curva é leptocúrtica; se Coef < 0, a curva é platicúrtica. 74
ESTATÍSTICA Análise de Dados no Microsoft Excel 75
ESTATÍSTICA Análise de Dados no Microsoft Excel FUNÇÕES FÓRMULAS NO EXCEL Curtose =CURT(A 1: A 30) Assimetria =DISTORÇÃO(A 1: A 30) 76
Probabilidades Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA 78
ESTATÍSTICA DEFINIÇÃO DE PROBABILIDADE A palavra probabilidade deriva do Latim probare (provar ou testar) A teoria das probabilidades tenta quantificar a noção de provável. Será que o ônibus vai demorar? Será que essa chuva vai passar? Fonte: www. blogdogaz. com. br 79
ESTATÍSTICA começarmos Ao estudo o da probabilidade, normalmente a primeira ideia que nos vem à mente é a da sua utilização em jogos, mas podemos utilizá-la em muitas outras áreas. 80
ESTATÍSTICA Exemplo na área comercial: Um site de comércio eletrônico utiliza a probabilidade para prever a possibilidade de fraude por parte de um possível comprador. Fonte: http: //www. morcego. blogger. com. br/2007_03_01_archive. html 81
ESTATÍSTICA LEI DOS GRANDES NÚMEROS Conforme Du. Pasquier, em uma série de observações de um conjunto natural, realizadas em circunstâncias idênticas, um atributo x ocorre com frequência relativa, cujo valor é uma aproximação da probabilidade, aproximação esta tanto maior quanto maior for o número de observações. (CASTANHEIRA, 2010) 82
ESTATÍSTICA Fonte: http: //www. trendfollowingbovespa. com. br/2012_12_01_archive. html 83
ESTATÍSTICA Pierre Simon Marquis de Laplace Beaumont-en-Auge, 23 de março de 1749 Paris, 5 de março de 1827 Foi um matemático, astrônomo e físico francês considerado o pai da Teoria das Probabilidades. 84
ESTATÍSTICA TEORIA DAS PROBABILIDADES Os teoremas de base das probabilidades podem ser demonstrados a partir dos axiomas das probabilidades e da teoria de conjuntos. Calcula a chance de um evento ocorrer 85
ESTATÍSTICA Experimento Aleatório Experimentos cujos resultados podem apresentar variações, mesmo quando realizados em condições praticamente iguais. Ex. : Lançamento de um dado Observação do sexo de recém-nascidos Lançamento de uma moeda Jogar duas moedas 86
ESTATÍSTICA Espaço Amostral (S) Conjunto de todos os resultados possíveis de um experimento aleatório. Exemplo: S 1 S 2 S 3 S 4 S 5 = = = { { { 1, 2, 3, 4, 5, 6} M, F } C , K } onde, C = cara K= coroa 0 , 1 , 2 , 3 , . . . } CC, CK, KC, KK } 87
ESTATÍSTICA Espaço Amostral no Lançamento de 3 Moedas 88
ESTATÍSTICA Evento É qualquer subconjunto do espaço amostral, geralmente denotado por letras maiúsculas. Quando lançamos um dado ou uma moeda, chamamos a ocorrência deste fato de evento. Qualquer subconjunto de um espaço amostral é um evento. Exemplo: lançamento de um dado S={1, 2, 3, 4, 5, 6} Evento A = sair face par (evento composto) Evento B = sair 1 (evento simples) 89
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Suponha que uma experiência aleatória tem apenas um número finito de resultados possíveis. Seja A um evento associado a essa experiência aleatória. Então a probabilidade do evento A é dada por: P(A)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis 90
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Qual é a probabilidade de cair CARA no lançamento de uma moeda? P(A)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis P(A)= 1/2 ou seja 50% 91
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Qual é a probabilidade de sair o número 6 no lançamento de um dado? P(B)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis P(B)= 1/6 ou seja 16, 6667% 92
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Qual é a probabilidade de cair um número PAR no lançamento de um dado? P(C)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis P(C)= 3/6 ou seja 50% 93
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Lançando-se dois dados simultaneamente, qual é a chance da soma dos resultados ser igual a sete? P(D)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis E = Multiplicação Ou = Soma Jogar um dado E outro (multiplicação) P(D)= 6/36 ou seja 16, 6667% 94
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Lançando-se simultaneamente um dado e uma moeda, qual é a chance de aparecer coroa na moeda e um número menor que 4 no dado? P(E)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis E = Multiplicação (multiplicação) Ou = Soma Coroa na moeda E >4 no dado P(E)= ½ x 3/6 ou seja 25% 95
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Uma urna tem 4 bolas brancas e 5 bolas pretas. Duas bolas são sacadas dessa urna sucessivamente e sem reposição. Qual é a probabilidade de ambas serem brancas? P(F)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis E = Multiplicação Ou = Soma 1 branca E outra branca (Multiplicação) P(F)= 4/9 x 3/8 ou seja 16, 6667% 96
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Uma urna tem 20 bolas numeradas de 1 a 20. Qual é a probabilidade de obter um número par ou menor que 5? P(G)= N. º de casos favoráveis à ocorrência do evento A N. º total de casos possíveis Par OU Menor que 5 (Soma) E = Multiplicação Ou = Soma P(G)= 10/20 + 2/20 ou seja 60% 2 e 4 já haviam sido contados 97
ESTATÍSTICA CÁLCULO DA PROBABILIDADE Em uma população de aves, a probabilidade de um animal estar doente é de 1/25. Quando está doente a probabilidade de ser devorada por predadores é de ¼ e de 1/40 quando não está doente. Qual é a probabilidade de uma ave, escolhida aleatoriamente, dessa população ser devorada? DOENTE E SER DEVORADA 1/25 x ¼ = 1/100 = 1% SADIA E SER DEVORADA 24/25 x 1/40 = 24/1000 = 2, 4% Chance de uma ave Sadia OU Doente ser devorada Soma das probabilidades: 1% + 2, 4% = 3, 4% 98
Distribuição de Bernoulli Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA Jackob Benoulli (1654 -1705) Foi um matemático suíço. Nascimento: 27 de dezembro de 1654 Basiléia, Suíça. Falecimento: 16 de agosto de 1705, Basiléia, Suíça. Educação: Universidade da Basiléia 100
ESTATÍSTICA DISTRIBUIÇÃO DE BERNOULLI Estuda o comportamento dos Ensaios de Bernoulli Sucesso / Fracasso Na área de teoria das probabilidades, a distribuição de Bernoulli é a distribuição discreta de espaço amostral {0, 1}, que tem valor 1 com a probabilidade de sucesso e valor 0 com a probabilidade de falha. 101
ESTATÍSTICA DISTRIBUIÇÃO DE BERNOULLI Estuda o comportamento dos Ensaios de Bernoulli Sucesso / Fracasso Exemplos: - Lançar uma moeda e ver se ocorre cara ou não; Lançar um dado e observar se ocorre 6 ou não; Numa linha de produção, observar se um item é defeituoso ou não; Verificar se um servidor de uma intranet está ativo ou não. 102
ESTATÍSTICA DISTRIBUIÇÃO DE BERNOULLI Ensaios de Bernoulli Quando x = 1 Sucesso / Quando x = 0 Fracasso x p (x) 0 1–p 1 p Total 1 103
ESTATÍSTICA DISTRIBUIÇÃO DE BERNOULLI A distribuição de Bernoulli é um caso especial da Distribuição Binomial, com n=1 104
ESTATÍSTICA EXEMPLO: Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna. Seja x: nº de bolas verdes. Determinar P(x) = 20/50 = 2/5 = 0, 4 = 40% Var(X) = p. q = (2/5). (3/5) = 6/25 105
Correlação Linear Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA CORRELAÇÃO E REGRESSÃO Sendo a relação entre as variáveis de natureza quantitativa, a CORRELAÇÃO é o instrumento adequado para descobrir e medir essa relação. Uma vez caracterizada a relação, procuramos descrevê-la através de uma função matemática. A REGRESSÃO é o instrumento adequado para a determinação dos parâmetros da função. 107
ESTATÍSTICA DIAGRAMA DE DISPERSÃO Mostra o comportamento de duas variáveis quantitativas (com dados numéricos). a a b b 108
ESTATÍSTICA CORRELAÇÃO LINEAR POSITIVA Quando valores pequenos da variável a tendem a estar relacionados com valores pequenos de b, enquanto que valores grandes de a tendem a estar relacionados com valores grandes de b. a Exemplos: Peso x Altura Nível socioeconômico x Volume de vendas Consumo de Álcool x Preval. Cirrose Hepática b 109
ESTATÍSTICA CORRELAÇÃO LINEAR NEGATIVA Quando valores pequenos da variável a tendem a estar relacionados com valores grandes de b, enquanto que valores grandes de a tendem a estar relacionados com valores pequenos de b. a Exemplos: Renda Familiar x Número de Filhos Escolaridade x Absenteísmo Volume de vendas x Passivo circulante b 110
ESTATÍSTICA CORRELAÇÃO NÃO LINEAR O diagrama de dispersão mostra um conjunto de pontos aproximando-se mais de uma parábola do que de uma reta. a Exemplos: Coef. de Letalidade (a) x Dose do Medicamento (b) Custo (a) x Lote Econômico de Compra (b) b 111
ESTATÍSTICA TIPOS DE CORRELAÇÃO 112
ESTATÍSTICA TIPOS DE CORRELAÇÃO Se r 0, 7 -0, 7 Correlação Linear Positiva Forte Correlação Linear Negativa Forte 113
ESTATÍSTICA COEFICIENTE DE CORRELAÇÃO DE PEARSON r = n. (X. Y) - X. Y n. X 2 - ( X)2. n. Y 2 - ( Y)2 (X. Y) = Fazem-se os produtos X. Y p/ cada par e depois efetua-se a soma X = Somatório dos valores da variável X Y = Somatório dos valores da variável Y X 2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a soma Y 2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma 114
ESTATÍSTICA EXEMPLO Cálculo do coeficiente de correlação para os dados das variáveis X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos. X Y 101 193 3, 2 4, 6 . . . 42 1452 . . . 2, 8 39, 3 X 2 Y 2 X. Y 10201 10, 24 37249 21, 16. . . 323, 2 887, 8. . . 1764 7, 84 117, 6 251538 153, 55 5706, 2 115
ESTATÍSTICA n. (X. Y) - X. Y r = n. X 2 - ( X)2. n. Y 2 - ( Y)2 r = 12. 5706, 2 - 1452. 39, 3 12. 251538 - (1452)2. 153, 55 - (39, 3)2 r = 0, 7 (Correlação Linear Positiva r > 0) 116
ESTATÍSTICA COEFICIENTES DE CORRELAÇÃO Positiva Perfeita Positiva r>0 Negativa r<0 r=1 Negativa perfeita r = -1 117
ESTATÍSTICA COEFICIENTES DE CORRELAÇÃO Ausência de Correlação r=0 118
ESTATÍSTICA INTERPRETAÇÃO • O Valor de r (Correlação Linear de Pearson) varia de -1 a +1. • O sinal indica o sentido (correlação positiva ou negativa). • O valor indica a força da correlação (Fraca ou Forte) valor de r Forte Relativa Fraca -1 - 0, 7 Muito Fraca - 0, 3 Ausência 0 Muito Fraca + 0, 3 Relativa Fraca Forte + 0, 7 +1 119
ESTATÍSTICA CORRELAÇÃO DE SPEARMAN (Rho) • Estatística não paramétrica • Usada em dados que não têm Distribuição Normal • Usadas com dados Ordinais (Conceitos: A, B, C, D, E) CORRELAÇÃO TAU DE KENDALL • Estatística não paramétrica • Usada em um conjunto pequeno de dados com muitos postos empatados 120
ESTATÍSTICA EXERCÍCIO 1) Coloque V (Verdadeiro) ou F (Falso): ( ) Quando o valor de r for maior que 0, 7 ou menor que -0, 7 a correlação entre as duas variáveis em estudo é forte ( ) O sinal negativo de r indica que as variáveis em estudo são inversamente proporcionais ( ) Ao se encontrar um valor de r = 0, 6 não se pode afirmar que as variáveis sejam diretamente proporcionais. ( ) O coeficiente de correlação de Pearson pode ser aplicado em dados nominais 121
Regressão Linear Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA REGRESSÃO Sempre que desejamos estudar determinada variável em função de outra fazemos uma análise de regressão. A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de n observações das mesmas. A variável a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. 123
ESTATÍSTICA REGRESSÃO Supondo X a variável independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por: Y = a. X + b onde a e b são coeficientes. a = Inclinação ou Gradiente (Coef. Angular) b = Intercepto (Coef. Linear) 124
ESTATÍSTICA REGRESSÃO Sejam duas variáveis X (Notas de Matemática) e Y (Notas de Estatística), entre as quais exista uma correlação acentuada, embora não perfeita, como as que formam a tabela a seguir: 125
ESTATÍSTICA REGRESSÃO Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por: Y = a. X + b 126
ESTATÍSTICA REGRESSÃO Eu obtive a equação da reta. . . dos mínimos quadrados ordinários Legendre, Adrien-Marie (1752 -1833) - Matemático francês, discípulo de Euler e Lagrange. - É autor de um clássico trabalho de geometria, Élements de géométrie. - Também fez importantes contribuições em equações diferenciais, cálculo, teoria das funções e teoria dos números. 127
ESTATÍSTICA REGRESSÃO Y = a. X + b 128
ESTATÍSTICA REGRESSÃO 129
ESTATÍSTICA CÁLCULO DA REGRESSÃO 130
ESTATÍSTICA RETA IMAGEM DA REGRESSÃO 131
ESTATÍSTICA RETA IMAGEM DA REGRESSÃO (Microsoft Excel) 132
ESTATÍSTICA COEFICIENTE DE DETERMINAÇÃO ( R 2 ) Basta elevar o coeficiente de correlação ao quadrado R 2 É quanto a variável X pode explicar da variação em Y 133
ESTATÍSTICA INTERPOLAÇÃO E EXTRAPOLAÇÃO Voltando à tabela das notas, vemos que 4, 0 não figura entre as notas de Matemática. Entretanto, podemos estimar a nota correspondente em Estatística fazendo X=4, 0 na equação: Assim, O mesmo acontece com a nota 1, 0: Como 4 pertence ao intervalo [2, 10], foi feita uma interpolação; e como 1 não pertence ao intervalo [2, 10], foi feita uma extrapolação. 134
Intervalo de Confiança Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA POPULAÇÃO E AMOSTRA x x x Média x x População x Amostras 136
ESTATÍSTICA POPULAÇÃO E AMOSTRA f Distribuição da população Distribuição das médias de amostras de mesmo tamanho extraídas da população x x 137
ESTATÍSTICA POPULAÇÃO E AMOSTRA A média calculada para uma amostra dificilmente será igual à média real da população; O tamanho da discrepância depende do tamanho da amostra e da variabilidade dos dados. Discrepância Inversamente proporcional a n Diretamente proporcional à variabilidade dos dados f Média a Média b x 138
ESTATÍSTICA ERRO PADRÃO DAS MÉDIAS f O desvio padrão da distribuição das médias é chamado ERRO PADRÃO DAS MÉDIAS (EPM) x x 139
ESTATÍSTICA ERRO PADRÃO DAS MÉDIAS CÁLCULO DO ERRO PADRÃO DAS MÉDIAS (EPM) f EPM = s x x / n Mede a dispersão das médias diferentes amostras de mesmo tamanho, extraídas da mesma população, em torno da média das médias, isto é, em torno da média verdadeira da população estudada. 140
ESTATÍSTICA CÁLCULO DO ERRO-PADRÃO A PARTIR DE UMA AMOSTRA COM 10 PESOS Pesos x-x (n=10) 20 Kg 23 Kg 24 Kg 36 Kg 37 Kg 38 Kg 39 Kg 43 Kg 45 Kg 55 Kg Total 20 -36 23 -36 24 -36 36 -36 37 -36 38 -36 39 -36 43 -36 45 -36 55 -36 -13 -12 0 1 2 3 7 9 19 (x - x)2 256 169 144 0 1 4 9 49 81 361 1074 Variância (s 2) = 1074 / (10 -1) = 119, 333 Kg 2 Desvio Padrão (s) = 119, 333 = 10, 924 Kg Erro Padrão (EPM) = 10, 924 / 10 = 3, 45 Kg 141
ESTATÍSTICA INTERVALO DE CONFIANÇA (Amostras Grandes) Mostra o intervalo em que se situa a média real da população; Comumente se adota um intervalo com 95% de confiança (z=1, 96); O tamanho da amostra deve ser razoavelmente grande (n>30). f Limite Inferior: IC(95%) = x - 1, 96. EPM Limite Superior: Média a Média b x IC(95%) = x + 1, 96. EPM 142
ESTATÍSTICA INTERVALO DE CONFIANÇA (Amostras Pequenas) Comumente se adota um intervalo com 95% de confiança; O valor de t (Distribuição t de Student) varia conforme o tamanho da amostra (gl = n-1) Possibilita o cálculo para amostras pequenas (n<30). f Limite Inferior: Distribuição t de Student IC(95%) = x - t. EPM Limite Superior: Média a Média b x IC(95%) = x + t. EPM 143
ESTATÍSTICA COMPARAÇÃO DE DISTRIBUIÇÕES Amostras Pequenas Amostras Grandes Valor de t é variável (t = 1, 96 a 12, 706) 95% de Confiança Valor de z é constante (z = 1, 96) 95% de Confiança f f Média a Média b Distribuição t de Student x Média a Média b x Distribuição Normal 144
ESTATÍSTICA INTERVALO DE CONFIANÇA INTERPRETAÇÃO: Se forem extraídas 100 amostras de mesmo tamanho da população, 95 delas estarão situadas dentro do intervalo e 5 não; Um intervalo de confiança muito grande sugere que a média da amostra encontrada é pouco representativa da média (verdadeira) da população; O erro padrão da média mostra o quão bem a média é conhecida, assim quanto menor for o EPM menor será o IC. 145
ESTATÍSTICA INTERVALO DE CONFIANÇA EXEMPLO: Em uma amostra de 300 estudantes do sexo masculino da faculdade Z, verificou-se que a média das alturas era de 1, 75 m. Sabendo que o desvio padrão da amostra era de 10 cm, determine o intervalo de confiança para a média das alturas desta população. EPM = s / n EPM = 10 / 300 IC(95%) = x - 1, 96. EPM = 175 - 1, 96. 0. 5773 = 173, 87 cm IC(95%) = x + 1, 96. EPM = 175 + 1, 96. 0, 5773 = 176, 13 cm EPM = 0, 5773 cm 1, 7387 m 1, 7613 m 146
ESTATÍSTICA COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA IC (95%) Faculdade Z 1, 7387 m 1, 7613 m x = 1, 75 m IC (95%) Faculdade X 1, 71 m 1, 75 m x = 1, 73 m Conclusão: As médias populacionais não devem ser consideradas diferentes. 147
ESTATÍSTICA COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA IC (95%) Faculdade Z 1, 7387 m 1, 7613 m x = 1, 75 m IC (95%) Faculdade Y 1, 726 m 1, 734 m x = 1, 73 m Conclusão: As médias populacionais PODEM ser consideradas diferentes. 148
ESTATÍSTICA EXERCÍCIOS 1) Quando se compara duas médias amostrais oriundas de populações distintas, pode-se dizer que as populações são diferentes quando as médias amostrais são diferentes? 149
ESTATÍSTICA 2) Uma empresa com sede em São José verificou que o prazo médio de entrega de um lote de produtos tinha em Florianópolis um tempo médio de 10 dias e desvio padrão de 1 dia. Outra amostra de produtos entregue em Biguaçu, apresentou como média 12 dias e desvio padrão de 2, 5 dias. Sabendo que a primeira amostra continha 70 produtos e a segunda 90 pergunta-se: Há diferença entre as duas populações com relação ao tempo necessário de entrega dos produtos? 150
Teste de Diferença entre as Médias Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA TEST T Serve para comparar as médias de dois grupos amostrais Duas hipóteses possíveis: H 0: ma - mb = zero As médias são iguais H 1: ma - mb ≠ zero As médias são diferentes 152
ESTATÍSTICA Testes de duas amostras As médias duas amostras são iguais? 153
ESTATÍSTICA Analisando duas amostras ≠ ≠ ? 154
ESTATÍSTICA Teste da diferença! H 0: ma-mb=zero H 1: ma-mb≠zero diferença = 0 Médias iguais 155
ESTATÍSTICA Teste da diferença! H 0: ma-mb=zero H 1: ma-mb≠zero diferença = 0 Médias iguais Cuidado!!! Antes do emprego do Teste T deve ser testada a homogeneidade das variâncias. 156
ESTATÍSTICA Roteiro do Teste da diferença entre médias 1) Testar a homogeneidade das variâncias: Quando p>0, 05 temos variâncias homogêneas Quando p<0, 05 temos variâncias diferentes 2) Se as variâncias forem homogêneas realizar o Teste T para homogeneidade das variâncias. 3) Se as variâncias forem diferentes realizar o Teste T para variâncias diferentes. 4) Quando o Teste T apresentar: p>0, 05 As médias são iguais p<0, 05 As médias são diferentes 157
ESTATÍSTICA Comparando as médias no Microsoft Excel 158
ESTATÍSTICA Comparando as médias no SPSS 159
ESTATÍSTICA Output do SPSS Como p>0, 05 as variâncias são semelhantes Como p<0, 05 as médias são diferentes p<0, 05: Diferentes! 160
Teste Qui-quadrado 2 Prof. Hubert Chamone Gesser, Dr. Retornar
ESTATÍSTICA TESTES DE ASSOCIAÇÃO São Testes de Hipóteses para dados nominais H 0 (Hipótese Nula): Não existe associação entre as variáveis estudadas H 1 (Hipótese Alternativa): existe associação entre as variáveis estudadas Respondem um problema: (1) A propaganda está associada ao desempenho das vendas? (2) Um método de treinamento está associado a produtividade? (3) O número de horas de trabalho está associado ao estresse? 162
ESTATÍSTICA TESTE DE ASSOCIAÇÃO QUI-QUADRADO É um teste não paramétrico. Símbolo: 2 É muito empregado em pesquisas sociais e de saúde. A interpretação dos resultados é mais favorável quando são baseados em tabelas de contingência 2 x 2 (1 grau de liberdade). Exemplo de uma tabela de contingência 2 x 2: Aumento nas vendas Redução nas vendas Com Propaganda 70 ( a ) 21 ( b ) Sem Propaganda 35 ( c ) 24 ( d ) 163
ESTATÍSTICA TESTE DE ASSOCIAÇÃO QUI-QUADRADO Cálculo do 2 em tabelas 2 x 2 com Correção de Continuidade. 2 = n. ( a. d - b. c - ( n / 2 ) )2 (a+b). (c+d). (a+c). (b+d) O valor de 2 encontrado é transferido para uma tabela que fornecerá o valor de p (probabilidade de significância). 164
ESTATÍSTICA Cálculo do exemplo: Propaganda x Desempenho das Vendas 2 = n. ( a. d - b. c - ( n / 2 ) )2 (a+b). (c+d). (a+c). (b+d) 2 = 150. ( 70. 24 - 21. 35 - ( 150 / 2 ) )2 ( 70 + 21 ). ( 35 + 24 ). ( 70 + 35 ). ( 21 + 24 ) 2 = 4, 475 p < 0, 05 Há associação entre as variáveis 165
ESTATÍSTICA TESTE DE ASSOCIAÇÃO QUI-QUADRADO Valores de p com 1 grau de liberdade (tabelas 2 x 2) p 2 0, 250 0, 100 0, 050 0, 025 0, 010 0, 005 0, 001 1, 32 2, 71 3, 84 5, 02 6, 63 7, 88 10, 8 Exemplos: Se for encontrado um valor de 2 = 6, 63 o valor de p será 0, 01 Se for encontrado um valor de 2 = 2, 54 então 0, 10 > p > 0, 05 166
ESTATÍSTICA INTERPRETAÇÃO Quando p > 0, 05 Aceita-se H 0 (Hipótese Nula) Não há associação Quando p < 0, 05 Aceita-se H 1 (Hipótese Alternativa) Há associação Observações: Comumente se adota 0, 05 como nível de significância O Teste Exato de Fisher substitui o 2 em amostras muito pequenas A associação não deve ser confundida com relação causal 167
ESTATÍSTICA EXERCÍCIOS 1) Uma pesquisa que tinha como objetivo verificar a existência de associação de algumas variáveis com o volume de vendas de um determinado produto encontrou os seguintes valores de 2 : 2 = 9, 88 para o índice de escolaridade 2 = 6, 22 para o renda familiar 2 = 1, 42 para o hábito de fumar Qual dessas 3 variáveis mostrou-se mais fortemente associada com o volume de vendas e qual é o valor do seu p (probabilidade de significância)? 168
ESTATÍSTICA 2) Uma organização está tentando descobrir se um novo programa de treinamento do pessoal de vendas está associado a uma maior satisfação de sua clientela. Observe a seguinte tabela de contingência e tente responder essa dúvida. Clientes satisf Clientes Insatisf Treinamento Novo Treinamento Clássico 41 103 37 106 169
Fonte Bibliográfica § BARBETA, P. A. Estatística Aplicada às Ciências Sociais. 5. ed. Florianópolis: UFSC, 2006. § BRUNI, A. L. Estatística Aplicada à Gestão Empresarial. 1. ed. São Paulo; Atlas, 2010. § BRUNI, A. L. Excel Aplicado à Gestão Empresarial. 1. ed. São Paulo; Atlas, 2010. § CRESPO, A. A. Estatística Fácil. 19. ed. São Paulo; Saraiva, 2009. § LEVIN, J. Estatística Aplicada às Ciências Humanas. 7. ed. São Paulo: Harbra, 2007. § SPIEGEL, M. R. Estatística. 8. ed. São Paulo: Makron Books, 2006. § STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Harbra, 2007.
The Wrap-up A little knowledge of statistic helps you understand a lot about the information which is presented to you. Retornar
- Slides: 171