Estatstica amintas paiva afonso Introduo Quando trabalhamos com
Estatística amintas paiva afonso
Introdução Quando trabalhamos com grandes conjuntos de dados, muitas vezes é útil organizar e resumir os dados para fornecer informações úteis e facilitar a sua visualização e seu entendimento DISTRIBUIÇÕES DE FREQÜÊNCIA (EM CLASSE)
Distribuições de frequências (em classe) Frequência de revendedores É um grupamento de dados em classes, exibindo o número ou porcentagem de observações em cada classe. Uma distribuição pode ser apresentada em forma gráfica ou tabular. Histograma do número de carros vendido para as revendedoras 12 10 8 6 4 2 5 10 15 20 25 30 35 40 Número de carros
Tabelas de Frequência “Resumo de dados em Tabelas de frequência” O número de elementos distintos é grande, o que dificulta a análise. Exemplo: Análise da altura da turma. A finalidade é agrupar dados!
Passos para a construção de uma Tabela de Frequência Um engenheiro da área de vendas de uma montadora selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo Brasil e anotou o número de unidades adquiridas por estes revendedores no mês de maio. Com estes dados, ele deseja construir um quadro de frequência. 1º PASSO: Identifique o valor máximo e o valor mínimo para calcular a amplitude. R(intervalo total) = Max - Min = 39 - 6 = 33
Passos para a construção de uma Tabela de Frequência 2º PASSO: Escolha do número de classes ou intervalos (k). - não existe uma regra única para a determinação do tamanho e quantidade de classes. Alguns autores afirmam que ela deve variar entre 5 e 25. - Adotaremos o seguinte cálculo: Importante: o valor de k deve ser um valor inteiro. Assim, neste caso pode ser: 6 ou 7. 3º PASSO: Determinação da amplitude do intervalo (h) Obs. : Como os dados coletados são números inteiros, a amplitude também deve ser um número inteiro.
Passos para a construção de uma Tabela de Frequência Assim, o valor da amplitude (R) deve ser acrescido de duas unidades para que sua divisão pelo número de classes (k =7) seja um número inteiro. 4º PASSO: Rever os limites de classe preliminares. Aqui, o arredondamento deve ser distribuído igualmente para o limite inferior da primeira classe e o limite superior para a última classe. 5º PASSO: Montagem da tabela de frequência 10 10 |----- 15 15 |----- 20 20 |-----25 25 |-----30 30 |-----35 35 3 3 11 11 6 4 2 40 7, 5% 27, 5% 15% 10% 5% 100%
Distribuições de Frequência 1 - Dados brutos 10 15 21 14 20 13 18 19 17 23 19 17 14 15 16 19 12 18 11 16 24 18 17 22 2 - Fixar intervalos de classe 1 - intervalo total= máx-min 2 - k » n 5 £ k £ 25 3 - Amplitude = int ervalo total k 4 - Fazer uma tabela de 3 Proceder a contagem 10 a 13 - /// 13 a 16 - //// 16 a 19 - //// 19 a 22 - //// 22 a 25 - /// 5 - traçar um histograma freqüência nº % ou 10 a 13 13 a 16 16 a 19 19 a 22 22 a 25 3 5 8 5 3 12, 5 20, 8 33, 4 20, 8 12, 5 Freqüência classes
Tabela de Frequência - Exercício: Montar uma tabela de frequência para o peso dos homens da turma de estatística. 1º PASSO: Encontrar o valor máximo e o valor mínimo para calcular a amplitude. R = Max - Min = 90 - 58 = 32
Tabela de Frequência - Exercício 2º PASSO: Escolha do número de classes ou intervalos (k). Lembrando que: k deve ter um valor inteiro, este pode ser: 5 ou 6. 3º PASSO: Determinação da amplitude do intervalo (h) Como os dados são números inteiros valor de h deve ser um valor inteiro. Iremos admitir k = 6 e somaremos 4 unidades na amplitude. 4º PASSO: Rever os limites de classe preliminares. Aqui, o arredondamento deve ser distribuído igualmente para o limite inferior da primeira classe (58 56) e para o limite superior da última classe (90 92).
Tabela de Frequência - Exercício 5º PASSO: Montagem da tabela de frequência: Obs. : Atenção para o cálculo da frequência.
Calculando a média pela Tabela de Frequência Um engenheiro de produção que atuava numa empresa de manutenção de motores de aviões, observou nos registros da empresa, que o tempo de mão-de-obra gastos na revisão completa de um motor apresentava-se na seguinte tabela de frequência: Para planejar o orçamento e a data de entrega de 5 motores, ele deseja saber o número médio de horas de mão-de-obra necessário para a revisão de cada motor.
Calculando a média pela Tabela de Frequência 1º PASSO: Calcular o ponto médio de cada classe: 2 6 10 14 18 2º PASSO: Realizar o somatório da multiplicação de cada ponto médio pela frequência: 2 6 10 14 2 X 1 =2 6 X 5 =30 10 X 10 =100 14 X 12 =168 18 18 x 4=72
Calculando a média pela Tabela de Frequência 3º PASSO: Realizar o cálculo final do valor médio pela fórmula: Interpretação do resultado: sabendo que o tempo médio de mão-de-obra para a manutenção de cada motor é 11, 625 horas, o engenheiro pode realizar os cálculos do orçamento e do prazo de entrega do serviço. Exercício: Uma empresa fez um levantamento da venda de seu produto em vários supermercados da região sudeste obtendo em determinado mês a tabela: Determine o consumo médio do produto por supermercado pesquisado. R: 3. 342, 1 unidades por supermercado
Conclusões sobre as Tabelas de Frequência • As tabelas de frequência serão bem utilizadas quando tivermos uma grande quantidade de dados, bastante distintos. Ex. : Diferentes medidas de eixos num lote de fabricação. • Pelas tabelas de frequência também é possível calcular as medidas de tendência central e medidas de dispersão. • As tabelas de frequência têm a função de condensar um conjunto de dados e servem como base para a construção de histogramas.
Formas gráficas de apresentação de dados 1 - HISTOGRAMA - equivalente de uma tabela de frequência - Gráfico que possui na sua escala horizontal os valores de dados a serem apresentados e na escala vertical, as suas freqüências; - Utilizado para dados contínuos; Construindo histogramas a partir de uma tabela de frequência 1º Passo: Construímos os eixos da frequência e intervalos de classe. Obs. : atenção para as escalas.
Formas gráficas de apresentação de dados Histograma das notas de estatística Frequência 17 2º Passo: Dispomos os valores da frequência de cada classe no gráfico. 10 8 6 4 2 0 2 4 6 8 10 Notas 3º Passo: Dá-se um nome para o histograma
Formas gráficas de apresentação de dados Exercício: Monte o histograma para a tabela de frequência abaixo. Frequência de revendedores 10 3 7, 5% 10 |----- 15 15 |----- 20 20 |-----25 3 11 11 7, 5% 27, 5% 25 |-----30 30 |-----35 35 6 4 2 15% 10% 5% 40 100% 12 10 8 6 4 Histograma do número de carros vendido para as revendedoras 2 5 10 15 20 25 30 35 40 Número de carros
Formas gráficas de apresentação de dados MEDIDAS DA DISTRIBUIÇÃO DE FREQÜÊNCIA freqüência Moda - MO classe modal Determinação da moda num gráfico
Formas gráficas de apresentação de dados polígono de freqüência Alternativa ao histograma É um gráfico que se obtém unindo por uma poligonal os pontos correspondentes às frequências diversas classes, centradas nos respectivos pontos médios. Para obter as interseções do polígono com o eixo, cria-se em cada extremo do histograma uma classe com frequência nula. freqüência 0, 30 0, 20 0, 10 0, 00 3 8 13 18 23 28 33 POLÍGONO DE FREQÜÊNCIA classes
Formas gráficas de apresentação de dados MEDIDAS DA DISTRIBUIÇÃO DE FREQÜÊNCIA Distribuição bimodal classes modais Moda - MO classes modais Às vezes há dois ou mais picos de freqüência. Os dados provêm de duas ou mais populações.
Formas gráficas de apresentação de dados 2 – DIAGRAMA DE PONTOS ü Este diagrama é muito útil para apresentar um pequeno conjunto de dados (até aproximadamente 20 dados) ü Este gráfico nos permite rapidamente e facilmente ver a localização ou a tendência central nos dados e a variabilidade üO conjunto de dados relativos à resistência de uma argamassa modificada em uma indústria de cimento: 16, 85 ; 16, 4 ; 17, 21 ; 16, 35 ; 16, 52 ; 17, 04 ; 16, 96 ; 17, 15 ; 16, 59 e 16, 57. argamassa modificada 16, 0 16, 5 17, 0 17, 5 18, 0 resistência – kgf/cm 2 üVeja que o meio dos dados (mediana) é muito próximo de 16, 8 e que os valores de resistência caem no intervalo de 16, 3 a 17, 2 kgf/cm 2
Formas gráficas de apresentação de dados 2 – DIAGRAMA DE PONTOS üÉ utilizado freqüentemente para comparar dois ou mais conjuntos de dados üConsidere o segundo conjunto de dados de resistência de argamassa: 17, 50 ; 17, 63 ; 18, 25 ; 18, 00 ; 17, 86 ; 17, 75 ; 18, 22 ; 17, 90 ; 17, 96 e 18, 15. 16, 0 16, 5 17, 0 17, 5 18, 0 18, 5 resistência – kgf/cm 2 argamassa modificada argamassa não modificada üImediatamente verifica-se que a argamassa modificada apresenta resultados com valores menores de resistência üA variabilidade dentro (within) dos grupos é praticamente a mesma üTambém é possível ver a freqüência dos dados
Formas gráficas apresentação de dados 3 – DIAGRAMA DE RAMOS E FOLHAS üA tabela de freqüência e o histograma nos dá informações valiosas sobre a natureza da distribuição dos dados, mas geralmente perdemos informações sobre os mesmos üO diagrama de ramos e folhas é uma boa maneira de ter uma informação da natureza da distribuição do conjunto de dados sem perda de informação üOs dados devem conter pelo menos dois dígitos üExemplo: O dado 257 é dividido em duas partes: a primeira parte 25 chamada de ramo (stem) é constituída pelo primeiro ou primeiro e segundo dígitos e a segunda parte 7 chamada de folha (leaf) é constituído pelo dígito restante. üÉ usual escolher o número de ramos entre 5 a 20
Formas gráficas apresentação de dados Considere o conjunto de dados relativos à resistência a compressão de uma liga de alumínio 105 221 183 186 121 180 143 97 154 153 174 120 168 167 141 245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133 207 180 193 194 133 156 123 134 178 76 167 184 135 229 146 218 157 101 171 165 172 ramos 7 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 folhas 6 7 15 05 103 13345 136 3446788 037788 124468 0011346 0349 87 8 189 5 freqüência 1 1 2 2 3 5 3 7 6 5 7 4 2 1 3 0 1
Formas gráficas de apresentação de dados 4 - GRÁFICO DE BARRAS / COLUNAS • Tipo de gráfico mais utilizado quando os dados consistem em uma contagem e não em mensurações em uma escala contínua; • São mais usados para mostrar diferenças entre categorias, regiões e etc. Os gráficos de barra também podem mostrar de que forma duas variáveis se relacionam;
Formas gráficas de apresentação de dados 4. 1 - DIAGRAMA OU GRÁFICO DE PARETO • É um gráfico de barras para dados qualitativos, com as barras ordenadas de 100 80 60 50 40 20 Percentagem Acumulada Quantidade de defeitos acordo com a frequência. A barra mais alta fica à esquerda e as barras menores na extrema direita. Gráfico de Pareto para os defeitos de lentes 100
Formas gráficas de apresentação de dados 5 - GRÁFICO DE SETORES / TORTA OU PIZZA. • É uma outra alternativa para o gráfico de barras, quando se pretende mostrar a composição de um total; • O gráfico é construído dividindo os 360º graus de um círculo pela contribuição relativa de cada categoria; Fonte: Site da Abinee - 2003.
Conclusões Uma imagem vale mais do que mil palavras! Entretanto, ao se construir qualquer tipo de gráfico, é importante: 1) que o gráfico receba um título adequado; 2) que cada um dos eixos seja rotulado e contenha uma escala sensata; • Histogramas são utilizados para identificar o padrão de variação ao longo de um tempo ou ao longo de um fluxo;
Exercício Resolvido O conjunto de dados abaixo, embora pequeno, não permite uma visão global da safra de pêssegos). A distribuição de freqüência facilitará a visualização e entendimento. Fazer a tabela de freqüência e o histograma para o conjunto de dados abaixo, onde estão relacionados os dados da safra de 40 pessegueiros. Safra anual de 40 pessegueiros 11, 1 12, 5 32, 4 7, 8 21, 0 16, 4 11, 2 22, 3 4, 4 6, 1 27, 5 32, 8 18, 5 16, 4 15, 1 6, 0 10, 7 15, 8 25, 0 18, 2 12, 6 4, 7 23, 5 14, 8 22, 6 16, 0 19, 1 7, 4 9, 2 10, 0 26, 2 3, 5 14, 5 3, 2 8, 1 12, 9 19, 1 13, 7 16, 2
Exercício Resolvido Etapas para construção 1 - Determinar o intervalo total dos dados; 2 - Determinar o número K de classes; 3 - Calcular a amplitude da classe; 4 - Estabelecer limites de classes preliminares. Rever os limites, que devem tocar-se mas não intercepta-se; 5 - Relacionar os intervalos e fazer a contagem dos pontos por classe (a contagem total dever ser igual a n); 6 - Construir uma tabela de freqüências e um histograma de freqüências ou um polígono de freqüências.
Exercício Resolvido 1 - Determinar o intervalo dos dados Maior safra é 32, 8 e a menor é 3, 2 32, 8 – 3, 2 = intervalo é 29, 6 2 - Determinar o número K de classes ü É aconselhável tomar entre 5 a 25 classes üRegra prática: K = n Ajustá-la se for necessário üNo caso dos pessegueiros n = 40, logo 40 = 6, 32 que pode ser arredondado para 6 ou 7 adotar k = 6
Exercício Resolvido 3 - Calcular a amplitude da classe Amplitude = intervalo / nº de classes (k) Amplitude = 29, 6 / 6 = 30/6 = 5 Amplitude = 5 6 * 5 = 30 30 > 29, 6 - ok üCertifique-se que k vezes a amplitude é maior que o intervalo, pois, de outra forma, os valores extremos não serão incluídos; üHouve a necessidade de acrescentar 0, 4 ao intervalo para que o valor desse um número inteiro. Esse valor deve ser distribuído para os limites inferiores (- 0, 2) e superiores (+ 0, 2).
Exercício Resolvido 4 - Estabelecer limites de classes preliminares. Rever os limites, que devem tocar-se mas não interceptar-se Começando com o primeiro inteiro logo abaixo do menor valor do conjunto de dados. 1ª classe ------ limite inferior 3 limite superior = 3 + 5 = 8 2ª classe ------ limite inferior 8 limite superior = 8 + 5 = 13 3ª classe ------ limite inferior 13 limite superior = 13 + 5 = 18 4ª classe ------ limite inferior 18 limite superior = 18 + 5 = 23 5ª classe ------ limite inferior 23 limite superior = 23 + 5 = 28 6ª classe ------ limite inferior 28 limite superior = 28 + 5 = 33
Exercício Resolvido Comentários adicionais üÉ importante que não ocorra lacunas na fixação das classes (deve haver uma classe para cada valor) üA amplitude é igual para todas as classes üAs classes não devem interceptar-se (um valor deve pertencer a só uma classe Considerar os intervalos como: 3 a<8 ou 3 13 a < 18 ou 13 23 a < 28 ou 23 8 13 18 18 a < 23 ou 18 23 28 28 a < 33 ou 28 33 8 8 a < 13 ou
Exercício Resolvido DISTRIBUIÇÕES DE FREQÜÊNCIA 32, 8 3, 2 min max Intervalo = 29, 6 conjunto de dados ordenados K classes de dados 5 intervalo de classe ou amplitude de classe 6*5 = 30 A diferença entre 29, 6 e 30 = 0, 4 deve ser distribuída entre a extremidades K=6 3, 0 8, 0 13, 0 18, 0 23, 0 28, 0 33, 0
Exercício Resolvido 5 – Relacionar os intervalos e fazer a contagem dos pontos por classe (a contagem total deve ser igual a n) classe contagem 8 //// freqüência 3 a 8 a 13 //// 10 13 a 18 //// 9 18 a 23 //// // 7 23 a 28 //// 4 28 a 33 // 2 8 Total n = 40
Exercício Resolvido 6 – Construir uma tabela de freqüência ou histograma de freqüência Tabela de freqüência 3 a <8 8 a < 13 13 a < 18 8 Percentagem de árvores 8/40 = 0, 200 10 10/40 = 0, 250 9 9/40 = 0, 225 18 a < 23 7 7/40 = 0, 175 23 a < 28 4 4/40 = 0, 100 22 a < 33 2 2/40 = 0, 050 Número de alqueires totais Número de árvores n = 40 1, 000
Percentagem de árvores freqüência Exercício Resolvido Histograma 0, 30 0, 20 0, 10 0, 00 3 8 13 18 23 28 33 classes safras üDistribuição de freqüência relativa (%) para a safra de pêssego. üPoderia ser freqüência absoluta (nº de árvores).
Exercício Resolvido polígono de freqüência Alternativa ao histograma freqüência relativa ou absoluta 0, 30 0, 20 0, 10 0, 00 3 8 13 18 23 28 33 classes POLÍGONO DE FREQÜÊNCIA üDeve-se apenas unir os pontos médios das classes do histograma por segmentos de reta
www. matematiques. com. br amintas paiva afonso
- Slides: 41