Calculo do Tamanho da Amostra Sugesto de Leitura

  • Slides: 72
Download presentation
Calculo do Tamanho da Amostra

Calculo do Tamanho da Amostra

Sugestão de Leitura �Princípios da Pesquisa de Marketing. William G. Zikmund. São Paulo. CENGAGE

Sugestão de Leitura �Princípios da Pesquisa de Marketing. William G. Zikmund. São Paulo. CENGAGE Learning. 2005.

Introdução �A finalidade do Survey por amostragem é selecionar um conjunto de elementos de

Introdução �A finalidade do Survey por amostragem é selecionar um conjunto de elementos de uma população de tal forma que as descrições destes elementos descrevem com precisão a população total da qual foram extraídos.

Introdução �Seleção aleatória é a chave deste processo. Num processo aleatório cada elemento tem

Introdução �Seleção aleatória é a chave deste processo. Num processo aleatório cada elemento tem chance igual de seleção independente de qualquer outro evento do processo de seleção.

Introdução �A título de exemplo, suponha queremos estudar a população estudantil de uma universidade

Introdução �A título de exemplo, suponha queremos estudar a população estudantil de uma universidade para medir a aprovação ou não do novo formato da prova global.

Exemplo �Objetivo: Verificar a aprovação do novo formato de prova global. �População: Todos os

Exemplo �Objetivo: Verificar a aprovação do novo formato de prova global. �População: Todos os alunos da Fapcom �Amostra: alguns alunos da Fapcom �Moldura de Amostragem: lista com todos os alunos

Exemplo �Perguntamos dentre 100 alunos selecionados quantos aprovam o novo formato: 48 disseram que

Exemplo �Perguntamos dentre 100 alunos selecionados quantos aprovam o novo formato: 48 disseram que aprovam, 52 que rejeitam. 0 50 100

Exemplo �Selecionamos outra amostra de 100 alunos da mesma forma e fizemos a mesma

Exemplo �Selecionamos outra amostra de 100 alunos da mesma forma e fizemos a mesma pergunta. Obtendo 51 de aprovação e 49 de rejeição. Amostra 1 - 48% 0 Amostra 2 - 51% 50 100

Exemplo �Repetindo o procedimento novamente, obtemos 52 alunos que aprovam. Amostra 1 - 48%

Exemplo �Repetindo o procedimento novamente, obtemos 52 alunos que aprovam. Amostra 1 - 48% Amostra 2 - 51% Amostra 3 - 52% 0 50 100

Exemplo �Em nossa experiência cada amostra produziu um resultado diferente. Continuaremos a extrair amostras

Exemplo �Em nossa experiência cada amostra produziu um resultado diferente. Continuaremos a extrair amostras e a marcá-las. Ao fazer isto vamos descobrir que algumas novas amostras repetem estimativas de amostras anteriores.

Exemplo �Ao aumentar o número de amostras selecionadas, aumentamos o número de estimativas. A

Exemplo �Ao aumentar o número de amostras selecionadas, aumentamos o número de estimativas. A maioria dos resultados estará próxima aos 50%. Através de cálculos matemáticos podemos determinar o quão próximos estamos do valor real.

Exemplo 80 60 40 20 0 50 100

Exemplo 80 60 40 20 0 50 100

Teoria da Probabilidade �A distribuição das estatísticas amostrais mostrada na figura anterior é chamada

Teoria da Probabilidade �A distribuição das estatísticas amostrais mostrada na figura anterior é chamada de distribuição amostral. A aumentar o número de amostras selecionadas e entrevistas, também aumentamos a extensão das estimativas fornecidas pela operação de amostragem.

Teoria da Probabilidade �A teoria da probabilidade oferece certas regras importantes relativas a distribuição

Teoria da Probabilidade �A teoria da probabilidade oferece certas regras importantes relativas a distribuição amostral. �Se muitas amostras aleatórias independentes são extraídas de uma população, as estatísticas amostrais fornecidas por estas amostras estarão distribuídas em torno do parâmetro populacional de uma forma conhecida. (A maioria próxima dos 50%)

Teoria da Probabilidade �A teoria da probabilidade nos dá uma formula para estimar o

Teoria da Probabilidade �A teoria da probabilidade nos dá uma formula para estimar o quão próximo as estatísticas da amostragem estão aglomeradas em torno do valor real. Esta fórmula contem três fatores: o parâmetro, o tamanho da amostra e o erro padrão.

Determinando o Tamanho da Amostra �Determinar o tamanho de uma amostra não é tarefa

Determinando o Tamanho da Amostra �Determinar o tamanho de uma amostra não é tarefa simples. O pesquisador precisa considerar o nível de precisão das estimativas e quanto tempo e dinheiro estão disponíveis para coletar os dados necessários.

Determinando o Tamanho da Amostra �A coleta costuma ser um dos componentes mais caros

Determinando o Tamanho da Amostra �A coleta costuma ser um dos componentes mais caros de qualquer estudo. A determinação de uma amostra difere para plano probabilísticos e não probabilísticos.

Fatores Cruciais �Três fatores são cruciais para a determinação do tamanho da amostra em

Fatores Cruciais �Três fatores são cruciais para a determinação do tamanho da amostra em concepções probabilísticas. �A variabilidade (ou variância) da característica populacional sendo investigada. Quanto maior a variabilidade, maior a amostra necessária.

Exemplo �Prever a média de idade de estudantes universitários exige uma amostra menor do

Exemplo �Prever a média de idade de estudantes universitários exige uma amostra menor do que prever a média de idade das pessoas que visitam o zoológico em uma tarde de domingo. Conforme a heterogeneidade aumenta o tamanho da amostra também precisa aumentar.

Fatores Cruciais �O nível de confiança desejado para a estimativa. Quanto maior o nível

Fatores Cruciais �O nível de confiança desejado para a estimativa. Quanto maior o nível de confiança desejado, maior o tamanho da amostra.

Fatores Cruciais �O grau de precisão desejado na estimativa da característica populacional. Quanto maior

Fatores Cruciais �O grau de precisão desejado na estimativa da característica populacional. Quanto maior a precisão desejada, ou seja quanto menor o erro desejado, maior a amostra necessária.

Exemplo �O grau de erro aceitavel dependerá da decisão a ser tomada com base

Exemplo �O grau de erro aceitavel dependerá da decisão a ser tomada com base na pesquisa. Exemplo, se num teste de produto resultados favoráveis resultarão na construção de uma nova fábrica e desfavoráveis que não se produza o produto a faixa de erro aceitável será pequena (o custo do erro seria muito grande para dar espaço a erros de amostragem). Por outro lado uma pesquisa de renda familiar pode ser menos precisa. Permitir um erro de R$ 1000, 00 na renda familiar total em vez de R$ 50, 00 pode ser aceitável.

Fórmulas �Existem fórmulas diferentes para a determinação do tamanho da amostra com base na

Fórmulas �Existem fórmulas diferentes para a determinação do tamanho da amostra com base na média populacional prevista e na proporção da população. Tais formulas são usadas para amostras aleatórias simples.

Fórmulas �Quando tratamos de estimativa de médias populacionais a fórmula para calculo do tamanho

Fórmulas �Quando tratamos de estimativa de médias populacionais a fórmula para calculo do tamanho da amostra é: �Z = Nível de Confiança (valor padrão) �σ = estimativa do desvio padrão da população com base em alguma informação anterior �e = Nível de tolerância de erro

Fórmulas �Em situações em que estimativas da proporção da população estão em pauta a

Fórmulas �Em situações em que estimativas da proporção da população estão em pauta a fórmula muda. �Z = Nível de Confiança (valor padrão) �P = estimativa da porção esperada da população que possui a característica desejada com base em intuição ou informação anterior �Q = estimativa da população que não terá a características �e = Nível de tolerância de erro

Atenção �Quando o tamanho de uma população alvo definida em estudo é menor do

Atenção �Quando o tamanho de uma população alvo definida em estudo é menor do que 500 elementos, considerar a possibilidade de realizar um censo ao invés de usar amostras.

Atenção �A lógica aqui baseia-se na noção de seriam necessários 384 unidades amostrais para

Atenção �A lógica aqui baseia-se na noção de seriam necessários 384 unidades amostrais para produzir um resultado de 95% de confiança e erro de 5%.

Tamanho �Em alguns casos, mesmos populações com menos de 500 elementos podem ser difíceis

Tamanho �Em alguns casos, mesmos populações com menos de 500 elementos podem ser difíceis de serem acessadas. Neste caso é aceitável que se chegue a 30% dos respondentes.

Tamanho As formulas de tamanho não podem ser usadas para amostras não probabilísticas. Em

Tamanho As formulas de tamanho não podem ser usadas para amostras não probabilísticas. Em geral o tamanho destas amostras seguem uma avaliação subjetiva e intuitiva do pesquisador.

Curva normal �Uma das distribuições mais úteis em Estatística é a distribuição normal, também

Curva normal �Uma das distribuições mais úteis em Estatística é a distribuição normal, também conhecida como curva normal. Essa distribuição teórica e matemática descreve a distribuição esperada das médias da amostra e de muitas outras ocorrências ao acaso.

Curva Normal �A curva normal tem forma de sino e todos os seus valores

Curva Normal �A curva normal tem forma de sino e todos os seus valores (99%) estão entre mais ou menos 3 desvios padrões de sua média.

Teorema do Limite Central �Matematicamente falando o Teorema do Limite Central afirma que conforme

Teorema do Limite Central �Matematicamente falando o Teorema do Limite Central afirma que conforme o tamanho da amostra aumenta, a distribuição média de uma amostra aleatória tomada de praticamente qualquer população se aproxima de uma distribuição normal.

Calculo da Amostra �Para o calculo da amostra assumimos o conceito estatístico de que

Calculo da Amostra �Para o calculo da amostra assumimos o conceito estatístico de que as populações e suas amostras, tem uma distribuição normal de freqüência, sendo suas principais características simetria de freqüências, presença de medidas de tendência central no mesmo ponto e desvios padrão significativos.

Calculo da Amostra �Em pesquisa o número de desvios utilizados representará a margem de

Calculo da Amostra �Em pesquisa o número de desvios utilizados representará a margem de segurança dada ao cálculo da amostra, influindo diretamente na sua amplitude, pois quanto maior a margem de segurança, ou intervalo de confiança, maior será a amostra.

Calculo da Amostra �Se afirmamos que nosso cálculo amostral foi realizado com uma margem

Calculo da Amostra �Se afirmamos que nosso cálculo amostral foi realizado com uma margem de segurança de 95%, isso significa que foi utilizado um desvio padrão de 1, 96. �Em pesquisa utilizamos as seguintes margens de segurança 68 = Z = 1 95% = Z = 1, 96 95, 5% = Z = 2 99, 7% = Z = 3

Calculo da Amostra �Além do conceito de normalidade e desvio padrão, utilizamos o conceito

Calculo da Amostra �Além do conceito de normalidade e desvio padrão, utilizamos o conceito de erro amostral, que representará no cálculo amostral, qual a proporção dos elementos da amostra que estará fora dos valores previstos.

Você já está assim?

Você já está assim?

Calculo Amostral Segundo Nível

Calculo Amostral Segundo Nível

Estatística �A determinação do tamanho de amostra apropriada é crucial para a pesquisa de

Estatística �A determinação do tamanho de amostra apropriada é crucial para a pesquisa de survey. Para identificá-lo formalmente, é necessário conhecer a teoria estatística.

Estatística �Infelizmente estatística não tem uma boa imagem junto aos estudantes. Grande parte desta

Estatística �Infelizmente estatística não tem uma boa imagem junto aos estudantes. Grande parte desta rejeição está ligada a falta de domínio da linguagem utilizada.

Estatística Descritiva �Pode ser considerada a ciência do aprendizado a partir de dados. �Estatística

Estatística Descritiva �Pode ser considerada a ciência do aprendizado a partir de dados. �Estatística descritiva: visa descrever o real de forma a entende-lo melhor. Recolhimento, organização e tratamento de dados de forma a compreender ou interpretar a realidade.

Estatística Inferencial �Estatística Inferencial. A partir de uma amostra da população permite inferir resultados

Estatística Inferencial �Estatística Inferencial. A partir de uma amostra da população permite inferir resultados a toda a população. A base para tal ação é o calculo das probabilidades.

Exemplificando �Suponha que fizemos um levantamento por telefone sobre o valor da poupança dos

Exemplificando �Suponha que fizemos um levantamento por telefone sobre o valor da poupança dos estudantes. Registramos grande número de questionários. Para que possamos utilizar esta informação os dados precisam estar organizados e resumidos.

Distribuição de Freqüência �Montar uma tabela de freqüência é um dos meios mais comuns

Distribuição de Freqüência �Montar uma tabela de freqüência é um dos meios mais comuns de resumir um conjunto de dados. O processo começa pelo registro do número de vezes que determinado valor ocorre para uma variável.

Valor Freqüência (numero de pessoas que possui depósito para cada faixa) Abaixo de R$

Valor Freqüência (numero de pessoas que possui depósito para cada faixa) Abaixo de R$ 300 499 R$ 300 a R$ 499, 00 530 R$ 500 a R$ 999, 00 562 R$ 1000, 00 a R$ 1500, 00 718 Acima de R$ 1500, 00 811 Total 3120

Distribuição de freqüência relativa �Montar uma distribuição de também é simples. A freqüência de

Distribuição de freqüência relativa �Montar uma distribuição de também é simples. A freqüência de cada valor da tabela anterior foi dividida pelo numero total de observadores e o resultado multiplicado por 100.

Valor Percentual (Porcentagem de pessoas que Mantêm Depósitos) Abaixo de R$ 300 16 R$

Valor Percentual (Porcentagem de pessoas que Mantêm Depósitos) Abaixo de R$ 300 16 R$ 300 a R$ 499, 00 17 R$ 500 a R$ 999, 00 18 R$ 1000, 00 a R$ 1500, 00 23 Acima de R$ 1500, 00 26 Total 100

Probabilidade �É a freqüência relativa de longo prazo com a qual um evento ocorrerá.

Probabilidade �É a freqüência relativa de longo prazo com a qual um evento ocorrerá. A estatística inferencial usa o conceito de uma distribuição de probabilidade que é igual ao de distribuição de freqüência (só que com os dados convertidos em probabilidade).

Valor Probabilidade Abaixo de R$ 300 0, 16 R$ 300 a R$ 499, 00

Valor Probabilidade Abaixo de R$ 300 0, 16 R$ 300 a R$ 499, 00 0, 17 R$ 500 a R$ 999, 00 0, 18 R$ 1000, 00 a R$ 1500, 00 0, 23 Acima de R$ 1500, 00 0, 26 Total 100

Proporção �Percentual dos elementos da população que atendem a algum critério. Pode ser expressa

Proporção �Percentual dos elementos da população que atendem a algum critério. Pode ser expressa em porcentagem, fração ou valor decimal.

Medidas de tendência central

Medidas de tendência central

Média �Todos já fomos expostos à proporção conhecida como Média. Trata-se simplesmente da média

Média �Todos já fomos expostos à proporção conhecida como Média. Trata-se simplesmente da média aritmética, que é um medida de tendência central.

Valor final Somatória Valor Inicial X 1 + X 2 + X 3 +

Valor final Somatória Valor Inicial X 1 + X 2 + X 3 + X 4 + X 5 + X 6 + X 7 + X 8 +. . . + Xn

Vendedor Zé Patrícia Marcos Numero de Vendas 4 3 2 Caio Johnny Francisco Maria

Vendedor Zé Patrícia Marcos Numero de Vendas 4 3 2 Caio Johnny Francisco Maria Samanta Total 5 3 3 1 5 26

Índice Vendedor Variável 1 2 Zé Patricia X 1 X 2 3 4 5

Índice Vendedor Variável 1 2 Zé Patricia X 1 X 2 3 4 5 6 7 8 Marcos Caio Jhonny Francisco Maria Samanta Total X 3 X 4 X 5 X 6 X 7 X 8 Numero de Vendas 4 3 2 5 3 3 1 5 26

Média aritmética

Média aritmética

Mediana �Ponto central da distribuição, ou o 50° percentil. Em outras palavras, o valor

Mediana �Ponto central da distribuição, ou o 50° percentil. Em outras palavras, o valor abaixo da qual estão metade dos valores na amostra.

Moda �Moda é a medida de tendência central que identifica o valor que ocorre

Moda �Moda é a medida de tendência central que identifica o valor que ocorre com mais freqüência. Em nosso exemplo Patrícia, Johnny e Francisco fazem três vendas por dia.

Atenção �Executivo da empresa X declara que a média para a seus funcionários é

Atenção �Executivo da empresa X declara que a média para a seus funcionários é alta demais. O valor venal pouco me diz. Se o valor médio é uma mediana posso não descobrir algo muito significativo.

Número de Pessoas Cargo Salário 1 Proprietário R$ 45. 000 1 Presidente R$ 15.

Número de Pessoas Cargo Salário 1 Proprietário R$ 45. 000 1 Presidente R$ 15. 000 2 Vice Presidente R$ 10. 000 1 Controladoria R$ 5. 700 3 Diretores R$ 5. 000 4 Gerentes R$3. 700 1 Supervisor R$ 3. 000 Mediana (12 acima, 12 abaixo) 12 Trabalhador R$ 2. 000 Moda (ocorre com maior freqüência) Média (aritmética)

Medidas de dispersão �Média, mediana e moda resumem a tendência central da distribuição de

Medidas de dispersão �Média, mediana e moda resumem a tendência central da distribuição de freqüências. Conhecer a tendência das observações a partir da tendência central também e importante. Calcular a dispersão dos dados, ou como as observações variam em relação a média é outra forma de resumir os dados.

Medidas de Dispersão �Na tabela a seguir mostramos o padrão de vendas de dois

Medidas de Dispersão �Na tabela a seguir mostramos o padrão de vendas de dois produtos ao longo do ano. Ambos possuem volumes médios mensal de vendas de 200 unidades, mas a dispersão das observações para o produto B é muito maior do que para o A.

Produto A Produto B Janeiro 196 150 Fevereiro 198 160 Março 199 176 Abril

Produto A Produto B Janeiro 196 150 Fevereiro 198 160 Março 199 176 Abril 200 181 Maio 200 192 Junho 200 Julho 200 201 Agosto 201 Setembro 201 213 Outubro 201 224 Novembro 202 240 Dezembro 202 261

Pontuação de desvio �Método para calcular a distância de uma observação em relação a

Pontuação de desvio �Método para calcular a distância de uma observação em relação a média pelo cálculo das pontuações de desvios individuais. �No exemplo anterior temos 150 unidades do produto B em Janeiro a pontuação de desvio e – 50. (150 – 200 = -50)

Desvio Padrão �Os estatísticos produziram diversos índices quantitativos derivados para refletir a extensão ou

Desvio Padrão �Os estatísticos produziram diversos índices quantitativos derivados para refletir a extensão ou variabilidade da distribuição. O desvio padrão é o mais valioso deles. É mais fácil compreende-lo apresentando outras medidas de dispersão e suas limitações.

Desvio Médio �Calculamos o desvio médio a partir da pontuação de desvio de cada

Desvio Médio �Calculamos o desvio médio a partir da pontuação de desvio de cada valor observado (a diferença da média), somando cada pontuação e dividindo o resultado pelo tamanho da amostra (n). �Embora interessante ela nunca é usada porque as pontuações de desvio negativo anulam as de positivo.

Variância �Uma forma de eliminar o problema causado pelos desvios negativos que neutralizam os

Variância �Uma forma de eliminar o problema causado pelos desvios negativos que neutralizam os positivos é elevar ao quadrado a pontuação de desvio. �A variância é um índice muito bom do grau de dispersão. Será zero se todas as observações forem iguais a média e crescerá conforme as observações difiram da média.

Desvio Padrão �Embora a variância seja freqüentemente usada em Estatística ela tem um grande

Desvio Padrão �Embora a variância seja freqüentemente usada em Estatística ela tem um grande problema, ela reflete uma unidade de media elevada ao quadrado. �Por causa disto os estatísticos extraem a raiz quadrada da variância.

�http: //www. ibope. com. br/calandra. Web/servlet/Calan dra. Redirect? temp=5&proj=Portal. IBOPE&pub=T&db= caldb&comp=biblioteca&doci

�http: //www. ibope. com. br/calandra. Web/servlet/Calan dra. Redirect? temp=5&proj=Portal. IBOPE&pub=T&db= caldb&comp=biblioteca&doci