Aula 4 Introduo ao Stata 18 de abril
Aula 4 Introdução ao Stata 18 de abril de 2013
Problemas com variáveis string
Problemas com variáveis string Como transformar variáveis string em variáveis numéricas? ? No caso de alguns bancos, dependendo da forma como o dado foi importado ou lido no stata, variáveis são caracterizadas como não numéricas, ou string. • Contudo, apesar das suas características qualitativas (por exemplo, ser homem ou ser mulher), a forma mais correta de se trabalhar com estas variáveis é transformá-las em variáveis numéricas. • Se a variável está como texto, por exemplo, “A” “B”ou “C”, a sugestão é utilizar o comando encode. • Exemplo: encode gender, generate(gender 2) A nova variável gender 2 será numérica e terá os “labels” homem e mulher associados a ela. Contudo, ser homem e ser mulher também terão valores numéricos. Exemplo do SAEB 2011 • list , nolabel
Problemas com variáveis string • Na variável , há uma ou mais células preenchidas com um caracter não numérico, por exemplo, X. • Se der o comando destring ele irá reclamar… existem elementos não numéricos que impedem a transformação. • A conversão para numérica pode ocorrer usando o comando destring mas devemos incluir a opção ignore(X). • Irá transformar X em um valor missing. destring race, replace ignore(X) race: characters X removed; replaced as byte (1 missing value generated)
Quando importa vírgulas na variável destring proficiencia_lp, dpcomma replace • Transforma a variável em numérica usando o separador de decimais. • Exemplo: SAEB 2011
Análise dos dados: zeros e missing • Sempre checar os valores apresentados nos dicionários do banco de dados. • Exemplos: PNAD
Como corrigir missings e não declarados? Count if (variável) == 999999 • Exemplo: use G: statamus 02 psid 92 m. dta
Recode • Recodifica algumas variáveis categóricas e quando solicitado gera uma nova variável. • Cria faixas de algumas variáveis. • Para os valores das variáveis que não constam no intervalo , assume-se valores missing.
By varlist • Sort varlist : ordena as observações em ordem ascendente de acordo com as variáveis definidas na lista varlist. • Pode usar bysort • Suponha quer criar para cada indivíduo uma variável que é igual a média de renda das pessoas que possuem o mesmo nível de escolaridade dela. (by sort egen) bysort education: egen aveearnsbyed = mean (earnings)
Variáveis indicadoras • Dummies/variáveis binárias: Suponha queira criar variáveis indicadoras mutuamente exclusivas para escolaridade. As dummies podem ser criadas uma a uma ou diretamente. Comandos xi • Interações: xi i. edcat*earnings, noomit
- Slides: 11