Para perguntas rápidas, envie um email para dataprinceton. edu. Não há appts. Necessário durante as horas de caminhada. Nota: o laboratório DSS está aberto enquanto o Firestone estiver aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Criando e Modificando Variáveis Antes de ler isso, certifique-se de que você entende aproximadamente quais são as variáveis Stata e como elas funcionam. Nossa página em Dados, Datasets e Variáveis é um bom lugar para começar. Comandos de criação de variáveis Os comandos básicos para criar novas variáveis e modificar velhas em Stata são gerados (gen abreviado), egen e substituir. O comando gen variablename algo cria uma nova variável chamada variablename e a diferencia de algo. Algo pode ser um número simples, uma string, uma expressão matemática ou uma função de outras variáveis. Para obter informações sobre as funções do gen, procure funções na ajuda online do Statas. Para obter informações sobre as funções egen, procure por egen. O comando substituir é usado para fazer alterações nas variáveis existentes: Substituir funciona com todas as funções gen, mas não com funções egen. No entanto, você pode usar substituir para modificar variáveis criadas por egen, bem como as criadas por gen. Você normalmente quer usar o substituto para etapas secundárias e posteriores em criações de variáveis de várias etapas, assim como a usamos aqui. É uma má prática escrever sobre as variáveis existentes, porque se você cometeu um erro, não há como recuperar os dados originais. Por exemplo, mesmo se você decidiu que só se preocupava com a relação de engrenagem arredondada para o número inteiro mais próximo, substitua a rodada dentada (gearratio, 1) não é recomendado. É sempre melhor criar uma nova variável. O qualificador if O qualificador if é usado para isolar um conjunto de observações com variáveis que atendem a alguns critérios específicos. Os valores nas variáveis em um conjunto de dados são comparados com valores em outras variáveis ou em números ou strings usando operadores de comparação lógica. Isso é muito usado para criar variáveis dummy, indicadores de 0-1 usados para indicar se algo é verdadeiro ou falso. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos . Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Estatal dando um presente FAQ do Stata Como posso converter rapidamente muitas variáveis de string em variáveis numéricas Pode haver momentos em que você recebe um arquivo que possui muitas (ou todas) variáveis Definido como cordas. Isto é, variáveis de caracteres. As variáveis podem conter valores numéricos, mas se eles são definidos como string de tipo. Há muito poucas coisas que você pode fazer para analisar os dados. Você não pode obter meios, você não pode fazer uma regressão, você não pode fazer uma ANOVA, etc. Às vezes, o conjunto de dados contém valores numéricos que são armazenados como strings. Nós abordaremos esse cenário primeiro. Em seguida, abordaremos o caso em que as variáveis de string realmente contêm cordas, e o objetivo é atribuir cada valor que a string assume em um valor numérico. Todos os exemplos desta página usam o mesmo conjunto de dados, então vamos começar examinando os dados. O conjunto de dados de exemplo, hsbs. É um subconjunto do arquivo de dados High School e Beyond, com todas as variáveis como variáveis de string. Como você vê a partir do comando de descrição abaixo, as variáveis são todas definidas como variáveis de string (por exemplo, ciência é str2. Uma seqüência de comprimento 2). Agora que sabemos que as variáveis são variáveis de string, podemos usar o comando list para ver como as strings armazenadas nessas variáveis se parecem. Embora a ciência variável seja definida como str2, você pode ver da lista abaixo que contém apenas valores numéricos. Mesmo assim, porque a variável é definida como str2, a Stata não pode realizar qualquer tipo de análise numérica da ciência variável. O mesmo é verdadeiro para a leitura variável. Convertendo variáveis de string com valores numéricos Um método para converter números armazenados como strings em variáveis numéricas é usar uma função de string chamada real que traduz valores numéricos armazenados como seqüências de caracteres em valores numéricos. A Stata pode reconhecer como tal. A primeira linha de sintaxe lê no conjunto de dados mostrado acima. O segundo gera uma nova leitura variável que é igual ao valor do número armazenado na leitura da variável de string. O (s) real (es) é a função que traduz os valores mantidos como strings, onde s é a variável que contém strings. Um segundo método para alcançar o mesmo resultado é o comando destring. Vamos tentar usar o comando destring e ver como isso funciona. A primeira linha de sintaxe carrega o conjunto de dados novamente, de modo que estamos começando com um conjunto de dados contendo apenas variáveis de string novamente. A segunda linha de sintaxe executa o comando destring. Como você pode ver no comando de descrição abaixo, o comando destring converteu todas as variáveis em números, exceto para a raça. Gênero e schtyp. Como essas variáveis tinham caracteres neles, o comando destring deixou essas variáveis sozinhas. Se houvesse variáveis numéricas no conjunto de dados, elas permaneceriam inalteradas. Ambas as técnicas descritas acima possuem atributos que em algumas situações são vantajosas e em outras situações podem ser desvantagens. O comando destring pode ser executado em um conjunto de dados inteiro em um passo, o método usando a função real exige emitir um comando para cada variável a ser convertida (embora isso possa ser feito com um loop em vez de digitar a sintaxe para cada variável). Uma vantagem potencial para usar a função real (o primeiro método) é que, se a função real encontrar um valor não-numérico, ele define a variável igual à ausente nesse caso e continua. Até certo ponto, podem ser feitos comportamentos para se comportar de forma semelhante, mas não de forma idêntica. Para converter uma variável de string contendo qualquer valor não numérico usando destring, é necessário listar os caracteres que devem ser ignorados (por exemplo, ou.). Além disso, ao invés de definir valores para os casos com valores não-numéricos em falta (o que a função real faz), destring remove os caracteres não-numéricos especificados. Destring irá extrair as cordas especificadas e, em seguida, converter, o que significa que a4 pode ser convertido em 4. o comportamento de destring é muito bom se um tiver valores numéricos armazenados como strings que ocasionalmente contêm coisas como vírgulas (por exemplo, 4,354), mas pode haver situações em que Esse comportamento não é desejável. Convertendo variáveis de string com valores não numéricos em valores numéricos Como convertem gênero e schtyp em valores numéricos Podemos usar o comando codificar como mostrado abaixo. Esses comandos criam gender2 e schtyp2. Observe no comando de descrição abaixo que gender2 e schtyp2 são variáveis numéricas e eles possuem rótulos associados a eles (chamado gender2 e schtyp2). Se listarmos os dados, parece que gender2 e schtyp2 são idênticos ao gênero e ao schtyp. No entanto, eles são realmente numéricos eo que você está vendo são os rótulos de valor associados às variáveis. Abaixo, usamos a opção nolabel e você vê que gender2 e schtyp2 são realmente numéricos. E quanto à raça variável. Ainda é uma variável de caracteres porque nosso comando de destruição anterior viu o X nos dados e não tentou convertê-lo porque tinha valores não-numéricos. Abaixo, podemos convertê-lo em numérico, incluindo a opção ignorar (X) que informa a destring para converter a variável em numérico e quando encontra X para converter isso em um valor ausente. Você pode ver os resultados no comando da lista abaixo. Como você viu, podemos usar destring para converter variáveis de string que contêm números em variáveis numéricas, e pode lidar com situações em que alguns valores são armazenados como um personagem (como o X que vimos com a raça). Se você tem uma variável de caracteres que está armazenada como todos os caracteres, você pode usar codificar para converter a variável de caracteres numérico e criará rótulos de valores que tenham os valores que foram armazenados com a variável de caracteres. Para mais informações, consulte o manual de ajuda ou referência sobre os comandos de destring e codificar. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.
No comments:
Post a Comment