Saturday, 17 June 2017

Gen String Variable In Stata Forex


Para perguntas rápidas, envie um email para dataprinceton. edu. Não há appts. Necessário durante as horas de caminhada. Nota: o laboratório DSS está aberto enquanto o Firestone estiver aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Criando e Modificando Variáveis ​​Antes de ler isso, certifique-se de que você entende aproximadamente quais são as variáveis ​​Stata e como elas funcionam. Nossa página em Dados, Datasets e Variáveis ​​é um bom lugar para começar. Comandos de criação de variáveis ​​Os comandos básicos para criar novas variáveis ​​e modificar velhas em Stata são gerados (gen abreviado), egen e substituir. O comando gen variablename algo cria uma nova variável chamada variablename e a diferencia de algo. Algo pode ser um número simples, uma string, uma expressão matemática ou uma função de outras variáveis. Para obter informações sobre as funções do gen, procure funções na ajuda online do Statas. Para obter informações sobre as funções egen, procure por egen. O comando substituir é usado para fazer alterações nas variáveis ​​existentes: Substituir funciona com todas as funções gen, mas não com funções egen. No entanto, você pode usar substituir para modificar variáveis ​​criadas por egen, bem como as criadas por gen. Você normalmente quer usar o substituto para etapas secundárias e posteriores em criações de variáveis ​​de várias etapas, assim como a usamos aqui. É uma má prática escrever sobre as variáveis ​​existentes, porque se você cometeu um erro, não há como recuperar os dados originais. Por exemplo, mesmo se você decidiu que só se preocupava com a relação de engrenagem arredondada para o número inteiro mais próximo, substitua a rodada dentada (gearratio, 1) não é recomendado. É sempre melhor criar uma nova variável. O qualificador if O qualificador if é usado para isolar um conjunto de observações com variáveis ​​que atendem a alguns critérios específicos. Os valores nas variáveis ​​em um conjunto de dados são comparados com valores em outras variáveis ​​ou em números ou strings usando operadores de comparação lógica. Isso é muito usado para criar variáveis ​​dummy, indicadores de 0-1 usados ​​para indicar se algo é verdadeiro ou falso. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos . Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Estatal dando um presente FAQ do Stata Como posso converter rapidamente muitas variáveis ​​de string em variáveis ​​numéricas Pode haver momentos em que você recebe um arquivo que possui muitas (ou todas) variáveis Definido como cordas. Isto é, variáveis ​​de caracteres. As variáveis ​​podem conter valores numéricos, mas se eles são definidos como string de tipo. Há muito poucas coisas que você pode fazer para analisar os dados. Você não pode obter meios, você não pode fazer uma regressão, você não pode fazer uma ANOVA, etc. Às vezes, o conjunto de dados contém valores numéricos que são armazenados como strings. Nós abordaremos esse cenário primeiro. Em seguida, abordaremos o caso em que as variáveis ​​de string realmente contêm cordas, e o objetivo é atribuir cada valor que a string assume em um valor numérico. Todos os exemplos desta página usam o mesmo conjunto de dados, então vamos começar examinando os dados. O conjunto de dados de exemplo, hsbs. É um subconjunto do arquivo de dados High School e Beyond, com todas as variáveis ​​como variáveis ​​de string. Como você vê a partir do comando de descrição abaixo, as variáveis ​​são todas definidas como variáveis ​​de string (por exemplo, ciência é str2. Uma seqüência de comprimento 2). Agora que sabemos que as variáveis ​​são variáveis ​​de string, podemos usar o comando list para ver como as strings armazenadas nessas variáveis ​​se parecem. Embora a ciência variável seja definida como str2, você pode ver da lista abaixo que contém apenas valores numéricos. Mesmo assim, porque a variável é definida como str2, a Stata não pode realizar qualquer tipo de análise numérica da ciência variável. O mesmo é verdadeiro para a leitura variável. Convertendo variáveis ​​de string com valores numéricos Um método para converter números armazenados como strings em variáveis ​​numéricas é usar uma função de string chamada real que traduz valores numéricos armazenados como seqüências de caracteres em valores numéricos. A Stata pode reconhecer como tal. A primeira linha de sintaxe lê no conjunto de dados mostrado acima. O segundo gera uma nova leitura variável que é igual ao valor do número armazenado na leitura da variável de string. O (s) real (es) é a função que traduz os valores mantidos como strings, onde s é a variável que contém strings. Um segundo método para alcançar o mesmo resultado é o comando destring. Vamos tentar usar o comando destring e ver como isso funciona. A primeira linha de sintaxe carrega o conjunto de dados novamente, de modo que estamos começando com um conjunto de dados contendo apenas variáveis ​​de string novamente. A segunda linha de sintaxe executa o comando destring. Como você pode ver no comando de descrição abaixo, o comando destring converteu todas as variáveis ​​em números, exceto para a raça. Gênero e schtyp. Como essas variáveis ​​tinham caracteres neles, o comando destring deixou essas variáveis ​​sozinhas. Se houvesse variáveis ​​numéricas no conjunto de dados, elas permaneceriam inalteradas. Ambas as técnicas descritas acima possuem atributos que em algumas situações são vantajosas e em outras situações podem ser desvantagens. O comando destring pode ser executado em um conjunto de dados inteiro em um passo, o método usando a função real exige emitir um comando para cada variável a ser convertida (embora isso possa ser feito com um loop em vez de digitar a sintaxe para cada variável). Uma vantagem potencial para usar a função real (o primeiro método) é que, se a função real encontrar um valor não-numérico, ele define a variável igual à ausente nesse caso e continua. Até certo ponto, podem ser feitos comportamentos para se comportar de forma semelhante, mas não de forma idêntica. Para converter uma variável de string contendo qualquer valor não numérico usando destring, é necessário listar os caracteres que devem ser ignorados (por exemplo, ou.). Além disso, ao invés de definir valores para os casos com valores não-numéricos em falta (o que a função real faz), destring remove os caracteres não-numéricos especificados. Destring irá extrair as cordas especificadas e, em seguida, converter, o que significa que a4 pode ser convertido em 4. o comportamento de destring é muito bom se um tiver valores numéricos armazenados como strings que ocasionalmente contêm coisas como vírgulas (por exemplo, 4,354), mas pode haver situações em que Esse comportamento não é desejável. Convertendo variáveis ​​de string com valores não numéricos em valores numéricos Como convertem gênero e schtyp em valores numéricos Podemos usar o comando codificar como mostrado abaixo. Esses comandos criam gender2 e schtyp2. Observe no comando de descrição abaixo que gender2 e schtyp2 são variáveis ​​numéricas e eles possuem rótulos associados a eles (chamado gender2 e schtyp2). Se listarmos os dados, parece que gender2 e schtyp2 são idênticos ao gênero e ao schtyp. No entanto, eles são realmente numéricos eo que você está vendo são os rótulos de valor associados às variáveis. Abaixo, usamos a opção nolabel e você vê que gender2 e schtyp2 são realmente numéricos. E quanto à raça variável. Ainda é uma variável de caracteres porque nosso comando de destruição anterior viu o X nos dados e não tentou convertê-lo porque tinha valores não-numéricos. Abaixo, podemos convertê-lo em numérico, incluindo a opção ignorar (X) que informa a destring para converter a variável em numérico e quando encontra X para converter isso em um valor ausente. Você pode ver os resultados no comando da lista abaixo. Como você viu, podemos usar destring para converter variáveis ​​de string que contêm números em variáveis ​​numéricas, e pode lidar com situações em que alguns valores são armazenados como um personagem (como o X que vimos com a raça). Se você tem uma variável de caracteres que está armazenada como todos os caracteres, você pode usar codificar para converter a variável de caracteres numérico e criará rótulos de valores que tenham os valores que foram armazenados com a variável de caracteres. Para mais informações, consulte o manual de ajuda ou referência sobre os comandos de destring e codificar. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment