Donc, mon ensemble de données est composé de 15 variables, l'une d'elles (sexe) n'a que 2 niveaux. Je veux l'utiliser comme une variable factice, mais les niveaux sont 1 et 2. Comment puis-je faire cela? Je veux avoir des niveaux 0 et 1, mais je ne sais pas comment gérer cela dans R! P>
3 Réponses :
ty présent ceci si vous voulez que les étiquettes soient 0 = mâle et 1 = femelle, alors ... p> effectivement Vous n'avez pas besoin de créer une variable mannequin afin d'estimer un modèle utilisant comme vous pouvez le voir R traite assez bien avec les mannequins, vous venez de les transmettre à la formule sous forme de facteur code> code> et r fera le reste pour vous. P> Au fait, il n'y a pas besoin de changer le Catégories de C (2,1) dans C (0,1), les résultats seront les mêmes que vous pouvez le voir dans l'exemple ci-dessus. p> p> lm code>, voyons cet exemple: p>
Avec la plupart des outils de modélisation de R avec une interface de formule, vous n'avez pas besoin de créer des variables factices, le code sous-jacent qui gère et interprète la formule le fera pour vous. Si vous voulez une variable factice pour une autre raison, il existe plusieurs options. Le plus facile (IMHO) est d'utiliser qui donne: p> Vous pouvez utiliser une colonne de Jeter cela comme un facteur si vous souhaitez que cela soit interprété comme un objet catégorique: p> mais qui vaincre l'objet du facteur; Qu'est-ce que modèle.matrix () code>:
mannequin code> en tant que variable factice numérique; Choisissez la colonne que vous voulez être le niveau
1 code>-babasé.
Dummy [ 1] code> choisit
1 code> comme représentant la classe féminine et
mannequin [ 2] code> la classe masculine. p>
0 code> à nouveau? p> p>
Comme suggéré par beaucoup de choses ci-dessus, transformez-le en facteur.
Si vous souhaitez vraiment faire une faculde de code, la variable de genre, considérez cette p>
On dirait que cette question que j'ai posée ici: Stackoverflow. com / questions / 11970611 / ...
Si vous le transformez en un facteur et que vous le mettez dans un modèle R prend soin du bon travail pour vous.
@Tylerinker pour LM et AOV C'est le cas, et peut-être pour les autres, mais pas toujours. J'utilise Daisy et ça ne le fait pas automatiquement: erreur dans daisy (train.x, métrique = "gower", type = liste (symm = 1: symm_bin_len)): Au moins une variable binaire comporte plus de 2 niveaux.