0
votes

Attribuer le code d'identité basé sur le nom du facteur

Je voudrais affecter une identité à chaque point de données basé sur le facteur "Nom" des points de données et où le facteur est identique, il doit avoir la même identification NO ou ID. J'ai une grande quantité de données afin que cela puisse être un code d'identité aléatoire - il doit simplement regrouper ceux-ci avec le même nom sous une pièce d'identité individuelle, de cette façon, je peux faire le nom anonyme mais garder les points de données regroupés.

E.g. Dans les données factices ci-dessous "Aur" pourrait être un "cos" = b ... Suivant, C, D .... A1, B1, ... A2 .... etc.

Je pense que ce serait une fonction de groupe_by (nom, muté ())? Mais je ne suis pas sûr.

Voici quelques données factices: xxx


1 commentaires

Faire des variables la représentation numérique d'un facteur suffisante - AS.Integer (nom de facteur (nom DF $)) ?


3 Réponses :


1
votes

Les ID peuvent-ils être des nombres? Cela devrait fonctionner aussi bien. XXX PRE>

# A tibble: 50 x 4
   `Local Time`          COG NAME     id
   <dttm>              <dbl> <chr> <int>
 1 2019-06-01 04:36:00  315  Aur       1
 2 2019-06-01 04:40:00  353. Aur       1
 3 2019-06-01 06:14:00  266. Aur       1
 4 2019-06-01 06:53:00  215. Aur       1
 5 2019-06-01 07:05:00  241. Aur       1
 6 2019-06-01 07:13:00  246. Aur       1
 7 2019-06-01 07:16:00  240. Aur       1
 8 2019-06-01 07:18:00  250. Aur       1
 9 2019-06-01 07:19:00  262. Aur       1
10 2019-06-01 07:20:00  270. Aur       1
# ... with 40 more rows


0 commentaires

2
votes

Vous pouvez utiliser dplyr :: group_indices () . XXX


0 commentaires

0
votes

une option avec data.Table serait .grp xxx


0 commentaires