Je voudrais affecter une identité à chaque point de données basé sur le facteur "Nom" des points de données et où le facteur est identique, il doit avoir la même identification NO ou ID. J'ai une grande quantité de données afin que cela puisse être un code d'identité aléatoire - il doit simplement regrouper ceux-ci avec le même nom sous une pièce d'identité individuelle, de cette façon, je peux faire le nom anonyme mais garder les points de données regroupés.
E.g. Dans les données factices ci-dessous "Aur" pourrait être un "cos" = b ... Suivant, C, D .... A1, B1, ... A2 .... etc. P>
Je pense que ce serait une fonction de groupe_by (nom, muté ())? Mais je ne suis pas sûr. P>
Voici quelques données factices: p>
3 Réponses :
Les ID peuvent-ils être des nombres? Cela devrait fonctionner aussi bien. # A tibble: 50 x 4
`Local Time` COG NAME id
<dttm> <dbl> <chr> <int>
1 2019-06-01 04:36:00 315 Aur 1
2 2019-06-01 04:40:00 353. Aur 1
3 2019-06-01 06:14:00 266. Aur 1
4 2019-06-01 06:53:00 215. Aur 1
5 2019-06-01 07:05:00 241. Aur 1
6 2019-06-01 07:13:00 246. Aur 1
7 2019-06-01 07:16:00 240. Aur 1
8 2019-06-01 07:18:00 250. Aur 1
9 2019-06-01 07:19:00 262. Aur 1
10 2019-06-01 07:20:00 270. Aur 1
# ... with 40 more rows
Vous pouvez utiliser dplyr :: group_indices () code>.
une option avec data.Table code> serait
.grp code>
Faire des variables la représentation numérique d'un facteur code> suffisante -
AS.Integer (nom de facteur (nom DF $)) code>?