J'ai un fichier de données Python et certaines colonnes font référence à des échantillons répétés comme ci-dessous: pour les échantillons répétés, Je pense à utiliser regex mais je ne les ai jamais utilisées sur Python Dataframes p> p> Sample2.1 code> et Sample2. 2 code>, je tiens à rester avec une moyenne des deux, c'est-à-dire p>
3 Réponses :
Je ferais: sortie: p>
Vous pouvez regrouper des colonnes si vous fournissez colonnes de pandas et indices peut utiliser le axe = 1 code>, par exemple: pandas.series.str code> Méthodes d'accessoir de chaîne, y compris regex. < / p> p>
Essayez: sorties: p>
Bienvenue dans le débordement de la pile! Pour obtenir les meilleures réponses de qualité, soyez sûr que vos exemples fonctionnent . Cela nous permet de diagnostiquer votre problème si vous n'avez pas testé votre code!