-2
votes

Comment diviser les valeurs à l'intérieur des crochets ronds dans deux nouvelles colonnes distinctes dans un fichier de données Python?

Comment scinder une valeur dans deux colonnes qui se trouve à l'intérieur d'une pièce ronde? J'ai une trame de données comme mentionné ci-dessous.

 Entrez la description de l'image ici Maintenant, le problème est la longueur de la première partie (avant la virgule) et la deuxième partie (après la virgule) n'est pas corrigée. Cela peut varier.

Je veux avoir les deux valeurs à l'intérieur des crochets ronds dans deux nouvelles colonnes distinctes nommées "POS" et "State".

Pouvez-vous m'aider avec le code Python pour la mettre en œuvre?

ci-dessous est ce que je veux réaliser Entrez la description de l'image ici


4 commentaires

Qu'est-ce que tu as essayé jusque-là?


J'ai essayé Regex et Split. La scission donne une question de longueur et regex ne fonctionne pas non plus comme prévu.


Est-ce que cela répond à votre question? Comment déballer une série de tuples en Pandas?


Quel est exactement le problème? S'il vous plaît voir exemple de reproductible minimal , Comment demander , centre d'aide .


3 Réponses :


0
votes

Parenthèses, ou comme vous appelez des crochets ronds sont représentatifs d'un type de données appelé tuples dans Python.

S'il est statique, des tableaux d'accès des tuples de plusieurs manières. Voici un moyen facile xxx

Donc, maintenant je ne suis donc pas sûr de votre source de données, mais vous pouvez ajouter ces éléments au besoin.


2 commentaires

c'est un numpy.dtype.


c'est dtype ('o')



0
votes
df['pos'] = df.Sentiment.str.split(',')[0]
df['state'] = df.Sentiment.str.split(',')[1]

1 commentaires

S'il vous plaît ne publiez pas seulement le code comme réponse, mais fournissez également une explication de votre code et de la manière dont il résout le problème de la question. Les réponses avec une explication sont généralement de meilleure qualité et sont plus utiles à attirer des upvotes.



0
votes

Première importation de pandas et lisez CSV à travers elle et stockez les données dans un objet DataFrame.

Utilisez la méthode .str.split pour diviser la colonne "sentiment" en deux par la virgule.

Faites ensuite de nouvelles colonnes, retirez les supports avant et arrière de la valeur de chaîne si vous utilisez .str.strip .

Imprimez les données. Ou si vous le souhaitez, écrivez-le à un nouveau fichier CSV à l'aide de la méthode .to_csv .

N'oubliez pas de renommer les noms de fichier CSV dans le .read_csv et .to_csv méthodes.

Code complet: xxx

ci-dessous est les sorties en utilisant des données simulées:

imprimé à la borne: Entrez la description de l'image ici

nouveau CSV: Entrez la description de l'image ici


0 commentaires