Ainsi, j'ai une colonne appelée "URL" dans mon Dataframe PD1 sortie: p>
3 Réponses :
df['URL'] = df.URL.str.split(',').apply(lambda x: ','.join(sorted(set(x)))) ##print(df) URL 0 url1,url2 1 url2,url3
Bon travail, mais j'ai un sentiment que "Row1:" et "Row 2:" ne font pas partie de la colonne code> URL code>, mais la façon dont il a écrit l'index du DF.
Ahh !! Je suis allé avec donc j'ai une colonne appelée "URL" dans mon Dataframe PD1 code>, si OP change alors je changerai en conséquence
Je suppose que votre colonne ne contient que la liste d'URL.
Une des solutions possibles est de: p>
quelque chose comme: p> Comme ce code utilise le module re em>, vous devez importer re em > avant. p> p>
Split et appliquer ensemble
d = {"url": ["url1,url1,url2", "url2,url2,url3"]} df = pd.DataFrame(d) df.url.str.split(",").apply(set)
Quel code avez-vous essayé, aussi je suppose que vous utilisez des pandas?
Est la colonne code> url code> une chaîne ou contient-elle une liste?