0
votes

Python - Comment supprimer une séquence en double de lettres de la chaîne (ne peut pas diviser en espacement)

Ceci est différent de la suppression de caractères répétitifs ou de répéter des mots, comme expliqué ci-dessous.

  • 'Blue Valley Starsblue Valley' devrait être égale à "Blue Valley Stars"
  • 'West Michigan Whitecapswest Michigan' devrait égaler 'West Michigan Whitecaps'
  • 'Oregon Oraclesoregon' devrait être égal à "Oregon Oracles"

    La partie délicate ici est le début de l'endroit où il est duplicate, n'est pas séparé d'un espace. Donc, je ne peux pas simplement les diviser par '', supprimer des mots en double et rejoindre.

    Je pourrais croiser chaque lettre l'une avec l'autre lettre. Avec un seuil de <4 répéter des lettres pour qualifier de duplicata.

    À la recherche d'une meilleure façon cependant que j'ai manqué.


3 commentaires

Pourriez-vous simplement ajouter un espace entre une lettre capitalisée, puis supprimer des doublons et rejoindre? Sauf si les mots ne sont pas toujours capitalisés.


Besoin de plus d'informations sur: "Qu'est-ce qui qualifie que cette séquence de lettres est un mot ou non" ... parce que Starsblue peut aussi être un mot juste? Cela signifie-t-il que des mots avec des espaces ne doivent pas être contenus dans des mots à venir (comme tout ou inclus)


Toutes les trois réponses ci-dessous obtiennent le travail effectué. Je préfère la dernière solution, mais cela a été très utile de passer à travers chacun.


3 Réponses :


1
votes

Compte tenu des informations que vous fournissez, cela pourrait être réalisé en la division donnée en majuscule au lieu d'espaces: xxx

sorties: xxx

Si vous souhaitez une seule chaîne, ajoutez '' ''Join () : xxx

quelle sortie: xxx


0 commentaires

1
votes

Que diriez-vous de quelque chose comme ça? XXX PRE>

Sortie: P>

Blue Valley StarsBlue Valley -> ('Blue Valley Stars', 'Blue Valley')
West Michigan WhitecapsWest Michigan -> ('West Michigan Whitecaps', 'West Michigan')
Oregon OraclesOregon -> ('Oregon Oracles', 'Oregon')
Hello World -> None
123123 -> ('123', '123')


0 commentaires

1
votes
Blue Valley Stars
West Michigan Whitecaps
Oregon Oracles

0 commentaires