0
votes

Élimination d'une liste de domaines / Supprimer les sous-domaines

J'ai une grande liste de domaines qui est mélangé avec des sous-domaines.

google.de
spiegel.de
sub1.google.de
zeit.de
sub1.spiegel.de


1 commentaires

Avez-vous également des domaines qui utilisent plus de trois niveaux (par exemple, .co.uk domaines)?


3 Réponses :


2
votes

Si vous voulez dire enlever le ***. Quelque chose. Quelque chose, recherchez une expression régulière xxx

et remplacez-le avec rien.
de
Edit: version 2, où vous souhaitez conserver une partie de la ligne (une duplication dans votre exemple): xxx

remplacé par xxx

le () et. Prenez leur signification d'expression régulière (regroupement et caractère), et le \. échappe le. trouver ce personnage. 1 $ obtient ce qui se trouve à l'intérieur du (premier) ensemble de () si l'expression de recherche (comme $ 2 aurait la deuxième partie si elle est présente ...)


1 commentaires

Merci pour l'aide. Maintenant, je reçois la ligne de trou avec un sous-domaine trouvé. Comment puis-je obtenir la sous-partie du domaine remplacé par rien? sub.google.de -> google.de



0
votes

Si vous avez awk code> outil de ligne de commande.

BEGIN{FS=OFS="."}    # set input line field separator to  .
NF > 2{                # if there are more than 2 input fields
        while(NF > 2) $0 =substr($0, length($1)+2); #remove the first field from input line
    }              
1                # output modified line


2 commentaires

Merci de votre aide. Mais quand je saisis: google.de spiegel.de sub1.google.de zete.de sub1.spiegel.de Je veux obtenir google.de spiegel.de google.de zete.de spiegel.de. Je veux obtenir les sous-traits supprimés.


fixé à la demande @deelite.



1
votes
  • ctrl kbd> + h kbd> li>
  • Trouvez quoi: ^ (?:. + \.)? ([^. \ r \ n] + \. [^. \ r \ n] +) $ li> li> li>
  • remplacer par: 1 $ code> li>
  • Vérifiez l'enveloppe autour de em> li>
  • vérifier l'expression régulière em> li>
  • décochez . correspond à la nouvelle ligne code> em> li>
  • Remplacez tout kbd> li>

    Explication: strong> p> xxx pré>

    résultat pour l'exemple donné: strong> p>

    google.de
    spiegel.de
    google.de
    zeit.de
    spiegel.de
    


0 commentaires