0
votes

Élimination d'une liste de domaines / Supprimer les sous-domaines

J'ai une grande liste de domaines qui est mélangé avec des sous-domaines.

google.de
spiegel.de
sub1.google.de
zeit.de
sub1.spiegel.de

csv notepad++ bulk

1 commentaires

Avez-vous également des domaines qui utilisent plus de trois niveaux (par exemple, .co.uk domaines)?



                                    
                    3 Réponses :
                    
                                            
                            
                                
                                    2
 votes
                                
                            
                            
                                
                                     Si vous voulez dire enlever le ***. Quelque chose. Quelque chose, recherchez une expression régulière  xxx  
 et remplacez-le avec rien. 

de 

Edit: version 2, où vous souhaitez conserver une partie de la ligne (une duplication dans votre exemple):   xxx  
 remplacé par   xxx  
 le () et. Prenez leur signification d'expression régulière (regroupement et caractère), et le \. échappe le. trouver ce personnage. 1 $ obtient ce qui se trouve à l'intérieur du (premier) ensemble de () si l'expression de recherche (comme $ 2 aurait la deuxième partie si elle est présente ...)                                  

                                                                    
                                    
                                    
                                        1 commentaires
                                        
                                                                                            
                                                    Merci pour l'aide. Maintenant, je reçois la ligne de trou avec un sous-domaine trouvé. Comment puis-je obtenir la sous-partie du domaine remplacé par rien? sub.google.de -> google.de                                                
                                                
                                                                                    
                                    
                                                            
                        
                        
                                            
                            
                                
                                    0
 votes
                                
                            
                            
                                
                                     Si vous avez  awk  code> outil de ligne de commande. 
BEGIN{FS=OFS="."}    # set input line field separator to  .
NF > 2{                # if there are more than 2 input fields
        while(NF > 2) $0 =substr($0, length($1)+2); #remove the first field from input line
    }              
1                # output modified line

                                

                                                                    
                                    
                                    
                                        2 commentaires
                                        
                                                                                            
                                                    Merci de votre aide. Mais quand je saisis: google.de spiegel.de sub1.google.de zete.de sub1.spiegel.de Je veux obtenir google.de spiegel.de google.de zete.de spiegel.de. Je veux obtenir les sous-traits supprimés.                                                
                                                
                                                                                            
                                                    fixé à la demande @deelite.                                                
                                                
                                                                                    
                                    
                                                            
                        
                        
                                            
                            
                                
                                    1
 votes
                                
                            
                            
                                
                                    
  ctrl  kbd> +  h  kbd>  li>
 Trouvez quoi:  ^ (?:. + \.)? ([^. \ r \ n] + \. [^. \ r \ n] +) $  li>  li>  li>
 remplacer par:  1 $  code>  li>
  Vérifiez l'enveloppe autour de  em>  li>
  vérifier l'expression régulière  em>  li>
  décochez . correspond à la nouvelle ligne  code>  em>  li>
  Remplacez tout  kbd>  li>
  Explication:  strong>  p>  xxx  pré> 
  résultat pour l'exemple donné:  strong>  p> 
google.de
spiegel.de
google.de
zeit.de
spiegel.de

                                

                                                                    
                                    
                                    
                                        0 commentaires