1
votes

Obtenez toutes les valeurs d'image src du site Web à l'aide de Selenium WebDriver

J'ai un site wordpress qui contient des milliers de fichiers image. Le problème est que la grande majorité est redondante et n'utilise que de l'espace disque. J'ai besoin d'un moyen de savoir lesquels sont réellement référencés par le html afin de pouvoir supprimer ceux qui ne le sont pas.

Peut-être que Selenium WebDiriver pourrait vous aider? Je pourrais gratter le site Web pour obtenir la valeur des attributs src de tous les éléments img.

En utilisant le code suivant, la collection d'images contient 22 éléments - ce qui est correct pour la page en particulier. Le problème est que je ne sais pas comment accéder à la valeur de l'attribut "src"?

var images = driver.FindElements(By.TagName("img"));

        foreach (var image in images)
        {
            Debug.WriteLine(image.Text);
        }


1 commentaires

Vous pouvez utiliser image.GetAttribute ("src")


3 Réponses :


1
votes

Utilisez GetAttribute pour obtenir un attribut dont vous avez besoin, exemple:

image.GetAttribute("src")


0 commentaires

1
votes

GetAttribute avec src obtiendra toute l'url / chemin de l'image.

var images = driver.FindElements(By.TagName("img"));

        foreach (var image in images)
        {
            Debug.WriteLine(image.GetAttribute("src"));
        }


2 commentaires

Pourquoi publier la même réponse?


Pardon. J'ai pensé qu'il serait logique que je publie la réponse avec l'exemple de code de l'utilisateur.Certains utilisateurs attendent des réponses avec leur exemple de code.



0
votes

vous pouvez utiliser Html Agility Pack (HAP) après avoir obtenu du sélénium.


0 commentaires