J'ai un site wordpress qui contient des milliers de fichiers image. Le problème est que la grande majorité est redondante et n'utilise que de l'espace disque. J'ai besoin d'un moyen de savoir lesquels sont réellement référencés par le html afin de pouvoir supprimer ceux qui ne le sont pas.
Peut-être que Selenium WebDiriver pourrait vous aider? Je pourrais gratter le site Web pour obtenir la valeur des attributs src de tous les éléments img.
En utilisant le code suivant, la collection d'images contient 22 éléments - ce qui est correct pour la page en particulier. Le problème est que je ne sais pas comment accéder à la valeur de l'attribut "src"?
var images = driver.FindElements(By.TagName("img")); foreach (var image in images) { Debug.WriteLine(image.Text); }
3 Réponses :
Utilisez GetAttribute
pour obtenir un attribut dont vous avez besoin, exemple:
image.GetAttribute("src")
GetAttribute
avec src
obtiendra toute l'url / chemin de l'image.
var images = driver.FindElements(By.TagName("img")); foreach (var image in images) { Debug.WriteLine(image.GetAttribute("src")); }
Pourquoi publier la même réponse?
Pardon. J'ai pensé qu'il serait logique que je publie la réponse avec l'exemple de code de l'utilisateur.Certains utilisateurs attendent des réponses avec leur exemple de code.
vous pouvez utiliser Html Agility Pack (HAP) après avoir obtenu du sélénium.
Vous pouvez utiliser
image.GetAttribute ("src")