9
votes

Php Domdocument ajoute des étiquettes supplémentaires

J'essaie d'analyser un document et d'obtenir toutes les balises d'image et de modifier la source pour quelque chose de différent.

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html><body><p>Hi, this is a test, here is an image<img src="lalala" width="68" height="95"> Because I like Beer!</p></body></html>


0 commentaires

5 Réponses :


-2
votes

Si vous allez enregistrer en tant que HTML, vous devez vous attendre à ce qu'un document HTML valide soit créé!

Il y a une autre option: DOMDOCUMUMENT :: SAVEXML a un paramètre facultatif vous permettant d'accéder au contenu XML d'un élément particulier: < PRE> XXX

Ceci suppose que votre contenu n'a qu'un seul p .


1 commentaires

Selon les éléments d'occasion à l'intérieur du document, il n'est pas toujours une bonne idée d'utiliser SaveXML () pour récupérer une source HTML. Le XML créé utilisera le raccourci pour tous les éléments sans contenu, ce qui endommagera le document HTML (E.G.