11
votes

Comment puis-je obtenir le texte uniquement (pas de balises) à partir d'un document HTML?

J'ai une page HTML et je veux uniquement le texte uniquement (tous les nœuds de texte).

Exemple HTML H3>
hello sir


6 commentaires

Voter pour fermer ... beaucoup trop vague.


Je veux que l'ensemble du contenu de la page Web soit entré dans mon programme, alors comment puis-je obtenir le contenu de la page Web comme texte ordinaire?


Je veux que la page Web actuelle soit affichée en tant que texte brut, car ce texte que j'utilise en tant que saisie dans un autre programme. Il serait très utile que cela soit fait avec JavaScript


oui exactement, pas de balises HTML, je ne veux que le contenu .pour ex ce que je vois sur la page Web (le texte) est nécessaire


pour ex: ma sortie est comme celle-ci Google mais je veux seulement que Google n'est pas les balises


@Anusha j'ai mis à jour votre question donc il est plus clair.


3 Réponses :


-2
votes

En supposant que vous essayez d'obtenir le code HTML de la page Vos JS résidant sur

var elems = document.getElementsByTagName('*');
var result = '';
for(var k in elems)
    result += elems[k].innerHTML || '';
alert(result);


1 commentaires

innerhtml contient des balises HTML.



-3
votes

Je ne suis pas sûr que je comprenne complètement, mais si vous voulez le balisage de la page actuelle, je suppose que vous pouvez faire une demande AJAX contre la page en cours et utiliser cela:

$.get("/current-page-name", function(data) {
   console.log(data);
});


1 commentaires

Je veux que la page Web actuelle soit affichée en tant que texte brut, car ce texte que j'utilise en tant que saisie dans un autre programme. Il serait très utile que cela soit fait avec JavaScript



28
votes

En supposant que vous ne voulez que des enfants de corps code> élément ...

Exemple HTML H3>
var body = document.body;
var textContent = body.textContent || body.innerText;

console.log(textContent);  //   a bc


0 commentaires