12
votes

Convertisseur HTML TO .DOC en Python?

J'utilise Pise, qui est une bibliothèque de conversion HTML à PDF pour Python.

Est-ce qu'il existe la même chose pour un document Word: une bibliothèque de conversion HTML à .doc pour Python?


4 commentaires

Pourquoi voudriez-vous cela? MS Word peut lire HTML.


J'ai le même problème: j'ai un HTML qui utilise Pise pour convertir en PDF et je veux faire la même chose avec Word. C'est un gros document, ~ 20 pages, utilisant le même morceau de code pour générer le HTML, puis exporter à travers pisa ou autre chose serait génial.


@ Scientifique: récemment, j'ai eu le même problème. Il suffit de vous demander, avez-vous trouvé une solution pour convertir HTML en mot ?Docx? Merci.


@ tao.hong: Avez-vous réussi à résoudre votre problème? Je cherche aussi une solution open source appropriée. Merci


4 Réponses :


5
votes

Bien que je ne sois pas au courant d'un module direct capable de vous permettre de convertir cela, cependant:

  1. Vous pouvez convertir html vers texte brillant en utilisant le HTML2Text module.
  2. Après cela, vous pouvez utiliser ce module Python-DocX pour convertir le texte en un doc ou a docx fichier.

0 commentaires



0
votes

MISE À JOUR AVEC UN PYTHON3.X FIX Ceci:

from htmldocx import HtmlToDocx

new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated


0 commentaires