9
votes

Convertir Word (.docx) à DocBook

J'ai été chargé de trouver un moyen de convertir une grande quantité de fichiers .docx à DOCBOOK 5. Actuellement, nous ouvrons le fichier dans OpenOffice et enregistrez-le à Docbook. C'est une tâche fastidieuse, mais je suis convaincu qu'il y a une meilleure façon. Ces fichiers seront ensuite traités davantage à notre schéma de Relax NG personnalisé. Par conséquent, cette conversion n'a pas besoin d'être sans faille. J'ai regardé autour de moi et continuera d'enquêter sur des prospects, mais je n'ai rien trouvé d'utilité.

regarder Convertir DOC / DOCX en HTML sémantique Ils ont suggéré < Un href = "http://www.upcast.de/" rel = "nofollow noreferrer"> Upcast , mais cela ne semble pas approprié à mes besoins.

Je cherche quelque chose de librement disponible pour que je puisse utiliser à partir de la ligne de commande. Je voudrais finalement je voudrais lot traiter nos fichiers. J'ai inclus les tags Linux, Python et Java pour ce sont les environnements que je suis le plus à l'aise, mais seraient disposés à se plier pour la bonne solution. J'essaie de faire des recherches avant de sortir et de réinventer la roue.


3 commentaires

Considéré en regardant l'API OpenOffice pour script, la sauvegarde Open + Save-comme?


J'ai édité votre question et supprimé un peu, vous êtes ici depuis un moment, mais s'il vous plaît jeter un coup d'œil sur le faq depuis un La signature ne doit pas être ajoutée et votre PS était subjectif et presque une question différente. S'il vous plaît examiner mon édition et voir si votre question est toujours complète.


C'est Trufa, merci pour la modification. Je suppose que je suis plus familier avec les échanges de courrier électronique que je suis Stackoverflow. @ Thorbjørn Ravn Andersen, je n'ai pas ceci peut-être une solution viable.


3 Réponses :


3
votes

Vous pouvez exécuter OpenOffice en mode serveur et nourrir les documents sans avoir à ouvrir manuellement chaque activation.

D'une manière: http://code.google.com/p/bungeni-eitor/wiki/Runningthejodconverterserver


1 commentaires

Merci pour la réponse rapide, j'ai passé quelque temps à ce jour plus tôt ce matin, mais après avoir tout configuré correctement, il avait du mal à soutenir Docx et / ou XML.



7
votes

Il existe plusieurs façons de scripter, à la fois en utilisant des scripts et des scripts externes dans OpenOffice. Voir les liens suivants pour quelques exemples:


1 commentaires

Merci, pour une raison ou une autre, je me suis installé sur la solution Python mail.python.org/pipermarth/python-announce-list/2006-may/.../a>



8
votes

au risque de gagner un badge d'archéologue de SX, les réponses devraient inclure une référence à Pandoc . Cela ne repose pas sur Open Office.

pandoc -f DOCX -T DOCBOOK -O NEWDOCBOOK.DBK --Standalone Original.docx


0 commentaires