J'ai été chargé de trouver un moyen de convertir une grande quantité de fichiers .docx à DOCBOOK 5. Actuellement, nous ouvrons le fichier dans OpenOffice et enregistrez-le à Docbook. C'est une tâche fastidieuse, mais je suis convaincu qu'il y a une meilleure façon. Ces fichiers seront ensuite traités davantage à notre schéma de Relax NG personnalisé. Par conséquent, cette conversion n'a pas besoin d'être sans faille. J'ai regardé autour de moi et continuera d'enquêter sur des prospects, mais je n'ai rien trouvé d'utilité. p>
regarder Convertir DOC / DOCX en HTML sémantique Ils ont suggéré < Un href = "http://www.upcast.de/" rel = "nofollow noreferrer"> Upcast , mais cela ne semble pas approprié à mes besoins. p>
Je cherche quelque chose de librement disponible pour que je puisse utiliser à partir de la ligne de commande. Je voudrais finalement je voudrais lot traiter nos fichiers. J'ai inclus les tags Linux, Python et Java pour ce sont les environnements que je suis le plus à l'aise, mais seraient disposés à se plier pour la bonne solution. J'essaie de faire des recherches avant de sortir et de réinventer la roue. P>
3 Réponses :
Vous pouvez exécuter OpenOffice en mode serveur et nourrir les documents sans avoir à ouvrir manuellement chaque activation. P>
D'une manière: http://code.google.com/p/bungeni-eitor/wiki/Runningthejodconverterserver p>
Merci pour la réponse rapide, j'ai passé quelque temps à ce jour plus tôt ce matin, mais après avoir tout configuré correctement, il avait du mal à soutenir Docx et / ou XML.
Il existe plusieurs façons de scripter, à la fois en utilisant des scripts et des scripts externes dans OpenOffice. Voir les liens suivants pour quelques exemples: P>
Certains des liens ci-dessus n'utilisent pas Java ou Python, mais les principes s'appliquent toujours et les scripts sont généralement suffisamment courts qu'ils peuvent être portés (le premier exemple est en rubis, mais c'est mon favori personnel en raison de la simplicité. ). p>
Merci, pour une raison ou une autre, je me suis installé sur la solution Python mail.python.org/pipermarth/python-announce-list/2006-may/.../a>
au risque de gagner un badge d'archéologue de SX, les réponses devraient inclure une référence à Pandoc . Cela ne repose pas sur Open Office. P>
pandoc -f DOCX -T DOCBOOK -O NEWDOCBOOK.DBK --Standalone Original.docx Code> P>
Considéré en regardant l'API OpenOffice pour script, la sauvegarde Open + Save-comme?
J'ai édité votre question et supprimé un peu, vous êtes ici depuis un moment, mais s'il vous plaît jeter un coup d'œil sur le faq depuis un La signature ne doit pas être ajoutée et votre PS était subjectif et presque une question différente. S'il vous plaît examiner mon édition et voir si votre question est toujours complète.
C'est Trufa, merci pour la modification. Je suppose que je suis plus familier avec les échanges de courrier électronique que je suis Stackoverflow. @ Thorbjørn Ravn Andersen, je n'ai pas ceci peut-être une solution viable.