Dupliqué possible: strong>
outil pour comparer grand nombre de fichiers PDF? P > blockQuote>Je suis dans le scénario classique où l'entreprise vous donne un tas de formulaires de PDF neufs em> pour la nouvelle année sans notes de révision et vous êtes censé comprendre ce qui est différent de l'année précédente . p>
Je parle des tas de formulaires ici, alors j'essaie de trouver un moyen de comparer les PDF pour décrire les différences sans que les gens puissent passer à travers chacun d'entre eux. p>
Mon idée était d'extraire tout le texte des PDF et de le jeter en une .txt, puis d'exécuter des différences sur des fichiers texte, mais cela semble horrible. P>
Ma question dit par programme, mais je serais satisfait de tout outil fiable pour comparer les PDF, et que vous cherchiez principalement à avoir une idée des expériences des personnes. Également prêt à divertir toutes les solutions programmatiques (de préférence en C # mais pls tirer sur toutes les idées fortes>). P>
4 Réponses :
Il existe de nombreux produits logiciels qui prétendent Diff PDFS. Je n'ai jamais eu besoin d'utiliser un mais si cela va être un processus récurrent, je pense qu'il serait sage que votre entreprise investit dans l'une d'elles. Juste Google "PDF Diff" pour un tas d'applications potentielles. p>
En outre, votre situation est très similaire à cette question: outil pour comparer grand nombre de Fichiers PDF? Je pense que sa discussion peut aider. P>
Merci pour cela - cette question est en effet très similaire (pour une raison quelconque ne figurait pas lorsque j'ai composé le mien).
Je suis allé l'approche pour obtenir les données brutes du PDF, puis en utilisant le mot ou la tortuevn, ou winnmerge, etc ... pour prendre soin de la pièce de comparaison. Dans mon cas, j'ai fait la comparaison dans une RichTextbox dans C # ... Coloriage des différences, etc. Comme nous le voulions tout au sein de notre application. P>
Voici ce que j'ai fait ... comparaison pdf comme j'essayais de comparer Documents mixtes, mot et pdf. p>
Cependant, je recommanderais PDFBox pour l'analyse, un peu plus élégante ... bien que ItextShaRP ait fonctionné OK ... P>
J'ai écrit un blog suggérant des approches de comparaison de fichiers PDF à https://blog.idrsolutions.com/2010/09/comparing-2-pdf-files/ p>
Convertir PDF en image puis comparer et toujours besoin d'une intervention humaine? Comment est-ce utile alors?
Le logiciel peut vous dire s'ils n'ont pas changé pour que vous sachiez que vous n'avez rien brisé. Seul un humain peut évaluer les changements.
Je suis un développeur de bibliothèque docotic.pdf . Nous utilisons la comparaison PDF dans des tests d'unités pour vérifier que le test produit PDF comme prévu. PDF est une collection d'objets spéciaux et nous comparons tous les objets PDF ignorant certaines propriétés telles que les identifiants de remorque et les informations de créateur. Cette mise en œuvre fonctionne bien. P>
Vous pouvez essayer la méthode pdfdocument.documentsAREQUAL . Cette méthode vient de vous dire que vous êtes des documents égaux, sans différences spécifiques. Vous pouvez nous contacter si vous avez besoin de plus de fonctionnalités. P>
Pourquoi ce double est-il dupliqué? Il est clair que la question posée est de savoir comment le faire par programme. N'importe quel nombre d'outils installables ne sont pas la réponse à cette question.