7
votes

Comment lire par programme sur un document ou une image numérisée

J'ai cherché sur le net, car je suis un peu un N00b quand il s'agit d'OCR, et je ne suis pas sûr d'où un bon point de départ serait.

J'aimerais Construire une application qui sera en mesure d'identifier et de compter dire par exemple combien de cases à cocher sont remplies sur une rangée donnée de documents / d'image (elle pourrait même être un autre format si quelqu'un peut savoir quelque chose qui pourrait mieux suir une application de ce type ). L'objectif ultime étant d'éliminer la capture de données manuelle et d'accélérer le processus d'obtention des statistiques globales à l'utilisateur final de l'application P>

i code dans c # principalement, une solution .NET serait donc préférable, mais si Je ne prendrai pas ce que je peux obtenir. P>

Ce que j'avais à l'esprit était de redéfinir les formes que les utilisateurs remplissent quelque chose de similaire à celui-ci. (Excusez l'art brut ASCII: p) Donc, la personne remplissante de la forme doit uniquement vérifier une valeur sur le papier. P>

                |  1  |  2  |  3  |  4  |  5  |  
Product A       | [ ]   [ ]   [ ]   [ ]   [x] |    
Product B       | [ ]   [ ]   [x]   [ ]   [ ] |


0 commentaires

4 Réponses :


2
votes

Vous pouvez essayer d'utiliser le bibliothèque de MODI Office .

D'autres options sont

  1. une bibliothèque OCR commerciale, ou
  2. Implémentez votre propre logique de reconnaissance bitmap (pourrait être réalisable si vous avez le contrôle total sur la mise en page de ce qui doit être numérisé).

1 commentaires

Dommage, MODI a été obsolète en Office 2010 TECHNET.MICROSOFT.COM/EN-US /Library/cc179199.aspx . Mais il y a des alternatives: en.wikipedia.org/wiki/...



2
votes

Si tout ce que vous faites est à la recherche de X dans des boîtes de X, vous pouvez imprimer le formulaire bleu clair et demander aux gens de marquer les boîtes avec un stylo à encre noir.

Vous venez de scanner l'image et recherchez les pixels x x. Ils doivent être relativement faciles à trouver, comparés à la forme bleu clair. Les coordonnées X, Y, les coordonnées sur l'image numérisée correspondraient à la réponse et au type de produit, respectivement.


0 commentaires

6
votes

1) Vous pouvez également vérifier le gratuit, mais très capable Tesseract Moteur OCR. Il est écrit en C ++, mais vous pouvez probablement utiliser C # pour y interfacer facilement.

2) Si vous souhaitez rouler le vôtre avec le traitement de l'image, vous pouvez regarder à l'aide de Emgucv Bibliothèque, qui est le wrapper .NET pour OpenCV .

Il y avait une récente publication sur la balise OpenCV, qui essayait de résoudre un Un problème très similaire à la vôtre qui impliquait la détection de marques sur une carte de loto.


1 commentaires

Merci! (Et tout le monde qui a répondu) Je vais essayer de poster un exemple de code ou quelque chose si je le faisais et que je devais être intéressé)



2
votes

Ce dont vous avez besoin est la reconnaissance des marques optiques (OMR). Si vous planifiez un logiciel commercial, consultez Engrey Flexicapture Engine , c'est un SDK pour Intégration des technologies de capture de données et de documents dans les applications Server, Desktop et Mobile. Ce n'est pas gratuit, mais quand il s'agit d'une entreprise - il peut ajouter une valeur sérieuse à votre produit.

Vous pouvez également utiliser un service cloud - un site Web qui vous permet de télécharger une image et de vous envoyer des données OCR'ed. Essayez www.ocrsdk.com , c'est un SDK OCR basé sur le cloud récemment lancé par ABBYY. C'est maintenant en version bêta pour qu'il soit complètement libre d'utiliser. Il faut que le périphérique utilisateur final ait une connexion Internet, mais elle est totalement indépendante de votre choix de langue de programmation et des ressources de périphérique de l'utilisateur. Il y a à la fois .NET et Java échantillons de code Avalaibe chez github.

Disclamer: Je travaille à ABBYY.


1 commentaires

Bonjour Nikolay, comment la solution de cloud d'Abbyy est-elle comparative à Redmond's ocr.a9t9.com pour les photos de smartphone? (Y a-t-il un site que je pourrais comparer?)