10
votes

Moteurs OCR conçus pour la lecture d'écran

Y a-t-il des moteurs OCR conçus pour identifier le texte dans des images capturées par écran plutôt que sur le texte numérisé? J'ai un projet où j'ai besoin de récupérer et d'identifier le texte dans une application, et aucun des moteurs OCR que j'ai essayés jusqu'à présent n'a bien fait bien équipé avec des captures d'écran.

Idéalement, le moteur doit bien fonctionner avec la couleur et le bruit de fond, bien que je puisse faire des allocations si rien de tel est disponible.

Il devra être compatible .NET; soit écrit en .NET ou avoir une API .NET-appelable.


2 commentaires

Quelle est la différence entre le texte numérisé et un coup d'écran?


Le texte du tir à l'écran est garanti d'être sur des lignes droites, mais aussi de couleur, avec bruit de fond coloré. Je cherche à voir s'il y a un moteur OCR spécialement conçu pour lire des captures d'écran.


4 Réponses :


4
votes

Habituellement, OCR Technolgy est syntonisée pour fonctionner avec du texte numérisé, qui est à au moins 200 dpi, mais 300 DPI est recommandé pour une qualité d'OCR fiable. Ainsi, vous devez déployer des efforts pour modifier les paramètres et tout pour que cela fonctionne sur le texte de l'écran, qui est généralement considéré comme quelque chose près de 96 dpi.

Abbyy a un tir d'écran Software OCR: http://www.abbyy.com/screenshot_reader/ Ce qui prouve que sa technologie est capable de travailler dans ces conditions. Je l'utilise, ça marche juste. Ainsi, vous voudrez peut-être contacter Abbyy pour OCR SDK: http://www.abbyy.com/ocr_sdk/ (peut être utilisé à partir de .NET)

Ce n'est pas bon marché, mais ça marche. Disclaimer: Je travaille pour ABBYY


0 commentaires

5
votes

J'ai trouvé Tesseract OCR pour être assez solide pour une source ouverte projet. J'ai découvert qu'il pouvait même lire et décoder des captchas simples, comme celle de Megaupload. Je penserais avec un petit peaufinant cela pourrait bien fonctionner.

La seule douleur est que cela n'accepte que des images TIFF non compressées, qui peuvent être gênantes.

EDIT: Philip Daubmereier a déjà trouvé un .net L'intégration, mais ci-dessous est du code pour convertir un bitmap en tiff non compressé. xxx

ceci enregistre dans un fichier, mais le bitmap.save méthode peut écrire sur un flux également.


1 commentaires

Il suffit de trouver déjà une intégration .NET: Pixel-Technology.com/freeware/TESSNET2



1
votes

Vous recherchez essentiellement le Les outils de contournement CAPTCHA divers chercheurs ont essayé, certains avec succès.

Une autre approche consisterait à utiliser des algorithmes de lissage pour interpoler 96 dpi et les convertir en 300 dpi (par exemple, Photoshop IT), puis utilisez des outils OCR standard.


1 commentaires

Je ne cherche pas les solveurs CAPTCHA - Aucun du texte ne sera brouillé de cette manière - mais cela aidera néanmoins néanmoins. =)



0
votes

Utilisez la première réponse (logiciel OCR) et pour la capture d'écran, vous pouvez probablement envoyer un caractère PRNTSCRN (PrintCreen), puis convertir le contenu du presse-papiers (BMP) en TIFF.

J'espère que cela vous aidera un peu plus dans votre entreprise


0 commentaires