J'ai une image du logo cible que j'essaye d'utiliser pour trouver des logos cible dans d'autres images. J'exécute actuellement deux algorithmes de détection différents pour m'aider à détecter les logos de l'image. La première détection que j'utilise est l'histogramme basé sur lequel je recherche l'image d'une zone générale à l'écran où les couleurs sont très similaires. À partir de là, je courais tamift pour aller plus loin l'objet que je cherche. Cela fonctionne sur la plupart des logos, mais le logo cible que je n'ai même pas de ramasser et de clavier dans le logo. P>
Je me demandais s'il y avait quelque chose que je pouvais faire pour aider à localiser des claviers de l'image. Tout conseil est grandement apprécié. P>
ci-dessous est l'image qui n'est pas ramassée par SIFT: P>
p>
Merci d'avance. P>
edit fort>
Je me suis fatigué en utilisant l'idée de Julien pour des gabarits de jumelage et de différentes échelles et rotations du modèle, mais j'ai toujours de petits résultats. J'ai inclus une image que j'essaie de tester contre. P>
p>
3 Réponses :
Il n'y a pas de clavier dans votre image ... p>
Pourquoi? P>
Ce que vous pourriez essayer est une méthode de correspondance de modèle si vous recherchez ce logo sans gros changements (rotation, traduction, bruit, etc.) Une corrélation simple est le plus facile. p>
Si vous voulez aller plus loin, une de mes idées que je n'ai jamais implémentées, mais qui pourrait être drôle: aurait des ensembles de cette image que vous échelonnez, faites-la pivoter, de chaîne, de la désatiation, d'augmenter le bruit avec des fonctions, puis Appliquez le modèle correspondant à cet ensemble d'images que vous avez provenez de votre ancien modèle ... Eh bien, cette idée provient de la transformation de tamis et d'ondelettes, où nous utilisons des fonctions que nous modifions à certains égards (rotation, bruit, fréquence, etc.) afin de donner une robustesse à notre transformation contre ces changements de base qui se produisent dans n'importe quelle image. que vous voulez "inspecter". Cela pourrait être une idée pour vous! P>
p>
Voici une image résumant mon idée, vous tournez et évitez votre modèle, il crée une nouvelle gabarit rotarée / mise à l'échelle que vous pouvez essayer de faire correspondre, il augmentera la robustesse (même si cela peut être très long si vous choisissez un beaucoup de paramètres à changer). Eh bien, je ne dis pas que c'est un algorithme, mais cela pourrait être une idée amusante et très fondamentale d'essayer ... p>
Julien, P>
Il y a une autre raison pour laquelle ce logo est problématique pour la correspondance des fonctionnalités. La plupart des caractéristiques fonctionnent assez mauvais avec des images artificielles qui n'ont aucune douceur. Tous les dérivés sont exactement de 1 pixel taille et de caractéristiques détecteur s'appuient sur des dérivés. Vous devez lisser un peu l'image. Ofcorse Pour ce logo spécifique, il ne vous aidera pas à cause de la symétrie élevée. Vous pouvez utiliser Hough Transform pour détecter les cercles à l'intérieur des cercles. Cela vous donnerait de meilleurs résultats en comparaison avec la correspondance des gabarits. P>
À coup sûr, le cercle de Hough donnerait de bons résultats, cependant, vous détecterez d'autres fonctionnalités que vous ne voulez pas ... Je pense que cela pourrait être une très bonne idée que vous l'utilisez avec un détecteur de couleur (si le logo est toujours rouge)...
Pour le moment, j'utilise un détecteur de couleur pour limiter la région d'intérêt à une partie de l'image, puis j'utiliserais Tamife pour essayer de détecter les fonctionnalités entre les deux images et utiliser Knn pour la correspondre. Cependant, parce que ce logo n'a pas de fonctionnalités, cela m'empêche de moi morts dans mes pistes. En essayant toujours de comprendre une sorte de filet de sécurité qui n'est pas cher.
Avez-vous essayé ma solution avec une échelle et une rotation? Dans votre cas, sur une voiture, il
J'ai mis en œuvre une fonction qui a fait ce que vous avez mentionné et que j'ai reçu des résultats que si j'ai échoué l'image avant 1/16, chaque itération et si j'avais ajouté le contraste avec le logo avec sa projection. Il a littéralement couru pendant 14 heures avant de trouver quelque chose de proche de la même chose.
Je pense que vous pouvez essayer d'utiliser MSER Feature- https://fr.wikipedia.org/wiki/ Maximallally_stable_extremal_regions p>
Voir un exemple: https://www.mathworks.com/examples/matlab-computer-vision/mw/vision_product-textDetectionExample -Automativement-detect-and-recognize-text-in-natural-images P>
Il n'y a tout simplement aucun point qui qualifie de points clés (il est évident - il n'y a rien qui distingue un point sur un cercle d'un autre point de ce cercle). Vous devrez passer à une méthode sans clavier pour ce logo.
@etarion: Quelle serait une bonne méthode non clavier dans ce cas? J'ai entraîné une formation de caractéristiques de Haar et de les former à l'aide de Adaboost, mais cela fait plus de 3 semaines et c'est toujours sur la scène 3.