9
votes

Comment convertir la voix humaine en format numérique?

Je travaille sur un projet où le système biométrique est utilisé pour sécuriser le système. Nous prévoyons d'utiliser la voix humaine pour sécuriser le système.

idée est de permettre à la personne de dire que des mots ou des phrases et un système stockeront cette voix au format numérique. La prochaine personne veut entrer dans le système, il / elle doit parler des mots qui peuvent être différents ou non des mots utilisés précédemment.

Nous ne voulons pas faire correspondre des mots mais que vous voulez correspondance de la fréquence vocale.

J'ai lu certains documents de recherche concernant ce système, mais ces documents n'ont aucun détail de mise en œuvre.

Voulez-vous simplement savoir s'il existe un logiciel / API qui peut convertir une voix analogique en format numérique et nous racontera également la fréquence de la voix.

Jusqu'à présent, je travaillais sur des applications Web normales, donc je connais des API et des plates-formes normales telles que Java Ee, C #, etc. Mais je n'ai aucune expérience de ce type d'application.

S'il vous plaît éclairer !!!


3 commentaires

Je me demandais juste à quel point cela serait sécurisé. Si facile d'enregistrer une voix de quelqu'un et de le lire!


Hé, vous avez la solution de cette question? Si oui, comment avez-vous fait cela? La même chose est ici que je dois faire .. et vous n'avez aucune idée, pouvez-vous me montrer le chemin comment y parvenir.?


Voir cette question, Stackoverflow.com/questions/8724454/java-voice-biometric


3 Réponses :


2
votes

Ceci est aussi bon point de départ que tout: http://marsyas.info/

C'est un cadre logiciel open source pour le traitement audio. Ils ont énuméré un groupe de projets qui ont utilisé leur cadre de différentes manières afin que vous puissiez probablement vous inspirer. http://marsyas.info/about/projects . Le projet de telligence notamment le plus proche de vos besoins, car il a été utilisé audio audio: http: // marsyas.info/about/projects#5Teligence


0 commentaires

2
votes

2 commentaires

Regardez également les produits d'Agnitio: agnitio.es/producto.php?id_producto=1<


Agnitio a-t-il une version d'essai que nous pouvons tester?



2
votes

Il y a deux étapes sur un projet comme celui-ci, je crois:

première étape consisterait à enregistrer la voix d'une entrée analogique au format numérique (supposons WAV-PCM). Pour cela, vous pouvez utiliser API DirectShow dans C # ou Standard WAV-in comme dans ce projet: http://www.codeproject.com/kb/audio-video/cswavrec.aspx . Vous pouvez envisager de compresser vos fichiers audio plus tard. Il existe de nombreuses options pour cela, sous Windows, vous pouvez envisager de prendre en compte Windows Media Format SDK afin d'éviter les problèmes de licence avec d'autres formats.

La deuxième étape consiste à créer ou à utiliser un cadre de reconnaissance vocale, si vous souhaitez créer un cadre de reconnaissance, vous devrez probablement définir un ensemble de "fonctionnalités" pour vos fragments sonores et sélectionnez + Mettre en place un algorithme de reconnaissance. Il existe de nombreuses aînées disponibles pour cela, les ganglières IEEE AMD ACM.OREG sont généralement de bonnes sources. Si vous souhaitez utiliser un cadre existant, vous souhaiterez peut-être envisager Nuance Recognizer (commercial) ou http://cmusphinx.sourceforge.net < / a> (open source).

J'espère que cela aide.


0 commentaires