6
votes

Reconnaissance de la parole sur iPhone

Je dois développer une application iPhone qui reconnaît la parole et basée sur le résultat qu'il effectue d'autres tâches.

Je sais que l'iPhone 3.0 ne prend pas en charge la reconnaissance vocale et je dois mettre en œuvre des logiciels de reconnaissance vocale sur le côté serveur. Je sais que cette chose seulement, puisque je suis Newbie, je ne sais pas comment faire face à cela.

Moyenne du logiciel que j'ai besoin d'acheter et de la mettre en œuvre au serveur, et comment utiliser ce service ??


3 commentaires

qu'est-ce que tu veux dire côté serveur?


Il signifie "pas sur le téléphone". Cela pourrait aider à spécifier s'il y a un système d'exploitation de serveur particulier que vous devez utiliser.


Le côté serveur signifie envoyer les données audio à un serveur, reconnaître le discours (en utilisant beaucoup de ressources et de mémoire) et d'envoyer la sortie de texte résultante vers le téléphone. Google fait-il qu'avec OCR et la traduction automatique de l'Android, par exemple: prenez une photo de texte étranger, elle l'envoie au serveur, au SCRS et le traduit en anglais et envoie le résultat du texte.


4 Réponses :


1
votes

Je ne pense pas qu'il existe de nombreuses suites logicielles de reconnaissance vocale du serveur. Les versions open source semblent pratiquement inexistantes. Vous voudrez peut-être jeter un coup d'œil à ce SDK:

http://www.scratd.com / Doc / 17247334 / Communiqués de Créaction-Speech-Speech-Speech-reconnaissance-SDK http://www.creaceed.com/weblog/eedvocalsdk.html

Cela pourrait vous permettre de faire ce que vous voulez sur l'iPhone lui-même.


0 commentaires

7
votes

Le meilleur package de reconnaissance vocale ouverte que je connaisse est Sphinx.
http://cmusphinx.sourceforge.net/

Sinon, je suggérerais de regarder dans un logiciel de nuance.

La reconnaissance vocale actuelle fait bien avec un ensemble de grammaire limitée (si vous savez ce qu'elles vont dire). La dictée ouverte ne fonctionne toujours pas assez bien pour être utilisée de manière fiable pour de nombreuses applications. Gardez cela à l'esprit lorsque vous développez votre application. J'espère maintenant que Google entrave dans le jeu de transcription (avec Google Voice) qui devrait commencer à s'améliorer. Je pense qu'ils auront probablement quelque chose dans le futur.


1 commentaires

1
votes

Obtenir que le droit de reconnaissance vocale est très délicat et un domaine de recherche actif.

Il existe quelques solutions open source, cependant, voir ici . Un nouveau neuf est Echarpe , mais je ne sais pas si qui est prêt à utiliser ou plutôt juste une preuve de concept.


0 commentaires

0
votes

Consultez le Programme de développeur de Nuance Mobile . Nous avons des bibliothèques pour différentes plateformes (y compris IOS) et un service HTTP si nécessaire.


0 commentaires