Je veux tester mon algorithme de genre de musique dans l'ensemble de données public pour comparer avec d'autres algorithmes préexistés. Dans le cas de Mirex, toutes les données ne sont pas disponibles. J'ai trouvé que GTZAN DataSet est disponible dans un lien (marsyas.info/download/data_sets) Mais, ce n'est pas disponible pour moi maintenant. P>
Savez-vous comment puis-je obtenir ces données? Parce que j'utilise une autre fonctionnalité que MFCC, j'ai donc besoin d'une annotation de genre ainsi que de la musique. p>
Merci d'avance. P>
4 Réponses :
Je recherche également un tel repère.
Je trouve cela sur un papier appelé "du son à" sens "via une extraction de fonctionnalités et de l'apprentissage automatique - dérivant des descripteurs de haut niveau pour caractériser la musique":
p>
Il y a des efforts actuellement entrepris dans la musique Communauté de récupération d'informations pour compiler de grands référentiels de Musique étiquetée qui peut être mise à la disposition de tous les chercheurs intéressés sans problèmes de copyright. Des exemples remarquables de cela sont Masa-Taka Base de données de musique RWC de Goto (http://staff.eist.go.jp/m.goto/rwc-mdb), le Imirsel (Évaluation du système de récupération de l'information de musique internationale Laboratoire) Projet à l'Université de l'Illinois à Urbana-Champaign (http://www.music-ir.org/evaluation - Voir aussi [12]), et le nouveau Initiative Freesound (http://freesound.iua.upf.edu). P> blockQuote>
Mais je n'ai pu trouver rien d'utile d'eux. La procédure d'obtention d'une copie de la première base de données mentionnée est décrire ici a> mais il semble assez sophistiqué! p>
On dirait que vous voulez que vous souhaitiez le Million Songs Dataset , qui a, bien, un Millions de chansons, avec des fonctionnalités audio, des balises, des paroles, etc., relatives à Echonest and Labrosa. Bien sûr, cela suppose que vous travaillez de métadonnées et de transcriptions de musique. P>
Si vous recherchez l'audio brut ... c'est une autre affaire. Je ne sais pas si vous souhaitez publier, auquel cas le droit de la propriété intellectuelle pourrait être un facteur plus important. Mais pour des tests privés, je soupçonne que vous pouvez simplement utiliser des fichiers de votre propre bibliothèque musicale (par exemple, les téléchargements iTunes ont déjà une balise de genre pour tester votre algorithme). p>
Disclaimer: Je ne suis pas un avocat. Prenez mes conseils juridiques à vos risques et périls. P>
Je ne pense pas que les paroles de la MSD.
EDIT: Maintenant, il semble que la page Marsyas est hébergée à marsyasweb.appot.com et vous pouvez Trouvez des liens vers la base de données GTZAN dans Ensembles de données Sous-pages. P>
Je cherchais également un jeu de données GTZAN pour mon projet universitaire et j'ai découvert que Mais soyez conscient de la licence avant d'utiliser des jeux de données
(Info de la page de téléchargement de marsyas mis en cache): P>
Ce jeu de données a été utilisé pour le document bien connu de la classification de genre "Classification de la musique musicale des signaux audio" de G. Tzanetakis et de P. Cook dans les transactions IEEE sur l'audio et le traitement de la parole 2002. P>
Malheureusement, la base de données a été collectée progressivement et très tôt dans mes recherches, donc je n'ai aucun titre (et évidemment aucune autorisation de copyright, etc.). Les fichiers ont été collectés en 2000-2001 à partir de diverses sources, notamment des CD individuelles, de la radio, des enregistrements de microphone, afin de représenter une variété de conditions d'enregistrement. Neury que je l'ai fourni aux chercheurs sur demande principalement à des fins de comparaison, etc. Veuillez contacter George Tzanetakis (gtzan@cs.uvic.ca) si vous souhaitez publier des résultats expérimentaux à l'aide de cet ensemble de données. P>
Le jeu de données se compose de 1000 pistes audio de 30 secondes de long. Il contient 10 genres, chacun représentant de 100 pistes. Les pistes sont tous des fichiers audio de 22050Hz mono 16 bits en format .wav. P>
blockQuote>
Vous serez peut-être également intéressé par d'autres jeux de données tels que Magnatagatune - http://marsyas.info code> est en panne, donc j'ai utilisé Cache Web Google pour marsyas.info/download/Data_sets < / a> (Vérifiez-le pour plus d'informations). Heureusement, les ensembles de données GTZAN sont hébergés sur
http://opihi.cs.uvic.ca code> et vous pouvez
! p>
http://tagatune.org/magnatagatune.html code>. P>
Je me rends compte que cela a été répondu il y a longtemps, mais je pensais qu'il était nécessaire de mettre à jour ce fil avec ma réponse. p>
Selon votre mise en œuvre de la classification de genre, que je suppose que c'est un contenu basé sur le contenu (spectrogrammes sont généralement utilisés dans des approches d'apprentissage en profondeur, vous devez également mentionner MFCCS), vous pouvez trouver qu'il est facile de trouver des ensembles de données avec des fonctionnalités déjà extraites. de l'audio. C'est probablement le moyen le plus simple de comparer directement vos résultats contre d'autres approches. P>
Pour cela, vous pouvez utiliser la base de données de musique latin, que vous pouvez obtenir de ici , l'archive de musique gratuite, que vous pouvez obtenir de ici A >, la musique grecque ou le jeu de données audio, que vous pouvez obtenir de Ici , le jeu de données CAL10K / CAL500, que vous pouvez obtenir de ici , et à peu près quelles que soient les autres jeux de données, vous pouvez gratter de ce site web . p>
Sinon, ce que je recommanderais de faire est d'extraire ces fonctions vous-même, en utilisant certaines bibliothèques d'extraction de fonctionnalités ou des boîtes à outils, de cette façon le GTZAN ou Datasets de bal de bal peut être utilisé (ou quoi que ce soit d'autre a des fichiers audio). BetaTester07 EM> Le lien est toujours en train de travailler pour le moment! P>
Les méthodes d'extraction des fonctionnalités que je trouve les plus faciles à utiliser sont Jaudio ou Librosa , pour Java et Python respectivement. Avec Jaudio, vous pouvez également l'appeler à partir de la ligne de commande ou simplement utiliser l'interface graphique, elle accepte également des lots de combats afin que vous puissiez traiter une version de fichiers audio en une seule fois. En utilisant ces méthodes d'extraction, vous pouvez obtenir toutes les fonctionnalités correspondant à celles standard si elles élevent leurs têtes laides dans un papier que vous essayez de mettre en œuvre ou de comparer. p>
Soyez prudent en utilisant ces jeux de données «de référence» standard, car il y a toujours des défauts avec eux. Pour cela, vous voulez vérifier Sturm's travail . P>
espère que cela aide :) p>