Y a-t-il une manière intégrée pour obtenir Scikit-apprendre à effectuer une validation croisée kuff stratifiée kuff stratifiée? C'est l'une des méthodes CV les plus courantes et je suis surpris que je ne pouvais pas trouver une méthode intégrée pour le faire. P>
J'ai vu que Est-ce que je manque quelque chose? Est-ce prévu? P>
(évidemment, je peux mettre en œuvre cela par moi-même) p> cross_validation.kfolfol () code> a un drapeau de mélange, mais il n'est pas stratifié. Malheureusement,
cross_validation.stratiififiedkold () code> n'a pas une telle option, et
cross_validation.stratiififiedshufflesplit () code> ne produit pas de plis disjoints. P>
4 Réponses :
Autant que je sache, cela est réellement mis en œuvre dans Scikit-Apprendre. p>
p>
"" " Stratifié Shufflesplit Cross Validation Itérateur P>
fournit des indices de train / test pour diviser les données dans des ensembles de test de train. P>
Cet objet de validation croisée est une fusion de stratifiékfold et Shufflesplit, qui retourne des plis randomisés stratifiés. Les plis sont fabriqués en préservant le pourcentage d'échantillons pour chaque classe. P>
Remarque: comme la stratégie de shufflesplit, scission aléatoire stratifiée ne garantissez pas que tous les plis seront différents, bien que cela soit toujours très probablement pour des ensembles de données importants. "" " p>
Comme je l'ai écrit dans ma question, Stratietdifiedshufflesplit () ne fait pas une version mélangée de stratifiédkold (), c'est-à-dire que. Ceci est même mentionné dans la dernière phrase de votre réponse. Kold CV nécessite qu'il n'existe aucune intersection entre les plis et que leur syndicat est l'ensemble du jeu de données.
Ah, oui, les plis ne sont pas garantis disjoin. Désolé de ne pas lire à la fin de votre question ..
Je pensais poster ma solution au cas où il est utile à quiconque.
L'indicateur de mélange pour http://scikit-learn.org/0.15/ Modules / générés / sklearn.cross_validation.stratiifiedkfold.html P>
Ceci peut être trouvé dans le changelog: p>
http://scikit-learn.org/stable/whats_new.html# Nouvelles fonctionnalités p>
Option shuffle pour cross_validation.stratiififiedkold. Par Jeffrey
Blackburne. P>
blockQuote> cross_validation.stratiififiedkoldkfold code> a été introduit dans la version actuelle 0.15: P>
Voici ma mise en œuvre de Stratified Shuffle Split dans Set d'entraînement et de test:
[1 2 3] [1 2 3]