6
votes

Validation croisée k-pli stratifiée stratifiée randomisée dans Scikit-Apprendre?

Y a-t-il une manière intégrée pour obtenir Scikit-apprendre à effectuer une validation croisée kuff stratifiée kuff stratifiée? C'est l'une des méthodes CV les plus courantes et je suis surpris que je ne pouvais pas trouver une méthode intégrée pour le faire.

J'ai vu que cross_validation.kfolfol () a un drapeau de mélange, mais il n'est pas stratifié. Malheureusement, cross_validation.stratiififiedkold () n'a pas une telle option, et cross_validation.stratiififiedshufflesplit () ne produit pas de plis disjoints.

Est-ce que je manque quelque chose? Est-ce prévu?

(évidemment, je peux mettre en œuvre cela par moi-même)


0 commentaires

4 Réponses :


-3
votes

Autant que je sache, cela est réellement mis en œuvre dans Scikit-Apprendre.

"" " Stratifié Shufflesplit Cross Validation Itérateur

fournit des indices de train / test pour diviser les données dans des ensembles de test de train.

Cet objet de validation croisée est une fusion de stratifiékfold et Shufflesplit, qui retourne des plis randomisés stratifiés. Les plis sont fabriqués en préservant le pourcentage d'échantillons pour chaque classe.

Remarque: comme la stratégie de shufflesplit, scission aléatoire stratifiée ne garantissez pas que tous les plis seront différents, bien que cela soit toujours très probablement pour des ensembles de données importants. "" "


2 commentaires

Comme je l'ai écrit dans ma question, Stratietdifiedshufflesplit () ne fait pas une version mélangée de stratifiédkold (), c'est-à-dire que. Ceci est même mentionné dans la dernière phrase de votre réponse. Kold CV nécessite qu'il n'existe aucune intersection entre les plis et que leur syndicat est l'ensemble du jeu de données.


Ah, oui, les plis ne sont pas garantis disjoin. Désolé de ne pas lire à la fin de votre question ..



2
votes

Je pensais poster ma solution au cas où il est utile à quiconque. XXX


0 commentaires

5
votes

L'indicateur de mélange pour cross_validation.stratiififiedkoldkfold a été introduit dans la version actuelle 0.15:

http://scikit-learn.org/0.15/ Modules / générés / sklearn.cross_validation.stratiifiedkfold.html

Ceci peut être trouvé dans le changelog:

http://scikit-learn.org/stable/whats_new.html# Nouvelles fonctionnalités

Option shuffle pour cross_validation.stratiififiedkold. Par Jeffrey Blackburne.


0 commentaires

1
votes

Voici ma mise en œuvre de Stratified Shuffle Split dans Set d'entraînement et de test:

[1 2 3]
[1 2 3]


0 commentaires