J'ai une donnée avec 20 types différents (en tant que colonne), 10 sur 20 sont des informations utiles, je voulais les classer dans 10 classe différente à l'aide de la régression logistique, ce qui souhaite montrer le nombre d'enregistrements dans chaque classe. Les données ne sont pas étiquetées.
183820,9.17101300730551E+018,9,7,79,169,2017,10,17,6,3,0,1,1,0,0,0,0,0,0,637126.9861,5399201 183821,9.17101300712351E+018,9,7,72,147,2017,10,8,6,3,6,2,0,1,1,0,0,0,0,639046.3051,5363761.
3 Réponses :
diviser chaque ligne et faire une table comme celle-ci , puis utilisez la fonction de régression logistique que vous préférez et obtenez le résultat. p> p>
Je suis confondu sur l'algorithme de régression logistique, pouvez-vous partager un lien?
Vous pouvez lire les données d'un fichier CSV, puis essayer la méthode de clustering pour la classification. P>
Essayez la référence ci-dessous: P>
1) Une approche d'ensemble robuste pour apprendre des données positives et non habillées à l'aide de modèles de base SVM http: // arxiv. Org / ABS / 1402.3144 (publié en neuroocomque) P>
2) Évaluation des classificateurs binaires utilisant uniquement des données positives et non étiquetées: http://arxiv.org/abs/1504.06837 p>