0
votes

Comment faire une classification multiclasse pour les données non étiquetées dans Python?

J'ai une donnée avec 20 types différents (en tant que colonne), 10 sur 20 sont des informations utiles, je voulais les classer dans 10 classe différente à l'aide de la régression logistique, ce qui souhaite montrer le nombre d'enregistrements dans chaque classe. Les données ne sont pas étiquetées.

183820,9.17101300730551E+018,9,7,79,169,2017,10,17,6,3,0,1,1,0,0,0,0,0,0,637126.9861,5399201
183821,9.17101300712351E+018,9,7,72,147,2017,10,8,6,3,6,2,0,1,1,0,0,0,0,639046.3051,5363761.


0 commentaires

3 Réponses :


2
votes

diviser chaque ligne et faire une table comme celle-ci xxx

, puis utilisez la fonction de régression logistique que vous préférez et obtenez le résultat.


1 commentaires

Je suis confondu sur l'algorithme de régression logistique, pouvez-vous partager un lien?



1
votes

Vous pouvez lire les données d'un fichier CSV, puis essayer la méthode de clustering pour la classification.


0 commentaires

-1
votes

Essayez la référence ci-dessous:

1) Une approche d'ensemble robuste pour apprendre des données positives et non habillées à l'aide de modèles de base SVM http: // arxiv. Org / ABS / 1402.3144 (publié en neuroocomque)

2) Évaluation des classificateurs binaires utilisant uniquement des données positives et non étiquetées: http://arxiv.org/abs/1504.06837


0 commentaires