mon ensemble de données Le jeu de données montre les comptes et le débit de personnes avec des noms différents. P> Je veux connaître la corrélation du taux avec les comptes. p> Par exemple, si les comptes sont élevés, la vitesse est élevée ou faible. p> Quelle méthode est juste pour montrer la connexion entre les deux? .. p> p>
3 Réponses :
Vous devez simplement utiliser la fonction Pandas pour calculer la corrélation:
df.rate.corr(df.counts)
Les nombres négatifs sortent, comment devrais-je prendre cela?
En savoir plus sur le coefficient de Pearson ici ici EN.Wikipedia.org/wiki/pearson_corrélation_coefficient . Un nombre négatif indique une corrélation linéaire négative entre votre série.
Vous pouvez essayer avec NUMPY pour obtenir des coefficients entre deux variables.
[[1. 0.84965646] [0.84965646 1. ]]
Vérifiez ce code: qui me donne la matrice de corrélation suivante: p> P> < P> Comme vous pouvez voir la corrélation entre
Taux code> et
Nombre code> est assez élevé:
0.85 code>. Toutefois, considérez que je n'ai utilisé que les données que vous avez signalées ci-dessus, à seulement 8 lignes, vous devriez peut-être utiliser un échantillon plus élevé pour des résultats plus fiables. P> P>
La question n'est pas claire pour moi
Pandas a un Fonction de corrélation . Est-ce que tu as tes essayé?
@Yoben_s Je veux voir le changement de taux en fonction du nombre de comptes. Par exemple, si les comptes sont élevés, le taux sera-t-il plus élevé ou plus bas? De cette façon, je veux analyser la corrélation entre les deux, mais je ne sais pas comment aborder
@Markmeyer Oui, mais ça ne vient pas intuitivement.