0
votes

Comment montrer la corrélation entre les comptes et le taux?

mon ensemble de données xxx

Le jeu de données montre les comptes et le débit de personnes avec des noms différents.

Je veux connaître la corrélation du taux avec les comptes.

Par exemple, si les comptes sont élevés, la vitesse est élevée ou faible.

Quelle méthode est juste pour montrer la connexion entre les deux? ..


4 commentaires

La question n'est pas claire pour moi


Pandas a un Fonction de corrélation . Est-ce que tu as tes essayé?


@Yoben_s Je veux voir le changement de taux en fonction du nombre de comptes. Par exemple, si les comptes sont élevés, le taux sera-t-il plus élevé ou plus bas? De cette façon, je veux analyser la corrélation entre les deux, mais je ne sais pas comment aborder


@Markmeyer Oui, mais ça ne vient pas intuitivement.


3 Réponses :


1
votes

Vous devez simplement utiliser la fonction Pandas pour calculer la corrélation:

df.rate.corr(df.counts)


2 commentaires

Les nombres négatifs sortent, comment devrais-je prendre cela?


En savoir plus sur le coefficient de Pearson ici ici EN.Wikipedia.org/wiki/pearson_corrélation_coefficient . Un nombre négatif indique une corrélation linéaire négative entre votre série.



1
votes

Vous pouvez essayer avec NUMPY pour obtenir des coefficients entre deux variables.

[[1.         0.84965646] 
 [0.84965646 1.        ]]


0 commentaires

2
votes

Vérifiez ce code: xxx

qui me donne la matrice de corrélation suivante:

 Entrez la description de l'image ici < P> Comme vous pouvez voir la corrélation entre Taux et Nombre est assez élevé: 0.85 . Toutefois, considérez que je n'ai utilisé que les données que vous avez signalées ci-dessus, à seulement 8 lignes, vous devriez peut-être utiliser un échantillon plus élevé pour des résultats plus fiables.


0 commentaires