1. 程式人生 > >Python+pandas計算資料相關係數

Python+pandas計算資料相關係數

本文主要演示pandas中DataFrame物件corr()方法的用法,該方法用來計算DataFrame物件中所有列之間的相關係數(包括pearson相關係數、Kendall Tau相關係數和spearman秩相關)。

>>> import numpy as np
>>> import pandas as pd

>>> df = pd.DataFrame({'A':np.random.randint(1, 100, 10),
     'B':np.random.randint(1, 100, 10),
     'C':np.random.randint(1, 100, 10)})
>>> df
     A   B   C
0   5  91   3
1  90  15  66
2  93  27   3
3  70  44  66
4  27  14  10
5  35  46  20
6  33  14  69
7  12  41  15
8  28  62  47
9  15  92  77


>>> df.corr()  # pearson相關係數
          A              B              C
A  1.000000 -0.560009  0.162105
B -0.560009  1.000000  0.014687
C  0.162105  0.014687  1.000000

>>> df.corr('kendall'# Kendall Tau相關係數

          A              B              C
A  1.000000 -0.314627  0.113666
B -0.314627  1.000000  0.045980
C  0.113666  0.045980  1.000000


>>> df.corr('spearman'# spearman秩相關

          A              B              C
A  1.000000 -0.419455  0.128051
B -0.419455  1.000000  0.067279
C  0.128051  0.067279  1.000000

----------相關閱讀----------

----------喜大普奔----------

1、繼《Python程式設計基礎》(2017年9月第5次印刷)、《Python程式設計(第2版)》(2017年9月第4次印刷)、《Python可以這樣學

》(2017年7月第3次印刷)系列圖書之後,董付國老師新書《Python程式設計開發寶典》已於2017年8月1日在清華大學出版社出版,並於2017年9月進行了第2次印刷。為慶祝新書《Python程式設計開發寶典》全面上架,清華大學出版社聯合“贛江圖書專營”淘寶店推出特價優惠活動,《Python程式設計開發寶典》原價69元,新書上架期間超低價39.8元,可以複製下面的連結使用瀏覽器開啟檢視圖書詳情和購買:

https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-14464369246.84.46f16db0roWfX4&id=557107249812&rn=339cbc9df2bac424664103917dedfbd2&abbucket=8&tbpm=3

2、董付國老師新作《中學生可以這樣學Python》已正式出版,很快就會在各大書城全面上架。