pandas中的pd.pivot_table()透視表功能

阿新 • • 發佈：2018-12-14

和excel一樣，pandas也有一個透視表的功能，具體demo如下：

import numpy as np
import pandas as pd
from pandas import Series, DataFrame


#顯示所有列
pd.set_option('display.max_columns', None)
#顯示所有行
pd.set_option('display.max_rows', None)
#設定value的顯示長度為100，預設為50
pd.set_option('max_colwidth',100)


df = pd.read_excel('./sales-funnel.xlsx' 
)
print(df.head())
'''
   Account                          Name            Rep       Manager  \
0   714466               Trantow-Barrows   Craig Booker  Debra Henley   
1   714466               Trantow-Barrows   Craig Booker  Debra Henley   
2   714466               Trantow-Barrows   Craig Booker  Debra Henley   
3   737550  Fritsch, Russel and Anderson   Craig Booker  Debra Henley   
4   146832                  Kiehn-Spinka  Daniel Hilton  Debra Henley   

       Product  Quantity  Price     Status  
0          CPU         1  30000  presented  
1     Software         1  10000  presented  
2  Maintenance         2   5000    pending  
3          CPU         1  35000   declined  
4          CPU         2  65000        won
''' 


print(pd.pivot_table(df, index=['Name']))
'''
                              Account   Price  Quantity
Name                                                   
Barton LLC                     740150   35000  1.000000
Fritsch, Russel and Anderson   737550   35000  1.000000
Herman LLC                     141962   65000  2.000000
Jerde-Hilpert                  412290    5000  2.000000
Kassulke, Ondricka and Metz    307599    7000  3.000000
Keeling LLC                    688981  100000  5.000000
Kiehn-Spinka                   146832   65000  2.000000
Koepp Ltd                      729833   35000  2.000000
Kulas Inc                      218895   25000  1.500000
Purdy-Kunde                    163416   30000  1.000000
Stokes LLC                     239344    7500  1.000000
Trantow-Barrows                714466   15000  1.333333
對名字進行了去重，將每個人的銷售記錄取進行統計，上例是求了均值。
這是由aggfunc引數來決定的。
''' 


print(pd.pivot_table(df, index=['Name'], aggfunc='sum'))
'''
                              Account   Price  Quantity
Name                                                   
Barton LLC                     740150   35000         1
Fritsch, Russel and Anderson   737550   35000         1
Herman LLC                     141962   65000         2
Jerde-Hilpert                  412290    5000         2
Kassulke, Ondricka and Metz    307599    7000         3
Keeling LLC                    688981  100000         5
Kiehn-Spinka                   146832   65000         2
Koepp Ltd                     1459666   70000         4
Kulas Inc                      437790   50000         3
Purdy-Kunde                    163416   30000         1
Stokes LLC                     478688   15000         2
Trantow-Barrows               2143398   45000         4
'''

print(pd.pivot_table(df, index=['Name', 'Rep', 'Manager']))
'''
                                                          Account    ...     Quantity
Name                         Rep           Manager                   ...             
Barton LLC                   John Smith    Debra Henley    740150    ...     1.000000
Fritsch, Russel and Anderson Craig Booker  Debra Henley    737550    ...     1.000000
Herman LLC                   Cedric Moss   Fred Anderson   141962    ...     2.000000
Jerde-Hilpert                John Smith    Debra Henley    412290    ...     2.000000
Kassulke, Ondricka and Metz  Wendy Yule    Fred Anderson   307599    ...     3.000000
Keeling LLC                  Wendy Yule    Fred Anderson   688981    ...     5.000000
Kiehn-Spinka                 Daniel Hilton Debra Henley    146832    ...     2.000000
Koepp Ltd                    Wendy Yule    Fred Anderson   729833    ...     2.000000
Kulas Inc                    Daniel Hilton Debra Henley    218895    ...     1.500000
Purdy-Kunde                  Cedric Moss   Fred Anderson   163416    ...     1.000000
Stokes LLC                   Cedric Moss   Fred Anderson   239344    ...     1.000000
Trantow-Barrows              Craig Booker  Debra Henley    714466    ...     1.333333
'''

print(pd.pivot_table(df, index=['Manager', 'Rep']))
# manager 和 rep 之間 存在 一對多的 關係
'''
                              Account         Price  Quantity
Manager       Rep                                            
Debra Henley  Craig Booker   720237.0  20000.000000  1.250000
              Daniel Hilton  194874.0  38333.333333  1.666667
              John Smith     576220.0  20000.000000  1.500000
Fred Anderson Cedric Moss    196016.5  27500.000000  1.250000
              Wendy Yule     614061.5  44250.000000  3.000000
'''

print(pd.pivot_table(df, index=['Manager', 'Rep'], values=['Price', 'Quantity']))
'''
                                    Price  Quantity
Manager       Rep                                  
Debra Henley  Craig Booker   20000.000000  1.250000
              Daniel Hilton  38333.333333  1.666667
              John Smith     20000.000000  1.500000
Fred Anderson Cedric Moss    27500.000000  1.250000
              Wendy Yule     44250.000000  3.000000
'''

print(pd.pivot_table(df, index=['Manager', 'Rep'], values=['Price', 'Quantity'], columns=['Product']))
'''
                               Price               ...    Quantity         
Product                          CPU Maintenance   ...     Monitor Software
Manager       Rep                                  ...                     
Debra Henley  Craig Booker   32500.0      5000.0   ...         NaN      1.0
              Daniel Hilton  52500.0         NaN   ...         NaN      1.0
              John Smith     35000.0      5000.0   ...         NaN      NaN
Fred Anderson Cedric Moss    47500.0      5000.0   ...         NaN      1.0
              Wendy Yule     82500.0      7000.0   ...         2.0      NaN
              
由以上輸出可以看出，當column指定為product之後，price和quantity進行了細分，將每個product的詳情列出。
另外還可以設定一個fill_value的引數，可以將nan填充為某個值。
'''

'''
總結：
    使用透視表之前，需要對原始資料有一個大概的瞭解，這樣生成的透視表才能夠有意義。
'''

pandas中的pd.pivot_table()透視表功能

和excel一樣，pandas也有一個透視表的功能，具體demo如下： import numpy as np import pandas as pd from pandas import Series, DataFrame #顯示所有列 pd.set_option('displa

pandas中pivot_table透視表

官方文件 pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None

pandas中pd.read_excel()方法中的converters參數

exc 對象實現編碼類型 div spa 方法情況最近用pandas的pd.read_excel()方法讀取excel文件時，遇到某一列的數據前面包含0（如010101）的時候，pd.read_excel()方法返回的DataFrame會將這一列視為int類型，即

04-3 pandas 中 pd.Categorical用法

pandas.Categorical（values，categories = None，ordered = None，dtype = None，fastpath = False ）[source] 表示經典R / S-plus方式的分類變數分類只能採用有限的，通常是固定數量的可能值（類

26、python資料表透視分析、交叉分析、實現透視表功能

交叉分析：通常用於分析兩個或兩個以上，分組變數之間的變數關係，以及交叉表形式進行變數間關係的對比分析定量、定量分組交叉定量、定性分析交叉定性、定性分組交叉 1 交叉統計函式 pivot_table(values,index,columns,aggfunc,fil

python中pivot table 透視表例項

下面是python透視表的簡單例項，希望對學習這一塊的朋友們能夠有所幫助。 import pandas as pd def pivot_table(): data_df = pd.read_csv("data.csv") # 形成基礎的成績表 pi

pandas中pd.groupby()的用法

在pandas中的groupby和在sql語句中的groupby有異曲同工之妙，不過也難怪，畢竟關係資料庫中的存放資料的結構也是一張大表罷了，與dataframe的形式相似。 import numpy as np import pandas as pd from pandas imp

Pyhton科學計算工具Pandas（十）—— 透視表和交叉表

Pyhton科學計算工具Pandas（十）—— 透視表和交叉表.ipynb 透視表 # 透視表：pivot_table # pd.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill

EXCEL學習，資料透視表功能

Excel -- 資料透視表基礎資料透視表（Pivot Table）是一種互動式的表，可以進行某些計算，如求和與計數等。所進行的計算與資料跟資料透視表中的排列有關。之所以

Pandas melt和pivot_table比excel透視表好用多了

Melt英語就是熔化,Pivot是轉動的意思，原表格 zt date 合計企財險家財險車險貨運險工程險責任險短期意外險短期健康險

pandas資料處理實踐五（透視表pivot_table、分組和透視表實戰Grouper和pivot_table）

透視表： DataFrame.pivot_table（values = None，index = None，columns = None，aggfunc ='mean'，fill_value = None，margin = False，dropna = True，margi

利用python/pandas/numpy做資料分析（三）-透視表pivot_table

透視表，根據一個或多個鍵進行聚合，並根據行列上的分組鍵將資料分配到各個矩形區域中. import numpy as np data=pd.DataFrame(np.arange(6).reshape((2,3)), index

小白學 Python 資料分析（12）：Pandas （十一）資料透視表（pivot_table）

![](https://cdn.geekdigging.com/python/spider-blog/Python_logo.jpg) > 人生苦短，我用 Python 前文傳送門： [小白學 Python 資料分析（1）：資料分析基礎](https://www.geekdigging.com/2020

Excel中資料透視表的使用(一)

資料存在表中，它只是一串串的數字，怎麼樣讓它活起來，更加的生動活潑，這裡就用到Excel表中的資料透視表。資料透視表（Pivot Table）是一種互動式的表，可以進行某些計算，如求和與計數等。所進行的計算與資料跟資料透視表中的排列有關。不管是WPS還是Microsoft O

pandas篩選出表中滿足另一個表所有條件的資料

今天記錄一下pandas篩選出一個表中滿足另一個表中所有條件的資料。例如： list1 結構: 名字，ID，顏色，數量，型別。list1 = [['a',1,255,100,'03'],['a',2,481,50,'06'],['a',47,255,500,'03']，['b

使用Pivot、Pivot_Table、Stack和Unstack等方法在Pandas中對資料變形（重塑）

Pandas是著名的Python資料分析包，這使它更容易讀取和轉換資料。在Pandas中資料變形意味著轉換表或向量（即DataFrame或Series）的結構，使其進一步適合做其他分析。在本文中，小編將舉例說明最常見的一些Pandas重塑功

四、優化資料庫，將不同功能的表分別建立在不同的庫中，儘量避免表的聯合查詢，重視索引

對於大型網站最終資料庫將會是瓶頸，因為對於網站程式來說可以架構負載平衡，讓多個伺服器來分擔執行程式，但要讓多個伺服器同時操作一個數據庫是比較困難的，也因此最終會選擇把一個庫分成多個庫的方式來讓多臺伺服器分擔資料庫的壓力，所以我建議在最初就根據功能將表分開放在不

asp.net mvc 註冊中的郵箱激活功能實現

名稱 work 點擊 rom urn 內容 string 電子郵件 amp 基本流程圖註冊頁面就不再寫出，現在將發送郵件的代碼粘貼出來 public ActionResult SendEmial() { int

Oracle12.2中新增的分區功能

功能防止新功能時間如果針對 alt 關鍵字只讀 Oracle 12.2已經發布一段時間，公網上也可以下載試用。針對12.2，partitioning（分區）也有了不少增強。自動列表分區多字段列表分區只讀分區分區維護時允許過濾在線轉換非分區表為分區表帶分區的外部

SQL Server2008中通過SQL獲取表結構

nds 數據 join xtend isn val data 運行 order SQL Server2008中通過SQL獲取表結構新增數據用戶，角色為public。映射到待獲取表結構的數據庫上，授與用戶在該數據庫上的身份為db_owner 運行例如以下SQL語

pandas中的pd.pivot_table()透視表功能

相關推薦