1. 程式人生 > >Pandas基礎(四):分組groupby的用法

Pandas基礎(四):分組groupby的用法

首先採用kesci的第三套練習作為groupby的初步用法介紹,後面有什麼收穫或者心得再補充。
原文連結:
kesci資料分析練習題
匯入庫和資料:

import pandas as pd
drinks = pd.read_csv('/drinks.csv')

用head方法檢視下匯入的資料,如下圖
在這裡插入圖片描述
1.檢視平均消耗的啤酒(beer)最多的大陸(continent):

drinks.groupby('continent').beer_servings.mean()

輸出:

continent
AF     61.471698
AS     37.045455
EU    193.777778
OC     89.687500
SA    175.083333
Name: beer_servings, dtype: float64

2.打印出每個大陸(continent)的紅酒消耗(wine_servings)的描述性統計值

drinks.groupby('continent').wine_servings.describe()

輸出如圖:
在這裡插入圖片描述
3.打印出每個大陸每種酒類別的消耗平均值

drinks.groupby('continent').mean()

輸出如圖:
在這裡插入圖片描述
4.打印出每個大陸對spirit飲品消耗的平均值,最大值和最小值

drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max'])

輸出如圖:
在這裡插入圖片描述