Python： Pandas的DataFrame如何按指定list排序

阿新 • • 發佈：2017-06-14

不同需求 per log title 表示 anr lac 使用

本文首發於微信公眾號“Python數據之道”（ID：PyDataRoad）

前言

寫這篇文章的起由是有一天微信上一位朋友問到一個問題，問題大體意思概述如下：

現在有一個pandas的Series和一個python的list，想讓Series按指定的list進行排序，如何實現？

這個問題的需求用流程圖描述如下：

技術分享

我思考了一下，這個問題解決的核心是引入pandas的數據類型“category”，從而進行排序。

在具體的分析過程中，先將pandas的Series轉換成為DataFrame，然後設置數據類型，再進行排序。思路用流程圖表示如下：

技術分享

分析過程

引入pandas庫

import pandas as pd

構造Series數據

s = pd.Series({‘a‘:1,‘b‘:2,‘c‘:3})
s

a    1
b    2
c    3
dtype: int64

s.index

Index([‘a‘, ‘b‘, ‘c‘], dtype=‘object‘)

指定的list，後續按指定list的元素順序進行排序

list_custom = [‘b‘, ‘a‘, ‘c‘]
list_custom

[‘b‘, ‘a‘, ‘c‘]

將Series轉換成DataFrame

df = pd.DataFrame(s)
df = df.reset_index()
df.columns = [‘words‘ 
, ‘number‘]
df

	words	number
0	a	1
1	b	2
2	c	3

設置成“category”數據類型

# 設置成“category”數據類型
df[‘words‘] = df[‘words‘].astype(‘category‘)

# inplace = True，使 recorder_categories生效
df[‘words‘ 
].cat.reorder_categories(list_custom, inplace=True)

# inplace = True，使 df生效
df.sort_values(‘words‘, inplace=True)
df

	words	number
1	b	2
0	a	1
2	c	3

指定list元素多的情況：

若指定的list所包含元素比Dataframe中需要排序的列的元素多，怎麽辦？

reorder_catgories（）方法不能繼續使用，因為該方法使用時要求新的categories和dataframe中的categories的元素個數和內容必須一致，只是順序不同。
這種情況下，可以使用 set_categories()方法來實現。新的list可以比dataframe中元素多。

list_custom_new = [‘d‘, ‘c‘, ‘b‘,‘a‘,‘e‘]
dict_new = {‘e‘:1, ‘b‘:2, ‘c‘:3}
df_new = pd.DataFrame(list(dict_new.items()), columns=[‘words‘, ‘value‘])
print(list_custom_new)
df_new.sort_values(‘words‘, inplace=True)
df_new

[‘d‘, ‘c‘, ‘b‘, ‘a‘, ‘e‘]

	words	value
0	b	2
1	c	3
2	e	1

df_new[‘words‘] = df_new[‘words‘].astype(‘category‘)

# inplace = True，使 set_categories生效
df_new[‘words‘].cat.set_categories(list_custom_new, inplace=True)

df_new.sort_values(‘words‘, ascending=True)

	words	value
1	c	3
0	b	2
2	e	1

指定list元素少的情況：

若指定的list所包含元素比Dataframe中需要排序的列的元素少，怎麽辦？

這種情況下，set_categories()方法還是可以使用的，只是沒有的元素會以NaN表示

註意下面的list中沒有元素“b”

list_custom_new = [‘d‘, ‘c‘,‘a‘,‘e‘]
dict_new = {‘e‘:1, ‘b‘:2, ‘c‘:3}
df_new = pd.DataFrame(list(dict_new.items()), columns=[‘words‘, ‘value‘])
print(list_custom_new)
df_new.sort_values(‘words‘, inplace=True)
df_new

[‘d‘, ‘c‘, ‘a‘, ‘e‘]

	words	value
0	b	2
1	c	3
2	e	1

df_new[‘words‘] = df_new[‘words‘].astype(‘category‘)

# inplace = True，使 set_categories生效
df_new[‘words‘].cat.set_categories(list_custom_new, inplace=True)

df_new.sort_values(‘words‘, ascending=True)

	words	value
0	NaN	2
1	c	3
2	e	1

總結

根據指定的list所包含元素比Dataframe中需要排序的列的元素的多或少，可以分為三種情況：

相等的情況下，可以使用 reorder_categories和 set_categories方法；
list的元素比較多的情況下，可以使用set_categories方法；
list的元素比較少的情況下，也可以使用set_categories方法，但list中沒有的元素會在DataFrame中以NaN表示。

源代碼

需要的童鞋可在微信公眾號“Python數據之道”（ID：PyDataRoad）後臺回復關鍵字獲取視頻，關鍵字如下：

“2017-025”（不含引號）

Python： Pandas的DataFrame如何按指定list排序

不同需求 per log title 表示 anr lac 使用本文首發於微信公眾號“Python數據之道”（ID：PyDataRoad）前言寫這篇文章的起由是有一天微信上一位朋友問到一個問題，問題大體意思概述如下：現

給Java.util.List按指定順序排序

開發中有時需要給List排序，大家都知道List本身是排序的，但它內部排序是按照存入順序排序的，故而有時候這並不是我們所需要的。為此，我們需要按照我們的意願把List裡面的object排序。例子：實現List裡面Object類的配需 Object裡面有一個時間欄位

輕松Angularjs實現表格按指定列排序

filter click arc 我們點擊 ont 想要 log ner 　　angular表格點擊序號進行升序，再次點擊進行降序排序，在輸入框輸入信息，出現相對應數據的那一行。　html: <input type="text" ng-model="se

python ：基礎資料型別list , tuple , dict, set方法彙總

#基礎資料型別方法（1）list常用方法彙總‘ （1.1）新增類 append(*args,**kwarsg) # 向列表的尾部追加元素 extend(iterable) #向列表的尾部追加可迭代物件元素 list = [] list_add = [1,2,

Angularjs實現表格按指定列排序

Mysql按指定順序排序的兩種寫法

SELECT `ID` FROM wp_posts WHERE `ID` in (1,2,3,4,5) ORDER BY FIELD(`ID`,5,4,3,1,2); // 純數字欄位不用處理引號，比較好拼接 SELECT `ID` FROM wp_posts WHERE `ID` in (1,2,

oracle中使用instr按指定順序排序

select sei.office_name, nvl(ROUND(AVG(sei.COMP_CHECK), 2), 0) avg_score from SECURITY_EMPLOYEE_INFO

Python：字串中指定位置插入一個字元

str_1='wo shi yi zhi da da niu/n'str_list=list(str_1) nPos=str_list.index('/') str_list.insert(nPos,',') str_2="".join(str_list)print(str_2)

GetFiles()後對檔案按指定方式排序

原文C#關鍵程式碼部分public partial class SortFileList : System.Web.UI.Page { protected void Page_Load(object sender, EventArgs e) {

SqlServer 按指定順序排序

第一種方式：select * from tabname where 1=1 order by CHARINDEX(RTRIM(CAST(列名 as NCHAR)),優先順序1內容,優先順序2內容,優先

PHP實現多維數組按指定值排序

har get 二維數組 rtb app tis UNC bsp function 主要用到的PHP函數 array_multisort() 1.先實現指定多維數組一個字段排序根據二維數組的id值來排序，轉換後的數組格式如下： function

Python-excel按指定順序自動排序

import openpyxl wb1=openpyxl.load_workbook('tsp_result.xlsx') wb2=openpyxl.load_workbook('144.xlsx') sheet1=wb1.get_active_sheet() s

每日一python（4）：python對字典按key排序和按value排序

1、首先介紹一下字典的基本用法 d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59, 'Paul': 74 } print(d.keys()) print(d.values()) print(d.items()) sum = 0 for

Python - 字典按值(value)排序

key list odi script dcl nes spl ava port 字典安值排序是一個偽命題. 字典本身是不能被排序的, 已經依照關鍵字(key)排序, 可是列表(list)和元組(tuple)能夠排序, 所以字典須要轉換列表後排序.

Python：Anaconda安裝虛擬環境到指定路徑

rdquo oat otto 環境 wim uri blog target images 1 曾經的困擾有段時間，想使用基於不同python版本的anaconda，就直接從官網下載了兩個不同的anaconda版本進行安裝。剛開始的時候，還覺得也沒啥問題。用了一小

python 生成器按指定大小讀取文件

env yield imp read else 生成指定大小 turn sys.argv #!/usr/bin/env python import osimport sys def read_file(fpath): 　　Block_Size = 1024 　

python：print含有中文的list

replace imp itl print ins 中文 lis base git Python 的 List 如果有中文的話, 會印出 \xe4\xb8... 等等的編碼（如下所示）, 要如何印出中文呢? >>> a = [‘中文‘, ‘ab‘]&g

python：dict vs list vs set

blog ddb nbsp 得出 replace 我們通過自身插入 list: 有序 tuple: 另一種有序列表叫元組：tuple。tuple和list非常類似，但是tuple一旦初始化就不能修改 dict：無序對比：和list比較，dict有以下幾個特點

python根據字典的值進行排序：

字典 blog 取出運行 log 排序規則 style value 代碼實現有一個列表嵌套字典：[{"a": 5}, {"b": 4}, {"c": 1},{"e": 2}, {"d": 3}], 他們的值是不一樣的，現在要根據值進行排序：思路：對於值排序，首先把字

Python：列表list

正向 class strong step 自動調用使用 list 可用 ini 1）列表反序 A、list.reverse()：將列表反序； l = [1, 2, 3, 4, 5] print(l.reverse()) -->[5, 4, 3, 2, 1] B、

Python： Pandas的DataFrame如何按指定list排序

前言

分析過程

指定list元素多的情況：

指定list元素少的情況：

總結

相關推薦