1. 程式人生 > >Numpy, Pandas, 及Python原生的排序方法

Numpy, Pandas, 及Python原生的排序方法

在numpy中:

argsort 返回排序後的index,據此可以排序。

#---------一維情形--------------
values=np.random.permutation(10)  #產生0到9的一個排列
values
Out[758]: array([6, 7, 0, 9, 5, 2, 4, 3, 8, 1])
indexer=np.argsort(values) #返回排序後的values的index
indexer
Out[761]: array([2, 9, 5, 7, 6, 4, 0, 1, 8, 3], dtype=int64)
values[indexer] #升序排列
Out[762
]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
values[indexer][::-1] #降序排列
Out[763]: array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])
#----------------二維情形-----------
arr=np.random.randn(20).reshape(4,5)
arr
Out[764]: 
array([[ 0.06508931,  0.56513883,  0.62546144, -1.28835261, -2.08906088],
       [ 1.5425056 ,  0.69033553,  1.60385421, -
1.52568607, -0.41737589],
       [-0.91894216,  2.08802511, -0.70341454, -0.08491163, -0.17903858],
       [-0.3333518 , -0.49513354,  1.56342694,  0.92744459,  0.48037342]])
arr[:,np.argsort(arr[2])] # 根據第2行從小到大排列
Out[765]: 
array([[ 0.06508931,  0.62546144, -2.08906088, -1.28835261,  0.56513883],
       [ 1.5425056 ,  1.60385421
, -0.41737589, -1.52568607, 0.69033553],
       [-0.91894216, -0.70341454, -0.17903858, -0.08491163,  2.08802511],
       [-0.3333518 ,  1.56342694,  0.48037342,  0.92744459, -0.49513354]])
arr[np.argsort(arr[:,0]),:] # 根據第0列從小到大排列
Out[766]: 
array([[-0.91894216,  2.08802511, -0.70341454, -0.08491163, -0.17903858],
       [-0.3333518 , -0.49513354,  1.56342694,  0.92744459,  0.48037342],
       [ 0.06508931,  0.56513883,  0.62546144, -1.28835261, -2.08906088],
       [ 1.5425056 ,  0.69033553,  1.60385421, -1.52568607, -0.41737589]])

在pandas中

使用sort_index 或者sort_values方法,預設在axis=0上排序(即根據某一列的值得大小排序),可以通過axis=1變成按某一行排序。by=index,index為想要排序的列或者行的index。

frame=DataFrame(arr)
frame
frame.sort_index(by=0,ascending=False) # 根據第0列的值進行排序,降序。
Out[767]: 
          0         1         2         3         4
1  1.542506  0.690336  1.603854 -1.525686 -0.417376
0  0.065089  0.565139  0.625461 -1.288353 -2.089061
3 -0.333352 -0.495134  1.563427  0.927445  0.480373
2 -0.918942  2.088025 -0.703415 -0.084912 -0.179039
frame.sort_values(by=0,ascending=True) # 作用同上,升序。
frame.sort_index(by=0,ascending=False,axis=1) # 根據第0行的值進行排序,降序。
Out[768]: 
          2         1         0         3         4
0  0.625461  0.565139  0.065089 -1.288353 -2.089061
1  1.603854  0.690336  1.542506 -1.525686 -0.417376
2 -0.703415  2.088025 -0.918942 -0.084912 -0.179039
3  1.563427 -0.495134 -0.333352  0.927445  0.480373
frame.sort_values(by=0,ascending=True,axis=1) # 作用同上,升序。

python自帶的sort方法

a=[3,1,5,4,2]
a.sort() # 預設升序排序
a
Out[776]: [1, 2, 3, 4, 5]
a.sort(reverse=True) #reverse 改變排序方式
a
Out[782]: [5, 4, 3, 2, 1]

sort 直接對原列表進行更改,如果想返回一個副本,而不改變原列表,可以使用sorted方法:

sorted(a)  
Out[792]:
[1, 2, 3, 4, 5]