1. 程式人生 > >徹底搞懂Python切片操作

徹底搞懂Python切片操作

 
  在利用Python解決各種實際問題的過程中,經常會遇到從某個物件中抽取部分值的情況,切片操作正是專門用於完成這一操作的有力武器。理論上而言,只要條件表示式得當,可以通過單次或多次切片操作實現任意切取目標值。切片操作的基本語法比較簡單,但如果不徹底搞清楚內在邏輯,也極容易產生錯誤,而且這種錯誤有時隱蔽得比較深,難以察覺。本文通過詳細例子總結歸納了切片操作的各種情況。若有錯誤和不足之處請大牛指正!


一、Python可切片物件的索引方式

Python可切片物件的索引方式包括:正索引和負索引兩部分。
如下圖所示,以a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]為例:


二、Python切片操作的一般方式

一個完整的切片表示式包含兩個“:”,用於分隔三個引數(start_index、end_index、step),當只有一個“:”時,預設第三個引數step=1。

切片操作基本表示式:object[start_index : end_index : step]

step:正負數均可,其絕對值大小決定了切取資料時的“步長”,而正負號決定了“切取方向”,正表示“從左往右”取值,負表示“從右往左”取值。當step省略時,預設為1,即從左往右以增量1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情說三遍!

start_index:表示起始索引(包含該索引本身);該引數省略時,表示從物件“端點”開始取值,至於是從“起點”還是從“終點”開始,則由step引數的正負決定,step為正從“起點”開始,為負從“終點”開始。

end_index:表示終止索引(不包含該索引本身);該引數省略時,表示一直取到資料”端點“,至於是到”起點“還是到”終點“,同樣由step引數的正負決定,step為正時直到”終點“,為負時直到”起點“。


三、Python切片操作詳細例子

以下示例均以列表a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]為例:
>>> a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

1.切取單個值
>>> a[0]
0
>>> a[-4]
6
2.切取完整物件
>>> a[:] # 從左往右
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> a[::] # 從左往右
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> a[::-1] # 從右往左
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
3.start_index和end_index全為正(+)索引的情況
>>> a[1:6] # step=1,從左往右取值,start_index=1到end_index=6同樣表示從左往右取值。
[1, 2, 3, 4, 5]

>>>a[1:6:-1] # step=-1,決定了從右往左取值,而start_index=1到end_index=6決定了從左往右取值,兩者矛盾。
>>> [] # 輸出為空列表,說明沒取到資料。

>>>a[6:1] # step=1,決定了從左往右取值,而start_index=6到end_index=1決定了從右往左取值,兩者矛盾。
>>> [] # 同樣輸出為空列表。

>>>a[:6] # step=1,從左往右取值,從“起點”開始一直取到end_index=6。
>>> [0, 1, 2, 3, 4, 5]

>>>a[:6:-1] # step=-1,從右往左取值,從“終點”開始一直取到end_index=6。
>>> [9, 8, 7]

>>>a[6:] # step=1,從左往右取值,從start_index=6開始,一直取到“終點”。
>>> [6, 7, 8, 9]

>>>a[6::-1] # step=-1,從右往左取值,從start_index=6開始,一直取到“起點”。
>>> [6, 5, 4, 3, 2, 1, 0]
4.start_index和end_index全為負(-)索引的情況
>>>a[-1:-6] # step=1,從左往右取值,而start_index=-1到end_index=-6決定了從右往左取值,兩者矛盾。
>>> []

>>>a[-1:-6:-1] # step=-1,從右往左取值,start_index=-1到end_index=-6同樣是從右往左取值。
>>> [9, 8, 7, 6, 5]

>>>a[-6:-1] # step=1,從左往右取值,而start_index=-6到end_index=-1同樣是從左往右取值。
>>> [4, 5, 6, 7, 8]

>>>a[:-6] # step=1,從左往右取值,從“起點”開始一直取到end_index=-6。
>>> [0, 1, 2, 3]

>>>a[:-6:-1] # step=-1,從右往左取值,從“終點”開始一直取到end_index=-6。
>>> [9, 8, 7, 6, 5]

>>>a[-6:] # step=1,從左往右取值,從start_index=-6開始,一直取到“終點”。
>>> [4, 5, 6, 7, 8, 9]

>>>a[-6::-1] # step=-1,從右往左取值,從start_index=-6開始,一直取到“起點”。
>>> [4, 3, 2, 1, 0]
5.start_index和end_index正(+)負(-)混合索引的情況
>>>a[1:-6] # start_index=1在end_index=-6的左邊,因此從左往右取值,而step=1同樣決定了從左往右取值。
>>> [1, 2, 3]

>>>a[1:-6:-1] # start_index=1在end_index=-6的左邊,因此從左往右取值,但step=-則決定了從右往左取值,兩者矛盾。
>>> []

>>>a[-1:6] # start_index=-1在end_index=6的右邊,因此從右往左取值,但step=1則決定了從左往右取值,兩者矛盾。
>>> []

>>>a[-1:6:-1] # start_index=-1在end_index=6的右邊,因此從右往左取值,而step=-1同樣決定了從右往左取值。
>>> [9, 8, 7]
6.連續切片操作
>>>a[:8][2:5][-1:]
>>> [4]

相當於:
a[:8]=[0, 1, 2, 3, 4, 5, 6, 7]
a[:8][2:5]= [2, 3, 4]
a[:8][2:5][-1:] = 4
理論上可無限次連續切片操作,只要上一次返回的依然是非空可切片物件。

7.切片操作的三個引數可以用表示式
>>>a[2+1:3*2:7%3] # 即:a[2+1:3*2:7%3] = a[3:6:1]
>>> [3, 4, 5]
8.其他物件的切片操作

前面的切片操作說明都以list為例進行說明,但實際上可進行的切片操作的資料型別還有很多,包括元組、字串等等。

>>> (0, 1, 2, 3, 4, 5)[:3] # 元組的切片操作
>>> (0, 1, 2)

>>>'ABCDEFG'[::2] # 字串的切片操作
>>>'ACEG'

>>>for i in range(1,100)[2::3][-10:]: # 利用range函式生成1-99的整數,然後取3的倍數,再取最後十個。
       print(i, end=' ')
>>> 72 75 78 81 84 87 90 93 96 99

四、Python常用切片操作

以列表:a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]為說明物件

1.取偶數位置
>>>b = a[::2]
[0, 2, 4, 6, 8]
2.取奇數位置
>>>b = a[1::2]
[1, 3, 5, 7, 9]
3.拷貝整個物件
>>>b = a[:] # ★★★★★
>>>print(b) # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) # 41946376
>>>print(id(b)) # 41921864

>>>b = a.copy()
>>>print(b) # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) # 39783752
>>>print(id(b)) # 39759176

需要注意的是:[:]和.copy()都屬於“淺拷貝”,只拷貝最外層元素,內層巢狀元素則通過引用,而不是獨立分配記憶體。

>>>a = [1,2,['A','B']]
>>>print('a={}'.format(a))
a=[1, 2, ['A', 'B']] # 原始a

>>>b = a[:]
>>>b[0] = 9 # 修改b的最外層元素,將1變成9
>>>b[2][0] = 'D' # 修改b的內嵌層元素
>>>print('a={}'.format(a)) # b修改內部元素A為D後,a中的A也變成了D,說明共享內部巢狀元素,但外部元素1沒變。
a=[1, 2, ['D', 'B']] 

>>>print('b={}'.format(b)) # 修改後的b
b=[9, 2, ['D', 'B']] 

>>>print('id(a)={}'.format(id(a)))
id(a)=38669128

>>>print('id(b)={}'.format(id(b)))
id(b)=38669192
4.修改單個元素
>>>a[3] = ['A','B']
[0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]
5.在某個位置插入元素
>>>a[3:3] = ['A','B','C']
[0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9]
>>>a[0:0] = ['A','B']
['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
6.替換一部分元素
>>>a[3:6] = ['A','B']
[0, 1, 2, 'A', 'B', 6, 7, 8, 9]

五、總結

(一)start_index、end_index、step可同為正、同為負,也可正負混合使用。但必須遵循一個原則,即兩者的取值順序必須是相同的,否則無法正確切取到資料:當start_index的位置在end_index的左邊時,表示從左往右取值,此時step必須是正數(同樣表示從左往右);當start_index的位置在end_index的右邊時,表示從右往左取值,此時step必須是負數(同樣表示從右往左)。對於特殊情況,當start_index或end_index省略時,起始索引和終止索引由step的正負來決定,不會存在取值方向出現矛盾的情況,但正和負取到的結果是完全不同的,因為一個向左一個向右。
(二)在利用切片時,step的正負是必須要考慮的,尤其是當step省略時。比如a[-1:],很容易就誤認為是從“終點”開始一直取到“起點”,即a[-1:]= [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],但實際上a[-1:]=a[-1]=9,原因在於step=1表示從左往右取值,而起始索引start_index=-1本身就是物件的最右邊的元素了,再往右已經沒資料了,因此只有a[-1]一個元素。

 
 
 
原文經過些許修改
原文作者:馬爾地夫Maldives
原文連結:https://www.jianshu.com/p/15715d6f4