1. 程式人生 > >Python高階特性——切片(Slice)

Python高階特性——切片(Slice)

摘錄廖雪峰網站

定義一個list:

1

= ['haha','xixi','hehe','heihei','gaga']

 取其前三個元素:

>>> L[0],L[1],L[2]
('haha', 'xixi', 'hehe')

這個方法有點蠢,因為如果元素非常多,我們需要取其前N個元素,怎麼辦?

可能會想到用迴圈:

複製程式碼

>>> r=[]
>>> n = 3
>>> for i in range(n):
...     r.append(L[i])
...
>>> r
['haha', 'xixi', 'hehe']

複製程式碼

但是像這種很頻繁很常用的操作手段,基本上所有的語言都提供了簡單的操作方法,類似Substring方法(俗稱取子串),python也提供了類似的方法,這就是切片(Slice).

 例如:

>>> L[0:3]
['haha', 'xixi', 'hehe']

 其中,L[0:3]表示從索引0開始,知道索引3為止,但是不包括索引3,即索引0,1,2.

如果第一個索引為0,還可以省略:

>>> L[:3]
['haha', 'xixi', 'hehe']

 也可以從任意索引開始:

>>> L[1:2]
['xixi']

也可以試試:

>>> L[1:1]
[]

因為,Python也支援倒數取數L[-1],我們來看看是否支援倒數切片:(記住,倒數第一個索引是-1)

>>> L[-2:]
['heihei', 'gaga']
>>> L[-3:-2]
['hehe']

如果感覺還不過癮,再繼續看看:

>>> m = list(range(100))#通過range函式建立一個0-99的數列,組成一個list賦值給m
>>> m
[0, 1, 2, 3, 4, 5, 6, ……,99]

複製程式碼

>>> m[:10]#取前十個數
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> m[-10:]#取後十個數
[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> m[10:20]#取前11-20個數
[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
>>> m[:10:2]#前十個數中,每2個數取一個
[0, 2, 4, 6, 8]
>>> m[5:15:3]#第6-15個數中,每3個數取一個
[5, 8, 11, 14]
>>> m[::10]#所有的數中,每10個數取一個
[0, 10, 20, 30, 40, 50, 60, 70, 80, 90]
>>> m[:]#什麼都不寫,可以原樣複製一個list
[0, 1, 2, 3, 4, 5, 6, 7,……,99]

複製程式碼

tuple也支援切片特性,只是結果也是一個tuple:

>>> n = (1,3,5,7)
>>> n[:3]
(1, 3, 5)

再來看看字串:

>>> 'abcdefghjklmn'[::2]
'acegjln'

字串也支援切片,只是結果也是一個字串。

再看一個例子:

利用切片功能,編寫一個函式trim(str),類似Python中的strip()功能——去除字串首尾的空格:

複製程式碼

>>> def trim(str):
...     while str[:1]==' ':
...             str = str[1:]
...     while str[-1:] == ' ':
...             str = str[:-2]
...     return str
...
>>> trim('  abc  hh  welcome!      ')
'abc  hh  welcome!'

複製程式碼

理解extended slice

    前面那一部分相對來說還是比較好理解的。現在,如果我們有一些其他的要求,比如說,我們想返回數組裡面索引為奇數的元素,或者索引為偶數的元素,那麼該怎麼辦呢?

我們可以有幾種辦法來做,其中的一種就是採用extended slice,一個典型的解決方法如下:

>>> l[::2]  
[0, 2, 4, 6, 8]  
>>> l[1::2]  
[1, 3, 5, 7, 9]  
>>>   

    前面這種包含兩個冒號的樣式是怎麼回事呢?

     實際上,我們這邊第一個冒號隔開的這兩個部分和前面的意思是一樣的,就是指定陣列中間元素的區間。所以前面第一個l[::2]前面就是指的整個陣列的元素。而後面那個部分則是指的一個步長。這表示什麼意思呢?就是既然我們前面指定的是整個陣列,那麼它就是從0開始,然後每次訪問後面相鄰的元素。而設定為2之後呢,則訪問後面和它距離為2的元素,而不是直接相鄰的元素。這樣,我們也就容易理解l[1::2],它就是從元素1開始到結尾的元素集合裡取間隔為2的這些元素。

    到這一步,就離我們理解前面那個古怪的l[::-1]很接近了。我們前面的這個取步長是將步長設定為正數,所以在取元素的集合裡它表示從左到右的取指定步長覆蓋的元素。如果我們將步長設定為負數呢?我們來看:

>>> l[1:9:-1]  
[]  
>>> l[9:1:-1]  
[9, 8, 7, 6, 5, 4, 3, 2]

    有了前面這一部分的程式碼,相信就不難理解了。我們取區間[1, 9),結果取步長為-1的時候返回的是一個空的集合。而我們取9到1的時候,步長為-1取出來了倒序的陣列。這是因為如果我們指定的步長為負數的話,那麼它必須和資料指定的區間方向一致。也就是說,如果我們前面指定的區間是從陣列小的索引到大的索引,那麼我指定的步長必然也要從小到大。所以必須為正數。而如果我們指定的區間是從後面往前的話,則步長必須指定為負數。否則返回的結果都是空的陣列。