Python高階特性——切片(Slice)
摘錄廖雪峰網站
定義一個list:
1 |
|
取其前三個元素:
>>> L[0],L[1],L[2]
('haha', 'xixi', 'hehe')
這個方法有點蠢,因為如果元素非常多,我們需要取其前N個元素,怎麼辦?
可能會想到用迴圈:
>>> r=[] >>> n = 3 >>> for i in range(n): ... r.append(L[i]) ... >>> r ['haha', 'xixi', 'hehe']
但是像這種很頻繁很常用的操作手段,基本上所有的語言都提供了簡單的操作方法,類似Substring方法(俗稱取子串),python也提供了類似的方法,這就是切片(Slice).
例如:
>>> L[0:3]
['haha', 'xixi', 'hehe']
其中,L[0:3]表示從索引0開始,知道索引3為止,但是不包括索引3,即索引0,1,2.
如果第一個索引為0,還可以省略:
>>> L[:3]
['haha', 'xixi', 'hehe']
也可以從任意索引開始:
>>> L[1:2] ['xixi']
也可以試試:
>>> L[1:1]
[]
因為,Python也支援倒數取數L[-1],我們來看看是否支援倒數切片:(記住,倒數第一個索引是-1)
>>> L[-2:]
['heihei', 'gaga']
>>> L[-3:-2]
['hehe']
如果感覺還不過癮,再繼續看看:
>>> m = list(range(100))#通過range函式建立一個0-99的數列,組成一個list賦值給m
>>> m
[0, 1, 2, 3, 4, 5, 6, ……,99]
>>> m[:10]#取前十個數 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> m[-10:]#取後十個數 [90, 91, 92, 93, 94, 95, 96, 97, 98, 99] >>> m[10:20]#取前11-20個數 [10, 11, 12, 13, 14, 15, 16, 17, 18, 19] >>> m[:10:2]#前十個數中,每2個數取一個 [0, 2, 4, 6, 8] >>> m[5:15:3]#第6-15個數中,每3個數取一個 [5, 8, 11, 14] >>> m[::10]#所有的數中,每10個數取一個 [0, 10, 20, 30, 40, 50, 60, 70, 80, 90] >>> m[:]#什麼都不寫,可以原樣複製一個list [0, 1, 2, 3, 4, 5, 6, 7,……,99]
tuple也支援切片特性,只是結果也是一個tuple:
>>> n = (1,3,5,7)
>>> n[:3]
(1, 3, 5)
再來看看字串:
>>> 'abcdefghjklmn'[::2]
'acegjln'
字串也支援切片,只是結果也是一個字串。
再看一個例子:
利用切片功能,編寫一個函式trim(str),類似Python中的strip()功能——去除字串首尾的空格:
>>> def trim(str):
... while str[:1]==' ':
... str = str[1:]
... while str[-1:] == ' ':
... str = str[:-2]
... return str
...
>>> trim(' abc hh welcome! ')
'abc hh welcome!'
理解extended slice
前面那一部分相對來說還是比較好理解的。現在,如果我們有一些其他的要求,比如說,我們想返回數組裡面索引為奇數的元素,或者索引為偶數的元素,那麼該怎麼辦呢?
我們可以有幾種辦法來做,其中的一種就是採用extended slice,一個典型的解決方法如下:
>>> l[::2]
[0, 2, 4, 6, 8]
>>> l[1::2]
[1, 3, 5, 7, 9]
>>>
前面這種包含兩個冒號的樣式是怎麼回事呢?
實際上,我們這邊第一個冒號隔開的這兩個部分和前面的意思是一樣的,就是指定陣列中間元素的區間。所以前面第一個l[::2]前面就是指的整個陣列的元素。而後面那個部分則是指的一個步長。這表示什麼意思呢?就是既然我們前面指定的是整個陣列,那麼它就是從0開始,然後每次訪問後面相鄰的元素。而設定為2之後呢,則訪問後面和它距離為2的元素,而不是直接相鄰的元素。這樣,我們也就容易理解l[1::2],它就是從元素1開始到結尾的元素集合裡取間隔為2的這些元素。
到這一步,就離我們理解前面那個古怪的l[::-1]很接近了。我們前面的這個取步長是將步長設定為正數,所以在取元素的集合裡它表示從左到右的取指定步長覆蓋的元素。如果我們將步長設定為負數呢?我們來看:
>>> l[1:9:-1]
[]
>>> l[9:1:-1]
[9, 8, 7, 6, 5, 4, 3, 2]
有了前面這一部分的程式碼,相信就不難理解了。我們取區間[1, 9),結果取步長為-1的時候返回的是一個空的集合。而我們取9到1的時候,步長為-1取出來了倒序的陣列。這是因為如果我們指定的步長為負數的話,那麼它必須和資料指定的區間方向一致。也就是說,如果我們前面指定的區間是從陣列小的索引到大的索引,那麼我指定的步長必然也要從小到大。所以必須為正數。而如果我們指定的區間是從後面往前的話,則步長必須指定為負數。否則返回的結果都是空的陣列。