[TOC] tf.slice()是TensorFlow庫中分割張量的一個函式,其定義為def slice(input_, begin, size, name=None):。tf.slice()函式的那些引數設定實在是不好理解,查了好多資料才理解,所以這邊記錄一下。 # 1.官方註釋 官方的註釋如下: ```python """Extracts a slice from a tensor. This operation extracts a slice of size `size` from a tensor `input` starting at the location specified by `begin`. The slice `size` is represented as a tensor shape, where `size[i]` is the number of elements of the 'i'th dimension of `input` that you want to slice. The starting location (`begin`) for the slice is represented as an offset in each dimension of `input`. In other words, `begin[i]` is the offset into the 'i'th dimension of `input` that you want to slice from. Note that @{tf.Tensor.__getitem__} is typically a more pythonic way to perform slices, as it allows you to write `foo[3:7, :-2]` instead of `tf.slice([3, 0], [4, foo.get_shape()[1]-2])`. `begin` is zero-based; `size` is one-based. If `size[i]` is -1, all remaining elements in dimension i are included in the slice. In other words, this is equivalent to setting: `size[i] = input.dim_size(i) - begin[i]` This operation requires that: `0 <= begin[i] <= begin[i] + size[i] <= Di for i in [0, n] ``` 翻譯一下就是: tf.slice()函式的作用就是從張量中提取想要的切片。此操作從由begin指定位置開始的張量input中提取一個尺寸size的切片.切片size被表示為張量形狀,其中size[i]是你想要分割的input的第i維的元素的數量.切片的起始位置(begin)表示為每個input維度的偏移量.換句話說,begin[i]是你想從中分割出來的input的“第i個維度”的偏移量。 請注意,tf.Tensor.__getitem__通常是執行切片的python方式,因為它允許您寫foo[3:7, :-2],而不是tf.slice([3, 0], [4, foo.get_shape()[1]-2]). begin是基於零的;size是一個基礎.如果size[i]是-1,則維度i中的所有其餘元素都包含在切片中. 換句話說,這相當於設定: ```python size[i] = input.dim_size(i) - begin[i] ``` 該操作要求: ```python 0 <= begin[i] <= begin[i] + size[i] <= Di for i in [0, n] ``` 看完註釋還是挺懵的,下面看看解釋。 # 2.引數解釋 ```python def slice(input_, begin, size, name=None): ... return gen_array_ops._slice(input_, begin, size, name=name) ``` - input_ input_型別為一個tensor,表示的是輸入的tensor,也就是被切的那個 - begin begin是一個int32或int64型別的tensor,表示的是每一個維度的起始位置 - size size是一個int32或int64型別的tensor,表示的是每個維度要拿的元素數 - name=None name是操作的名稱,可寫可不寫 - return 返回一個和輸入型別一樣的tensor # 3.例子 還是通過例子來講解會比較容易理解 - 例1 ```python t = tf.constant([[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]]) tf.slice(t, [1, 0, 0], [1, 1, 3]) # 輸出[[[3, 3, 3]]] ``` 首先作為一個3維陣列t,要先明白他的shape是[3,2,3]. 這個shape是怎麼來的呢?咱們把這個t分解一下看就好理解了。那一大堆有括號的t,只看它最外面的括號的話,可以看成是: ```python t = [A, B, C] #這是第一維度 ``` 然後每一個裡面有兩個東西,可以寫成: ```python A = [i, j], B = [k, l], C = [m, n] #這是第二維度 ``` 最後,這i, j, k, l, m, n裡面分別是: ```python i = [1, 1, 1], j = [2, 2, 2], k = [3, 3 ,3], l = [4, 4, 4], m = [5, 5, 5], n = [6, 6, 6] # 這是第三維度 ``` 所以shape就是中括號 [ ] 的層級裡單位的數量。 對於t來說,最外面括號裡有3個東西,分別是A, B, C。這三個東西每個裡面有兩個玩意兒, i和j, k和l, m和n。他們裡面每一個又有3個數字。所以t的shape是[3,2,3]。 有了這個基礎,我們再來看例子: ```python t = tf.constant([[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]]) tf.slice(t, [1, 0, 0], [1, 1, 3]) # begin = [1, 0, 0] ``` 有了這個基礎,我們再來看例子: ```python tf.slice(t, [1, 0, 0], [1, 1, 3]) # begin = [1, 0, 0] ``` 注意一下,python的陣列index是從0開始的。 這裡根據順序我們知道,begin是[1, 0, 0], size是[1, 1, 3]. 他們兩個陣列的意義是從左至右,每一個數字代表一個維度。上面說了begin的意思是起始位置,那麼[1, 0, 0]的意思是在3個維度中,每個維度從哪裡算起。 第一維度是[A, B, C]。 begin裡[1, 0, 0]是1,也就是從B算起。其次第二維度裡B = [k, l](注意啊,我這裡只寫了B = [k, l],可不代表只有B有用,如果size裡第一個數字是2的話,B和C都會被取的),begin裡第二個數是0,也就是從k算起。第三維度k = [3, 3 ,3],begin裡第三個數是0,就是從第一個3算起。 到現在都能看懂吧?知道了這三個起始點之後,再來看size。 size的意思是每個維度的大小,也就是每個維度取幾個元素。size的應該是最後輸出的tensor的shape。 例子裡面: ```python tf.slice(t, [1, 0, 0], [1, 1, 3]) # size = [1, 1, 3] ``` size裡第一個是1,意思是在第一個維度取1個元素。t = [A, B, C] begin是起算是B,取一個那就是B了唄。那麼第一維度結果就是[B] size第二個也是1,第二維度B = [k, l], begin裡起算是k,取一個是k。那麼第二維度結果是[[k]]。 size第三個是3,第三維度k = [3, 3 ,3],begin裡起算是第一個3。三個3取3個數,那就要把三個3都取了,所以是 ```python [[[3, 3, 3]]] ``` 看懂了嗎?是不是有點像代數?[B]裡把B換成[k], 再把k換成[3, 3 ,3]。最後注意中括號的數量,和size一樣是[1, 1, 3]. - 例2 ```python t = tf.constant([[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]]) tf.slice(t, [1, 0, 0], [-1, -1, -1]) ``` 對於這種情況,原始碼註釋中有一句話: ```python If `size[i]` is -1, all remaining elements in dimension i are included in the slice. In other words, this is equivalent to setting: `size[i] = input.dim_size(i) - begin[i]` ``` 也就是說,如果size輸入值是-1的話,在那個維度剩下的數都會slice走。上面的例子中,begin是[1, 0, 0]。三個維度都是-1的話,那麼結果: 第一維度是[B,C];第二維度是[[k, l], [m, n]]; 第三維度是[[[3,3,3], [4,4,4]], [[5,5,5], [6,6,6]]] - 例3 ```python import tensorflow as tf sess = tf.Session() input = tf.constant([[[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]], [[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]]]) print(input) output=tf.slice(input,[0,0,0,1],[2,3,2,1]) print(output) print(sess.run(output)) ``` # 參考 [[1] tf.slice()到底怎麼切的,看不懂你掐死我](https://www.jianshu.com/p/71e6ef6c121b) [[2] TensorFlow分割:tf.slice函式](https://www.w3cschool.cn/tensorflow_python/tensorflow_python-cdj92kbd.html) 碼字不易,如果您覺得有幫助,麻煩點個贊再