1. 程式人生 > >關於numpy中的廣播與argmax問題

關於numpy中的廣播與argmax問題

問題背景

最近正在看faster-rcnn的anchor-target-layer.py原始碼,其中關於numpy的argmax()問題搞得很混亂。此問題理清楚還需要高清楚numpy的索引的運作原理。

a = np.array([[1,3,5],[2,2,9]])

>>> a.argmax(axis=0)

array([1, 0, 1])

使用argmax(axis=0)的原因是想提取出在行方向上的最大值序號。進而得到行方向上的最大值(每一列的最大值)。可以看出的結構是一個1行3列的array,其中array中的每個值都小於行數,並且值得個數是列數。可以通過以下語句得到行方向上的最大值。

>>> a[a.argmax(axis=0),np.arange(3)]

array([2, 3, 9])

同理,可以得到列方向上的最大值,(每一行的最大值)

>>> a[np.arange(2),a.argmax(axis=1)]

array([5, 9])

argmax函式返回的是序號,在二維情況下,axis=0對應行,axis=1對應列。argmax(axis=0),返回的是行號,行號的個數是列數。同理可知。

在以上操作中

>>>[a.argmax(axis=0),np.arange(3)]

[array([1, 0, 1]), array([0, 1, 2])]

可見,兩個array做為序號,其實內部使用的是資料組合機制來獲取真實的資料。以上可以等效為

[a[1,0],a[0,1],a[1,2]]

如此便可以理解了。