計算機視覺-影象檢索隨記
海量資料的情況用KNN是不行的。現在專案上一般使用的是一整套的ANN

直觀的理解就是用超平面對空間做一個劃分,畫完後落在同一區域的一些點 他們得到的01串應該是一樣的,而臨近的點他們之間可能有一個維度的值不同。
超平面的優化方式這麼木有講!!超平面的劃分不一定合理,所以這個演算法是犧牲一部分準確度來提高速度。
怎麼樣去權衡準確度和速度?增加超平面可以提高準確度,但是會造成在Nbit的範圍內落下來的點非常的少。另一種方式是隨機的使用另外一組超平面做劃分(不同的hash)。
N值是通過經驗和上下調整的方式得到的。

使用3個雜湊得到各自相似的結果,將他們組合起來。具體和誰最相似,可以採用其他演算法比如:距離演算法求得。
聚類的方式分桶很慢!!
k-Means Tree:先聚類大範圍,在聚類小範圍。查詢時也是先找落在那個大範圍內,再往細的找。FLANN實際中使用效果會好。訓練的時候使用的Alexnet 全連線層是4096維