1. 程式人生 > >基於TensorFlow理解三大降維技術:PCA、t-SNE 和自編碼器

基於TensorFlow理解三大降維技術:PCA、t-SNE 和自編碼器

余弦相似度 應對 新的 問題 技術 編碼 http 壓縮 方法

在我們開始之前,先看一個問題:如果你要為以下案例選擇一種降維技術,你會怎麽選?

1. 你的系統可以使用余弦相似度測量距離,但你需要將其可視化,以便不懂技術的董事會成員也能理解,這些人可能甚至從來沒聽說過余弦相似度;你會怎麽做?

2. 你有必要將數據的維度壓縮到盡可能最低,你的限制是要保留大約 80% 的數據,你會怎麽做?

3. 你有一個數據庫,其中的數據是耗費了大量時間收集的,而且還時不時有新的(相似類型的)數據加入。你需要降低你已有數據的維度,並且還要給到來的新數據降維,你會選擇什麽方法?

這篇文章的目的是希望能幫助你更好地了解降維,以便你能輕松應對類似這樣的問題。

https://www.sohu.com/a/157563698_465975

基於TensorFlow理解三大降維技術:PCA、t-SNE 和自編碼器