深度學習真的working嗎
近年來,深度學習的發展可謂是如日中天,各種論文、各種Beat Baseline。可是,深度學習真的能大規模的應用到生產中嗎?深度學習的泛化能力真的足夠好嗎?從事深度學習的工作有一段日子了,我舉兩個我實際工作遇到的例子,大家討論討論。
1、影象分割
最近的一個專案中要應用到影象分割技術,我們採用了SSD。我們直接看一張圖:

SSD示意圖
演算法標出了四個人(可信度大於0.5的),並且人物的邊界讓人費解,這樣的演算法顯然是不可靠的。分辨這樣的圖片為什麼對計算機來說非常困難?首先,圖中的人物是穿少數民族服裝的(我是雲南人,雲南是一個多民族的身份,自然會有這樣的圖片要處理);其次,圖中的一個大人是坐著的還抱著一個小孩。這對計算機來說很難界定人物的邊界,所以出現了這樣奇怪的結果。
但是,為什麼人很容易分辨,一眼就能看出圖中有三個人。所以現在的深度學習演算法的泛化能力真的足夠了嗎?演算法到底有沒有學會了如何分辨一個人,這些都是不得而知的。
2、短文字摘要
去年的一個專案,給一篇小的短文生成一個標題,我們採用的Seq2Seq+Attention模型。我們還是直接看一個例子:

文字摘要示例
我還是雲南人,對雲南來說是從來沒有過颱風的,顯然這段短新聞被演算法生成了一個非常非常奇怪的標題,我們人工修改了。類似的例子,還有騰訊對“一帶一路”的翻譯。我們當然可以給演算法找藉口,這是因為訓練語料中沒有類似的語料啊。但是,這是人工智慧嗎。如果是,那麼是不是應該從這段文字中總結出《超強颱風“山竹”進入雲南 將帶來降雨》類似這樣的標題,即使之前從來沒有見過。
我覺得,現在媒體過分誇大了深度學習,讓大家覺得深度學習就像神一樣,什麼都能搞定。可能大家都想著怎麼提高真確率(即使有再高的正確率也不一定能應用),怎麼修改模型,而不去思考深度學習到底是什麼東西,具不具備學習的能力,是不是真正的人工智慧。當然,這些都只是我個人的一些想法。