1. 程式人生 > >[ZZ] 深度學習三巨頭之一來清華演講了,你只需要知道這7點

[ZZ] 深度學習三巨頭之一來清華演講了,你只需要知道這7點

動態 能夠 關系 領域 那一刻 計劃 world 哪些 net

深度學習三巨頭之一來清華演講了,你只需要知道這7點

http://wemedia.ifeng.com/10939074/wemedia.shtml

Yann LeCun還提到了一項FAIR開發的,用於檢測、分割、識別單張圖像中每個物體的技術,比如在一盤菜裏檢測、分割、並識別出西蘭花來、又或是在一堆羊群裏分割出每只羊,其核心流程為以下三步(去年8月都已開源):

1)使用DeepMask這個新型框架對物體進行檢測與分割,生成初始對象掩膜(Mask,相當於一個覆蓋區域);

2)使用SharpMask模型優化這些對象掩膜;

3)使用MutiPathNet卷積網絡識別每個掩膜所框定的物體。

值得一提的是,MutiPathNet中使用了一種新型的對象實例分割(Instance Segmentation)框架:Mask R-CNN。這是FAIR研究員何凱明(Kaiming He)——同時也是深度殘差網絡ResNet的作者之一——最近公布的研究成果,它是Faster R-CNN的擴展形式,能夠有效地檢測圖像中的目標,同時還能為每個實例生成一個高質量的分割掩膜(Segmentation Mask)。

3、常識是個好東西,希望大家都有

此外,Yann LeCun還提到了如今AI發展過程中遇到的幾大困難:

1)機器需要學習/理解世界的運行規律(包括物理世界、數字世界、人……以獲得一定程度的常識)

2)機器需要學習大量背景知識(通過觀察和行動)

3)機器需要理解世界的狀態(以做出精準的預測和計劃)

4)機器需要更新並記住對世界狀態的估測(關註重大事件,記住相關事件)

5)機器需要邏輯分析和規劃(預測哪些行為能讓世界達到目標狀態)

目前機器學習中最大挑戰之一就是如何讓機器擁有常識——即讓機器獲得填充空白的能力。比如“John背起包來,離開了房間”,由於人類具備常識,因此我們能夠知道John在這個過程中需要站起來,打開房門,走出去——他不會是躺著出去的,也不會從關著的門出去,可機器並不知道這一點。又或者我們即使只看到了半張人臉也能認出那人是誰,因為人類常識裏左右臉都是通常長得差不多,但機器同樣不具備這種能力。

下文提到的無監督/預測學習可以讓機器獲得常識,現在我們常用的監督學習並做不到這一點。從本質上來說,在無監督學習方面,生物大腦遠好於我們的模型。

4、無監督學習才是蛋糕本身

“是的、是的,我知道你們在想什麽——那個蛋糕比喻又來了,”切到這張幻燈片時,Yann LeCun笑著說,“這已經是我在人工智能領域的一個梗了。”

在大大小小的無數場演講中,Yann LeCun不止一次,甚至不止十次地打過這個比方:如果人工智能是一塊蛋糕,強化學習(Reinforcement Learning)就是蛋糕上的一粒櫻桃,而監督學習(Supervised Learning)是蛋糕外的一層糖霜,但無監督學習/預測學習(Unsupervised/Predictive Learning)才是蛋糕本身。目前我們只知道如何制作糖霜和櫻桃,卻不知道如何做蛋糕。

我們現在對深度神經網絡的訓練,用的大部分還是監督學習的方式。你將一張圖片展現給系統並告訴它這是一輛車,它就會相應調整它的參數並在下一次說出“車”。然後你再展現給它一張桌子,一個人。在幾百個例子、耗費幾天到幾周的計算時間之後,它就弄明白了。“這其實並不是一個非常復雜的概念。”

其次,對於一個AI系統來說,預測+規劃=邏輯分析(Predicting + Planning = Reasoning)。如果想要讓機器能夠了解並且預測世界的規律,強化學習(Reinforcement Learning)需要建立一個世界模擬器(World Simulator),模擬真實世界的邏輯、原理、物理定律等。不過真實世界太過復雜,存在大量的表征學習參數,使得機器學習的計算量相當冗余,聽起來似乎很誘人,但是在有限的時間內無法學習到成千上億的參數。

而無監督學習需要機器處理大量沒有標記的數據,就像給它一堆狗的照片,卻不告訴它這是一條狗。機器需要自己找到區分不同數據子集、集群、或者相似圖像的辦法,有點像嬰兒學習世界的方式。

5、無監督學習的一些突破性的嘗試與結果

無監督學習的一大困難之處在於:對不確定性的預測。比如當你將一支筆直立在桌面上時,松開手的那一刻,你並不知道這只筆將會朝哪個方向倒下。如果系統回答這只筆會倒下,卻判斷錯誤了倒下的方向,我們需要告訴系統,雖然你不是完全正確,但你的本質上是正確的,我們不會懲罰你。此時需要引入曲面的成本函數,只要系統回答在曲面之下的數據,都是正確的答案。

兩者的關系就像一個騙子和一個測謊者。判別器這位測謊者要不斷優化自己,盡可能地識別出發生器生成的“假圖像”,防止自己被騙;而生成器這個騙子為了瞞過判別器,也必須不斷進步。在這種動態的對抗中,生成器會得到訓練,最後開始生成非常真實的圖片,這意味著生成器掌握了圖像的特征,自己掌握成本函數——某種意義上,這就是無監督學習。

[ZZ] 深度學習三巨頭之一來清華演講了,你只需要知道這7點