1. 程式人生 > >20個令人驚歎的深度學習應用

20個令人驚歎的深度學習應用

唐旭 發自 RUC
量子位 報道 | 公眾號 QbitAI

從計算機視覺到自然語言處理,在過去的幾年裡,深度學習技術被應用到了數以百計的實際問題中。諸多案例也已經證明,深度學習能讓工作比之前做得更好。

今天,量子位為大家收集了20個深度學習方面的優秀應用——當然,這份榜單可能並不詳盡,但相信看過之後,你對這項技術在某些領域的潛力會有更清晰的認識。

針對每個應用,我們還儘量收集了相關的Demo、Paper和Code等資訊。

1、Face2Face:扮演特朗普

斯坦福大學的一個小組做了一款名為Face2Face的應用,這套系統能夠利用人臉捕捉,讓你在視訊裡實時扮演另一個人,簡單來講,就是可以把你的面部表情實時移植到視訊里正在發表演講的美國總統身上。

同樣的原理也可以用於對視訊裡場景的3D重建、電影特效也可以這麼幹。

這個應用的實際效果是這樣的:

Paper:

2、Let there be color!:給黑白照片/視訊自動上色

左圖是拍攝於1937年的一幅礦工的照片,右圖是用Let there be color!重新自動上色後的效果。

上圖是拍攝於1909年的一張保齡球館的照片,下圖是用Let there be color!重新上色後的效果。

實際上,這是運用深度學習網路學習自然存在於照片中的某些模式——比如,天通常是藍的,雲是白的或者灰的,草是綠的。通過這類規則,Let there be color!不需要人類的介入就能對照片進行重新上色。雖然有時它也會犯錯,但這種錯誤很難被發現。

同樣地,Let there be color!也可以把黑白視訊變成彩色的。

Demo:

Paper:

Code:

3、Pixel Recursive Super Resolution:告別馬賽克

我為什麼不看美劇CSI?原因很簡單:太假了。裡面的主角動不動就把一段視訊拉近、放大——然後他們就得到了一幅解析度遠超真實情況的影像。這根本不現實……

直到深度學習出現。今年早些時候,谷歌大腦的研究者們訓練了一個深度學習網路,他們讓後者根據一些解析度極低的人臉影象來預測這些面孔真實的樣子。如下圖:

最左邊是輸入的8×8畫素的原始影像,最右一列是被拍攝的人臉在照片中的真實效果,中間則是電腦的猜測。

可以看到,雖然並不完美,但電腦預估出的結果已經與實際情況十分接近。Google的研究者將這種方法命名為 Pixel Recursive Super Resolution(畫素遞迴超解析度),用這種方法能顯著提升影象的質量。

Paper:

4、實時多人動作預估

深度學習網路已經能在預估動作方面幫動畫師很大的忙,如今,我們甚至能做到實時預估。康奈爾大學Zhe Cao等人教會了一個神經網路估算人類骨架位置的變化。

在如下的gif中,你可以看到一群人在街頭跳舞,而通過這種神經網路,我們能知道他們在哪、如何做動作。

視訊封面 深度學習實時預估多人動作_騰訊視訊 視訊

Paper:

5、Neural Talk:描述照片

用電腦來對照片進行自動分類已經很常見了。比如,Facebook能在分享的照片裡標記出你的好友,Google可以為你的照片打上標籤以便更有效率地進行搜尋。

而如今,深度學習已經可以對照片中的各種元素進行描述。在Andrej Karpathy和李飛飛所做的一項工作中,他們訓練了一個能對照片中不同區域內元素進行識別,並用一句話來描述照片的深度學習系統。

Demo:

Paper:

6、DeepWarp:你瞅啥?再瞅把你做成表情包!

這個應用有點惡搞的意思。現在,不管你手裡拿到了誰的照片,用Ganin等人開發的這個深度學習網路過一下,你就可以讓他的眼睛動起來:你可以讓他上下看、左右看,甚至繞著圈看……好吧,除了生產表情包,其實也不知道它還能幹什麼用……

這是一些例子,裡面有伊麗莎白女王、奧巴馬、莎拉波娃……等等:

Demo:

Paper:

7、生成新照片

來自懷俄明州立大學的Anh Nguyen以及其他幾位研究者開發了一套能用迭代的方式從已有照片中合成全新照片的深度學習網路。以下是一些電腦合成的樣片,結果令人驚豔:

Paper:

8、用卷積神經網路來拯救鯨魚

眾所周知,卷積神經網路在影象識別分類領域有著非常好的前景。利用深度學習,我們可以將抓拍到的珍稀動物(比如鯨魚)照片進行分類,從而更好地估算某種動物的存活數量。

其他的例子包括浮游生物、植物等等。

分類浮游生物的介紹:

Code:

9、Pix2Pix:靈魂畫師

這個點子與之前提到的Let there be color!有點類似,不過要更有創造力一點。你可以往電腦中輸入一幅簡筆畫,甚至一些色塊,然後讓電腦發揮自己的創造力輸出新的圖片。類似地,你也可以把衣服航拍照片變成一幅地圖,將白天的場景變成夜晚。

Paper:

Code:

10、Reading text in the Wild:用圖片找文字

牛津視覺幾何小組運用深度學習技術開發了一項應用,它可以讀出視訊中的文字,輸入文字,就可以直接搜出影象中包含這些文字的BBC新聞視訊。比如,這是對“London”的一部分搜尋結果:

Demo:

Paper:

11、Google Sunroof:看你家房頂能收到多少太陽能

Google Sunroof首先會根據Google地球的航拍地圖為你家的屋頂建立一個3D模型,然後再用深度學習將屋頂和周圍的數目區分開,接著根據太陽執行軌跡以及天氣狀況,就可以估算出安裝了太陽能電池板的房頂能收集到多少太陽能。

專案首頁:

12、AI制霸打磚塊

Google的Deepmind團隊用深度強化技術教會了AI玩《打磚塊》(Breakout,基本大家都玩過,具體是什麼請看下圖)。

測試過程中,電腦並沒有依據任何遊戲規則被進行特殊的編成,他們只是將鍵盤的控制權交給AI,然後對它進行不斷地訓練。起初,AI玩得十分糟糕;但經過兩個小時的訓練之後,畫風就變成了這個樣子的:

Paper:

Code:

13、制霸全場~

打磚塊還不夠?深度學習技術還被用來在更多遊戲領域訓練AI,包括:《小蜜蜂》、《毀滅公爵》、《乒乓》等幾十種遊戲。在大多數的遊戲裡,深度學習網路已經玩的比有經驗的玩家更好,同樣所有的玩法都是AI自己摸索的。

Paper:

14、LipNet:讓AI讀脣語

視訊封面 AI識別脣語_騰訊視訊 視訊

來自牛津大學和Deepmind的科學家共同完成了這一專案。LipNet在讀脣的準確率方面達到了驚人93%,遠超人類讀脣者52%的平均水平。

Paper:

Code:

15、真·靈魂畫師

如今,運用深度學習技術,可以讓AI對某一幅畫的風格、色彩、明暗等元素進行學習,然後將這幅畫上的風格移植到另一幅上,而且效果非常不錯。

這麼說可能不夠直觀,來看幾個例子:

下面從左到右,依次是畢加索、梵·高和莫奈風格的蒙娜麗莎。

而這是某位老哥用AI創作的谷歌地圖風格的蒙娜麗莎……

Demo:

Paper:

16、AI寫字

現在電腦不光能用來打字,還能用來寫字了:多倫多大學的Alex Graves教會了電腦用多種不同的風格來書寫。

Demo:

Paper:

17、深度學習預測城市熱人口和選舉結果

Gebru等人收集了5000萬張Google街景照片,然後用深度學習技術加以挖掘看看能發現什麼。結果,深度學習不僅識別出了2200萬輛汽車的材質、車型、年份等,還從中發現了一些關聯,比如可以通過對車型的識別來分析某片區域的人口狀況。

更有趣的是,AI發現,如果在一段15分鐘長的駕駛路程上遇到的轎車比皮卡更多,那麼這個城市在下屆的總統選舉中有88%的機率將選票投給民主黨;否則,則有82%的機率投給共和黨。

Paper:

18、Deep Dreaming:AI也會白日做夢

視訊封面 Deep Dream_騰訊視訊 視訊

2015年,Google的研究者找到了一種用深度學習來增強影象特徵的方法,隨後,他們就開發了Deep Dreaming——它能夠在圖片中生成一些不可思議的幻象。因為有些和夢境十分相似,因此取名Deep Dreaming。具體生成什麼樣的幻想與這個深度學習系統最近被暴露在什麼樣的環境下有關,有時它甚至能生成嚇人的噩夢。

專案首頁:

影集:

Code:

19、反覆攻破和修補自己的防火牆

Google大腦的研究團隊建立了兩個深度學習網路用於安全工具開發,他們讓其中一個不斷創造自己的加密演算法,然後讓另一個網路去盡力攻破它。在兩套系統的反覆纏鬥後,第一個系統已經能生成非常優秀的安全加密演算法。

然而,第二套演算法也總是表現得比它更好……

Paper:

20、預測地震

哈佛的科學家們運用深度學習技術讓電腦學會“粘彈性計算”——一種被用於預測地震的計算方法。結果,計算的效果在AI上大大被增強了。

然而,計算機同時將計算速度提高了50000%。在地震中,時間就是生命。因此,目前用AI來預測地震還為時尚早。

Paper:

好啦,先介紹到這裡。如果漏掉了“好厲害!”的深度學習應用,歡迎留言補充~

One More Thing…

我們的公眾號也叫量子位(QbitAI),關注並回復“今天”,看更多AI領域大新聞。

另外,歡迎加量子位小助手的微信:qbitbot,如果你研究或者從事AI領域,小助手會把你帶入量子位的交流群裡。

相關推薦

20令人驚歎深度學習應用

唐旭 發自 RUC 量子位 報道 | 公眾號 QbitAI 從計算機視覺到自然語言處理,在過去的幾年裡,深度學習技術被應用到了數以百計的實際問題中。諸多案例也已經證明,深度學習能讓工作比之前做得更好。 今天,量子位為大家收集了20個深度學習方面的優秀應用——當然,這份

20有趣的Python深度學習應用程式

1.頂級Python深度學習應用程式 在這個使用Python的深度學習中,我們將看到使用Python進行深度學習的應用程式。在本文中,我們將討論Python深度學習的20個主要應用程式。到目前為止,我們已經看到了 深度學習是什麼以及如何實現它。現在讓我們通過使用Python在現實世界中的應用程式

不需要敲程式碼就可以開發深度學習應用?我們來探究竟

在深度學習仍然需要不少的數學和計算機程式設計能力的現在,如果突然出現了一個不需要寫任何公式和程式碼的深度學習應用開發平臺,你會是什麼感覺?震驚?鄙夷?Verge 的一篇文章就近距離觀察了這個新的視覺化開發平臺 Lobe,並詢問了領域內的研究者和開發人員的意

《TensorFlow深度學習應用實踐》

常用 基本應用 水平 目的 record tar csv 支持 .com http://product.dangdang.com/25207334.html 內容 簡 介 本書總的指導思想是在掌握深度學習的基本知識和特性的基礎上,培養使用TensorFlow進行實際編程以解

推薦一個深度學習應用於圖形學的網站

2018年12月4日-7日,全亞洲最大的計算機圖形與互動技術會議與展會——SIGGRAPH Asia 2018大會在日本東京隆重舉行。作為計算機圖形學頂級會議,SIGGRAPH大會邀請了國際上在影像技術方面有建樹的學者、技術名流大咖及高新技術企業共同研討交流,展示最先進的圖形學技術。來自英國倫敦大學

【轉載】演講實錄:百度大規模深度學習應用實踐和開源AI框架PaddlePaddle

導語:本文根據PaddlePaddle技術負責人、百度NLP技術委員會主席於佃海在今年英特爾人工智慧大會上的演講——《百度大規模深度學習應用實踐和開源AI框架PaddlePaddle》整理而成。 PaddlePaddle技術負責人、百度NLP技術委員會主席於佃海 正文: 很高興能

8技巧實戰深度學習,資深研究員的血淚教訓

摘要:1新智元編譯來源:nmarkou.blogspot.com.cy作者:NikolasMarkou譯者:劉小芹新智元日前宣佈,獲6家頂級機構總額達數千萬元的PreA輪融資,藍馳創投領投,紅杉資本中國基金、高瓴智成、藍湖資本、藍象資本跟投。本輪融資將用於新智元團隊規模擴充並

手機端開發深度學習應用

第一步模型壓縮 將深度學習模型應用到手機、嵌入式裝置,我們應該減少模型記憶體封裝,減少推斷時間和減少能源使用。有許多方式解決這些問題,例如量子化,權重簡直或者distilling 大模型到小模型. 本文使用在Tensorflow中的量子化工具壓縮模型。縮減到

人人都可以做深度學習應用:入門篇

一、人工智慧和新科技革命 2017年圍棋界發生了一件比較重要事,Master(Alphago)以60連勝橫掃天下,擊敗各路世界冠軍,人工智慧以氣勢如虹的姿態出現在我們人類的面前。圍棋曾經一度被稱為“人類智慧的堡壘”,如今,這座堡壘也隨之成為過去。從2016年三月份

深度學習應用於時間序列資料的異常檢測

本文關鍵點 神經網路是一種模仿生物神經元的機器學習模型,資料從輸入層進入並流經啟用閾值的多個節點。遞迴性神經網路一種能夠對之前輸入資料進行內部儲存記憶的神經網路,所以他們能夠學習到資料流中的時間依賴結構。 如今機器學習已經被應用到很多的產品中去了,例如,siri、Goog

深度學習應用中需要思考的問題

深度學習應用中需要思考的問題 這篇文章摘自Deeplearning4J,這裡博主將其提出來做個備註,也幫助大家深度學習深度學習哈哈。以下是原網址,希望大家轉載註明來源是Deeplearning4J。 原文章地址 對於下列問題,我們無法給出統一的回答,因為答案

【轉】18技巧實戰深度學習,資深研究員的血淚教訓

作者:chen_h 微訊號 & QQ:862251340 微信公眾號:coderpai (文/Nikolas Markou)我自 2013 年以來就一直在使用深度學習和深度置信網路。 我加入了一個綠地專案,負責選擇在計算機視覺平臺上使用的

002推薦系統深度學習應用之 IMDB 解析

IMDB Internet Movie Database【媒體庫】 440 萬個影片資訊 包含電影、綜藝、電視劇等節目詳細資訊 電影資料探勘從業者必爬的網站 Internet Movie Database【使用者資源庫】 七千六百萬個註冊使用者 專業電影看

2018最新人工智慧之深度學習應用實踐60講

第10講. 深度學習CTR預估模型:要解決的幾個關鍵問題.mp4第11講. 離散特徵如何讓DNN可以處理?(1).mp4第12講. 離散特徵如何讓DNN可以處理?(2).mp4第13講. 典型網路融合結構之一:並行結構.mp45 B+ H2 d4 L* ^1 x2 l" f第

深度學習應用到影象超解析度重建3

非寧靜無以致遠。 我們在之前兩篇部落格,深度學習應用到影象超解析度重建1, 深度學習應用到影象超解析度重建2已經介紹了一些影象超分辨的基礎了, 下面我們繼續分享一些最新的一些論文。之前只是想稍微簡單介紹一下每一篇文章,但是寫著寫著發現寫的越來越多,聯想的就越來越多了。將所有

深度學習應用到影象超解析度重建

超解析度技術(Super-Resolution)是指從觀測到的低解析度影象重建出相應的高解析度影象,在監控裝置、衛星影象和醫學影像等領域都有重要的應用價值。SR可分為兩類:從多張低解析度影象重建出高解析度影象和從單張低解析度影象重建出高解析度影象。基於深度學習的SR,主要是基

AWS DeepLens 深度學習無線攝影機_亞馬遜深度學習應用

通過計算機視覺專案、教程和藉助物理裝置進行的實際動手探索,瞭解深度學習(一種使用神經網路進行學習和預測的機器學習技術)的基礎知識。AWS DeepLens 讓您能夠在本地攝像機上執行深度學習模型,以對其捕捉到的內容進行分析並採取措施。

TensorFlow深度學習應用實踐

TensorFlow作為最新的、應用範圍最為廣泛的深度學習開源框架自然引起了廣泛的關注,它吸引了大量程式設計和開發人員進行相關內容的開發與學習。掌握TensorFlow程式設計基本技能的程式設計人員成為當前各組織和單位熱切尋求的熱門人才。他們的主要工作就是利用獲得的資料集設計不同的人工神經模型,利用人工神經網

深度學習應用場景整理

這些應用場景都是商湯科技目前的核心技術實現,商湯科技是一家提供企業級產品的AI技術公司,其專注的領在於計算機視覺和深度學習,目前主要精力投放在移動網際網路、安防、金融領域,目前也在智慧硬體、醫療、教育等業務線在快速佈局。人臉技術 人臉檢測跟蹤人臉關鍵點定位人臉身份認證人臉屬性

深度學習應用系列——計算機視覺:表面缺陷檢測(一)

Fully Convolutional Networks for Surface Defect Inspection in Industrial Environment 佔坑 一種思路:使用語義分割