1. 程式人生 > >深度學習資料彙總(滿滿的乾貨)

深度學習資料彙總(滿滿的乾貨)

Deep Learning(深度學習),一個很火熱的研究方向,然而,它已經有很久的歷史,只不過由於當時沒有充足的資料和強大的計算能力,導致它此起彼伏了好幾次。如今,他為什麼會這麼火熱,最主要的原因有兩點:

1.大資料時代已經來臨,國內很多的公司每天可以收集到足夠多的資訊,並將其儲存起來,對其經過預處理之後,將其作為深度學習的深入。總之,企業已經有了海量的資料,基本上可以滿足你的各種需求。除此之外,越來越多的資料集被開放了出來,但是主要用來進行“學術研究”,這些資料的貢獻者主要是國外的公司、大學、研究機構等,而國內在這方面做得不是很好。

2.計算機的計算能力已經大幅度提升,這主要還要歸功於這些硬體公司們的不懈努力,在這裡給你們以崇高的敬意!主要的貢獻者包括Microsoft、NVIDIA、IBM、Google、ARM、TI、Xillion等眾多知名企業。雖然CPU的計算能力已經很強,但是明顯可以感覺到的是CPU的發展已經到了一個瓶頸階段。發展的速度比較緩慢。而對應的其他硬體廠商則發展迅速,主要的代表是NVIDIA,這個GPU提供商,由於GPU的高效能,使得它廣泛的應用到了深度學習領域中,用來訓練Model。但是它的致命缺點是“功耗太高”,需要耗費好大的電力資源,同時需要認真的考慮散熱。這就給Xillion–這個FPGA提供商創造了一個良好的機會,因為FPGA最大的特點就是“可程式設計、低功耗,高速率”,這使得它成為了一種候選硬體,但是當前FPGA在深度學習領域的應用並不多,主要還是GPU。這可能是因為它對程式設計人員有一定的要求,需要你懂得一定的硬體架構知識,即門檻相對會比較高一些。當然除了這兩者之外,還有一個競爭對手,那就是TPU – 由谷歌主導的一種專門用於深度學習的處理器,這實質上是一種積體電路(ASIC)。它的優點是“高速”,但是缺點是“只能應用於特定領域,而且成本極高。”谷歌在近日已經發表論文並聲稱自己的TPU可以比GPU快幾十倍!但是經過很多專家和學者的討論,一致認為TPU更多的會作為“深度學習中的一部分,不可能完全使用TPU”。即更好的一種趨勢會是“用GPU進行訓練,用TPU進行測試”,即不同的初始幹自己適合乾的事,共同協作起來,從而從本質上加速整個流程。我本人很贊同這個觀點。

正是由於這兩個主要的原因導致又重新復活了起來。
好啦,開始我們的正題。

1.首先要推薦的是“Github”,這個開源平臺,為什麼要推薦它呢,原因有以下幾點:
1)它裡面收集了大量最新的技術成果,主要包括“論文” “專案”等;

2)許多知名的國際或者國內的大公司、研究機構、知名學者和大牛們都會有自己的Github。便於釋出或者開源一些框架或者程式碼。

3)它可以作為你自己的一個“資料倉庫”,你可以免費的在它上面儲存大量的資料,上傳一些自己的工程或者專案。這樣不僅不需要大量的硬碟資源,同時可以和全球的頂尖大牛們分享經驗一起探討和學習。這是一個難得的好機會。

4)其實,它也是一個尋找“程式碼Bug的解決方案的好地方” – Bug解決利器。在這裡有眾多的專案和程式碼,許多人可能都會遇到這樣或者那樣的問題,他們會提出問題並探討問題,找出合適的解決方案。如果你有一個“code方面的問題”,一般都可以在它裡面找到一個“完美的解決方案”。讓我感受最為深刻的是,我在學習Linux的過程中在Github中解決了很多的問題,並且學到了好多實用的知識或者技巧。這一點是很多人都會忽略掉的一個地方。如果你沒有解決問題,你可以去stackoverflow stackoverflow尋找解決方案。

5) 這裡有一個小的方法:你可以簡單的通過在Github中查詢某個技術,通過觀察其“Watch”和“Star”的大小來初略的判斷某種技術的受歡迎程度。雖然這並不完全準確,但是它會給你提供一些思路,可以更好的幫助你找到最新最熱的前沿技術。一個具體的案例就是:如今,各大公司都推出了自己的“深度學習框架”,你如果想要想要了解那個框架最受歡迎,你可以通過觀察Star的個數得出:“目前使用tensorflow的人是最多的,遠遠的超越了其它框架”。當然這是有原因的。找到了方向後,你就可以深入的瞭解它來尋找真正的原因。

6)當然它也是一個學習新技術的平臺,因為這裡面有來自全球的知名學者和大牛們,他們大多都會分享自己的專案。你可以通過學習他們的專案,慢慢的積累一些方法和技巧。比如:“編寫整潔的程式碼 – 程式碼風格” “如何使用具體的函式” “學習他們的專案佈局以及程式碼” “優化程式碼的效率” “結合多個工具高效的開發自己的程式碼”等等。一個簡單的例子就是“你可以通過學習tensorflow官方提供的標準樣例程式碼去深入的學習tensorflow,在此期間你很塊就會知道tensorflow中有那些常用的模組,如何使用具體的某個函式,通常需要配置哪些引數,如何優化程式碼的結構,專案的構成等,同時,你可以通過程式碼的註釋學到一些有用的方法,如FLAGS的使用;除此之外,你會學會使用CNN、RNN、LSTM並通過實踐來理解它們的原理;當然,你也會看到它的應用領域和前景。”

7)你可以通過Github交到一些志同道合的朋友,認識一些大牛,一起成長,一起學習,一起進步。相信當你長時間使用Github之後,你可以深深的感受到這一點!

總之,它有很多的優點,有待我們自己去深入的發掘和分析。以上只是我個人的見解。就憑以上的原因就值得你去註冊一個Github賬號啦!

Github官網連結
你可以通過以下的介面開始你的Github之旅。
這裡寫圖片描述

2.接下來我要推薦的是“arXiv” – 一個深度學習的經典論文集,在它裡面會收錄一些預發表的論文,你可以提前瞭解你當前方向的發展動態。更早的瞭解別人的現狀。這裡面的論文質量相當高,都是深度學習領域的一些泰斗或者頂尖的公司或者團隊預發表的高質量論文。一般都是被“CVPR” “ECCV” “ICCV” “NLP” “ACM”等一流的國際會議所收錄的一些論文。這些論文不僅會有詳細的講解,同時大多都會發布開源的程式碼,你可以藉助他們釋出的程式碼更好的去驗證演算法的效能,更快的開發出自己的新演算法或者新程式碼。

原因如下所述:
1)首先,可以使用它來把握“深度學習的最新成果”,這對一個搞科研的人來說極其重要;
2)其次,你可以進行高階檢索,類似谷歌的高階檢索功能;
3)你可以下載到免費的PDF論文,即不用花錢,同時能學到最新的技術;
4)你可以為這些論文新增BookMark,這裡支援多種軟體;

這是它的主頁:在這裡你可以看到一些最新的論文。
主頁

這是檢索AI後的結果:這裡會選擇有關A方面最新的論文,並進行排序。
AI

高階檢索功能:
高階檢索功能

論文介面:你可以下載免費的PDF等多個版本的論文。
論文下載介面

3.接下來推薦的是一些開源框架的官方網站
原因如下:
1. 在官方網站,你可以找到詳細的使用文件,包括示例程式碼和API使用;
2. 你可以查詢API介面詳細引數;
3. 你可以找到Install這些框架的指南;
4. 你可以和一些志同道合的朋友討論針對某個框架的某個問題,畢竟“自己開發的東西自己最瞭解”。
5. 你可以詳細的瞭解到這個框架所具有的功能,以及如何快速高效的使用它;

網址如下:
1) Tensorflow -- https://www.tensorflow.org/
github:https://github.com/tensorflow/tensorflow

2)  Caffe -- http://caffe.berkeleyvision.org/
github:https://github.com/BVLC/caffe

3) Theano -- http://deeplearning.net/software/theano/install.html
github:https://github.com/Theano/Theano

4) keras -- https://keras.io/
github:https://github.com/fchollet/keras

5) Torch -- http://torch.ch/
github:https://github.com/torch/torch7

6) Lasagne -- http://lasagne.readthedocs.io/en/latest/
github:https://github.com/Lasagne/Lasagne

7) MXNet -- http://mxnet.io/
github:https://github.com/dmlc/mxnet

8) DIGITS -- https://developer.nvidia.com/digits
github:https://github.com/NVIDIA/DIGITS

9) CNTK -- https://cntk.codeplex.com/
github:https://github.com/Microsoft/CNTK

10) PaddlePaddle -- http://www.paddlepaddle.org/
github:https://github.com/PaddlePaddle/Paddle

11) Deeplearning4j -https://github.com/deeplearning4j/
deeplearning4j

注:
1) 以上列出了一些最常用的深度學習框架,並沒有列全,感興趣的同學可以自己搜尋。
2) 可悲的一件事是,國內基本上除了PaddlePaddle沒有好的深度學習框架,而國內的眾多大牛卻是許多框架的開發者!中國需要有自己的深度學習框架!BAT,你們必須努力!中國的大牛們,我們需要努力!

4.下面,我給大家推薦一些有關深度學習方面的學習資料

3)http://deeplearning.net/
這是一個網站,裡面含有有關“深度學習”的“資料集” “軟體” “研究小組” “demo” “tutorials”以及“深度學習領域最新動態”等很多實用的內容。

4)https://cn.udacity.com/course/deep-learning–ud730
這是一個視訊平臺,裡面有許多高質量的視訊,包括很多領域,當然也有“深度學習” “機器學習” “智慧駕駛” “tensorflow”等一些新技術。大多數的視訊都是免費的。而且任課教師都是該領域的一些大牛。分為“初階” “中階” “高階”課程,你需要根據自己的實際情況進行選擇。

6)https://web.stanford.edu/class/cs20si/
這個一個有關NLP的經典視訊,由斯坦福大學提供。對於NLP領域的人來說,是一個必看的教程。隨著NLP與CV領域不斷的融合,我建議CV領域的我們也應該瞭解瞭解,這樣才能更好的促進NLP與CV的高效融合。

10)http://mp.sohu.com/profile?xpt=YWlfZXJhQHNvaHUuY29t
這一一個國內的收集有關深度學習方面最新研究的網站 – 新智元,裡面會對最新發表的一些高質量論文進行簡要的總結,並提供下載連結,可以作為你的“今日頭條”。在閒暇之餘瞭解一下最新動態。每天它都會更新一部分內容,值的你去關注。很專業的一個網站!

12) https://github.com/junhyukoh/deep-reinforcement-learning-papers
這也是在Github上的“RL論文集”,和上一個相比,有更多的論文,內容更加充足,更加全面。如果你對這方面的內容感興趣,值的進行收藏,閒暇之時可以理解理解裡面的論文。學習學習“強化學習”,這在許多大公司裡面有著很多的用處。

13)https://github.com/google/seq2seq
這是Google開源的一個“seq2seq”的庫,seq2seq有很多用途,例如“翻譯系統” “給影象、視訊新增標題” “文字轉換為影象”。有著很好的應用前景,利用這個庫你可以更快的開發自己的seq2seq模型。

17)https://github.com/yusugomori/DeepLearning
這是一個利用多種語言來學習深度學習的庫,包括C、C++、Go、Java、Python等,同時含有許多基本的網路CNN、AE、DBN等。

20)https://www.analyticsvidhya.com/blog/2016/08/deep-learning-path/
這是一個利用Python進行深度學習的簡單案例,深度學習開發語言有很多種,但是使用的最為廣泛的一種語言是“Python”,許多的深度學習框架都提供了相應的python介面,即便是剛開始不支援Python,後期都可能會有新的支援python介面的版本退出。一個具體的例子就是Torch,最後退出了pytorch。Python十分簡單,使用起來非常方便,可以大大加速專案的開發。但是與C和C++相比,它的執行效率比較低。基於這個原因,很多深度學習框架將C++和Python結合起來,利用Python快速的構建Model,而執行時卻使用C++在後臺執行。這樣更加完美,tensorflow就是一個案例。

21)https://github.com/ty4z2008/Qix/blob/master/dl.md
這是一個大牛收集的有關深度學習的資料,裡面用中文解釋,包括“書籍” “文獻” “機器學習” “統計學”等,內容非常的豐富,有各種各樣的資料,可以滿足不同人的不同需求。“只有你想不到,沒有大牛做不到的,哈哈”。

22)http://deeplearning.stanford.edu/tutorial/
這是一個UFLDL提供的關於“無監督學習和深度學習”的理論教材,裡面介紹了深度學習中一些非常基礎的概念和知識,例如“MLP” “Pooling”等,可以作為一個入門資料,也可以作為一個加強理解的資料,在你編寫了一部分程式碼之後,重新來理解這些概念,你會有一些全新的理解。可以真正的加深你對這些內容的理解。

以下是一些大牛主頁

5.下面介紹一些深度學習領域大牛的主頁,你可以通過瀏覽他們的主頁,來把握深度學習最近的動態,以及該領域的一些熱點,一般大牛都走在科技前沿,他們的研究方向的前景一般都不差。只要你有興趣,可以在他們的研究領域做一些基礎的研究。

1)lecun -- http://yann.lecun.com/
# 當前主要進行GAN(對抗神經網路的研究)

2) Yoshua Bengio http://www.iro.umontreal.ca/~bengioy/yoshua_en/index.html
# 主要從事深度學習領域“基礎理論”的研究,目前仍在“學術界潛心研究”。

3)Andrew Ng -- http://www.andrewng.org/
# 吳恩達,一個再深度學習領域赫赫有名的華人。在深度學習的部署方面很有造詣。有很強的專案經驗。不過,最近剛從百度辭職,不知如今身在何處?

4)LiFeiFei http://vision.stanford.edu/feifeili/
# 李飛飛,深度學習領域的又一個“大牛華僑”,目前是斯坦福大學的教授。主要從事的是CV領域。

5)Lan goodfellow -- http://www.iangoodfellow.com/
# 深度學習領域的一個新秀,目前的研究方向是GAN。目前在DeepMind工作。

6)張潼 -- http://tongzhang-ml.org/research.html
又一個深度學習領域的“華人大牛”,目前在騰訊工作。主要研究DL(增強學習)。

以下是他們的個人照片:
李飛飛
李飛飛

Yoshua Bengio
Yoshua Bengio

Lan goodfellow
這裡寫圖片描述

張潼
這裡寫圖片描述

吳恩達
這裡寫圖片描述

lecun
這裡寫圖片描述

注:如今,深度學習領域的大牛太多啦,我這裡僅僅列舉了其中幾個“頂級大牛”,他們時真真正正的大牛,當之無愧的大牛,給深度學習領域做出了巨大的貢獻,在這裡給他們致以崇高的敬意!

6.最後,我在這裡給大家意見一些有用的公眾號,這絕對不是在打廣告,這些公眾號都有很多幹貨,值的你去“關注”它。

1)新智元 – 在國內,我認為這是一個很權威的“深度學習資訊平臺”,每天都會更新內容,並且提供下載連結。這是我個人強烈推薦的,“不用不知道,用了呱呱叫”。

2)AI世代 – 這一個一個資訊平臺,也會不時的更新內容,但是相對來講,更新的內容較少,而且更新的速度比較慢。

3)AI科技評論 – 這也會一個資訊平臺,每天會定期更新內容,而且乾貨很多,而且每天的問題都很有針對性,和新智元不相上下。值的你去關注一下!

4)深度學習世界 – 一個稍微小眾的平臺,更新速度比較慢,更新的數量也比較少,但是確實都是乾貨,一些很實用的技術和方法。建議你去關注。

注:更多的諮訊平臺需要我們一起去挖掘,歡迎大家提出更多更好的資訊平臺,我們共同研究,共同學習。畢竟這是一個“需要共享學習的社會”。一個微不足道的共享可能會服務到很多的人。希望大家都能貢獻自己的一份力量。

```
好啦,這篇Blog暫時寫到這裡,後續還會不斷的補充新的內容,有興趣的同學可以持續關注。

注:
1)由於個人的能力有限,只能收集到有限的資源,如果大家發現更好的資源,可以聯絡我,我會隨時更新,讓更多的人看到這些有用的資料,大家一起學習,一起進步。
2)歡迎你提出你的寶貴意見,如果你有好的想法或者建議可以隨時聯絡我,我會及時回覆大家。謝謝。
3)由於本部落格是我個人的原創,如果你想要裝載,請給我傳送資訊,我會及時回覆大家。
郵箱:1575262785@qq.com

相關推薦

深度學習資料彙總滿滿的乾貨

Deep Learning(深度學習),一個很火熱的研究方向,然而,它已經有很久的歷史,只不過由於當時沒有充足的資料和強大的計算能力,導致它此起彼伏了好幾次。如今,他為什麼會這麼火熱,最主要的原因有兩點: 1.大資料時代已經來臨,國內很多的公司每

機器學習 深度學習資料彙總含文件,資料集,程式碼等

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

Java學習資料彙總吐血分享----持續更新中

2013年12月11日 16:14:09 去快來慢 閱讀數:1963 標籤: java

日語學習資料彙總可下載

2007年12月05日 11:34:34 sunxboy 閱讀數:37 標籤: Flash JSP

深度學習資料整理深度神經網路理解

https://blog.csdn.net/tiandijun/article/details/25192155   近這兩年裡deep learning技術在影象識別和跟蹤等方面有很大的突破,是一大研究熱點,裡面涉及的數學理論和應用技術很值得深入研究,這系列部落格總結了

iOS超全開源框架、專案和學習資料彙總1UI篇

上下拉重新整理控制元件**1. ** --僅需一行程式碼就可以為UITableView或者CollectionView加上下拉重新整理或者上拉重新整理功能。可以自定義上下拉重新整理的文字說明。(推薦)**2. ** --下拉重新整理控制元件4500+star,值得信賴**3. ** --一個效果很酷炫的

近200篇機器學習&深度學習資料分享含各種文件,視訊,原始碼等

編者按:本文收集了百來篇關於機器學習和深度學習的資料,含各種文件,視訊,原始碼等。而且原文也會不定期的更新,望看到文章的朋友能夠學到更多。 介紹:這是一篇介紹機器學習歷史的文章,介紹很全面,從感知機、神經網路、決策樹、SVM、Adaboost 到隨機森林、Deep Learning. 介紹:這是瑞

深度學習論文彙總2018.6.25更新

好記性不如爛筆頭,一直以來都只有寫書面學習筆記的習慣,從來沒寫過部落格。如今很榮幸地加入了浙江大學學生人工智慧協會,立志在跟隨優秀的老師和學長學姐學習AI領域相關技術的同時也為協會的運營和發展貢獻力量。9月份入學以來,因為科研需要加上個人濃烈的興趣,一直堅持著學習機器學習、深

深度學習論文彙總2018.2.4更新

好記性不如爛筆頭,一直以來都只有寫書面學習筆記的習慣,從來沒寫過部落格。如今很榮幸地加入了浙江大學學生人工智慧協會,立志在跟隨優秀的老師和學長學姐學習AI領域相關技術的同時也為協會的運營和發展貢獻力量。9月份入學以來,因為科研需要加上個人濃烈的興趣,一直堅持著學習機器學習、深度學習相關的知識。如今,我還負責

Win10深度學習環境配置上篇:python3 + curl + pip + Jupyter notebook

好記性不如爛筆頭,純粹為自己的學習生活記錄點什麼! 本次記錄win10下安裝python3+curl+pip+jupyter,以及修改右鍵快捷開啟cmd 對於大多數的學習者,還是習慣選擇在ubuntu系統上學習深度學習,主要還是因為絕大多數演算法實現都是ubunt

基於深度學習的VQA視覺問答技術

mark一下,感謝作者分享! http://www.sohu.com/a/225043785_99992181 https://blog.csdn.net/sinat_26917383/article/details/73048045 https://blog.csdn.net/A

使用安卓手機開發深度學習簡易教程Python3+Keras

本教程基於安卓手機平臺,在PyDroid3軟體上,使用Python3語言配合Keras框架開發深度學習。本文章主要涉及在手機上開發環境的搭建,以及簡單的示例程式碼,如果想深入研究開發,還需要讀者自己花些功夫了。不廢話,開始教程。。 準備工作 1、手上需要有一個安卓手機,最近兩年

WebGL學習資源彙總持續更新

WebGL學習資源彙總 書籍 書籍 計算機圖形影象處理基礎 WebGL程式設計指南 書籍介紹: 《計算機圖形影象處理基礎》是2011年電子工業出版社出版的圖書,作者是唐波。全書共分10章,主要內容包括了圖形與

github上值得關注的機器學習深度學習大牛持續更新

前言: 因為想搜相關內容發現搜到的基本上都是前端大牛(這可能是由於js是github上最受歡迎的語言),所以打算自己mark一下同時方便他人,於是寫下這篇博文,本文持續更新,如果有童鞋覺得有不錯的賬號也可以評論推薦給我~我也會更新上去~ 大牛:(排名不分先後) 一: Wes McKinn

深度學習基礎系列十一| Keras中影象增強技術詳解

  在深度學習中,資料短缺是我們經常面臨的一個問題,雖然現在有不少公開資料集,但跟大公司掌握的海量資料集相比,數量上仍然偏少,而某些特定領域的資料採集更是非常困難。根據之前的學習可知,資料量少帶來的最直接影響就是過擬合。那有沒有辦法在現有少量資料基礎上,降低或解決過擬合問題呢?    

隨筆 分享個人學習總模組絕對乾貨

前言:          個人學習總模組的使用的是百度腦圖做的學習記錄。近段時間沒有更新部落格。一部分原因就是在整理知識體系。 現在分享一套個人的學習體系。 學習連結:          

Go語言學習資料下載PDF檔案

Golang語言社群--專業分享技術go相關技術文章 我們一直在努力,再為廣大的gopher提供學習的平臺 下載連結: http://www.golang.ltd/forum.php?mod=viewthread&tid=6537

iOS 開發學習資料整理持續更新

https://segmentfault.com/a/1190000002473595#articleHeader16 https://github.com/Tim9Liu9/TimLiu-iOS https://github.com/ipader/SwiftGuide 部落格園: http://w

吳恩達 深度學習 程式設計作業5-1Part 2

吳恩達 Coursera 課程 DeepLearning.ai 程式設計作業系列,本文為《序列模型》部分的第一週“迴圈神經網路”的課程作業——第二部分:字母級的語言模型:恐龍獸島。 Character level language model -

吳恩達Coursera深度學習課程筆記1-1神經網路和深度學習-深度學習概論

這系列文章是我在學習吳恩達教授深度學習課程時為了加深自己理解,同時方便後來對內容進行回顧而做的筆記,其中難免有錯誤的理解和不太好的表述方式,歡迎各位大佬指正並提供建議。1、什麼是神經網路               在簡單的從房屋面積預測價格時,神經網路可以理解為將輸入的房屋