1. 程式人生 > >機器學習(Machine Learning)&深度學習(Deep Learning)資料

機器學習(Machine Learning)&深度學習(Deep Learning)資料

介紹:這是一篇介紹機器學習歷史的文章,介紹很全面,從感知機、神經網路、決策樹、SVM、Adaboost到隨機森林、Deep Learning.

介紹:這是瑞士人工智慧實驗室Jurgen Schmidhuber寫的最新版本《神經網路與深度學習綜述》本綜述的特點是以時間排序,從1940年開始講起,到60-80年代,80-90年代,一直講到2000年後及最近幾年的進展。涵蓋了deep learning裡各種tricks,引用非常全面.

介紹:這是一份python機器學習庫,如果您是一位python工程師而且想深入的學習機器學習.那麼這篇文章或許能夠幫助到你.

介紹:這一篇介紹如果設計和管理屬於你自己的機器學習專案的文章,裡面提供了管理模版、資料管理與實踐方法.

介紹:如果你還不知道什麼是機器學習,或則是剛剛學習感覺到很枯燥乏味。那麼推薦一讀。這篇文章已經被翻譯成中文,如果有興趣可以移步http://blog.jobbole.com/67616/

介紹:R語言是機器學習的主要語言,有很多的朋友想學習R語言,但是總是忘記一些函式與關鍵字的含義。那麼這篇文章或許能夠幫助到你

介紹:我該如何選擇機器學習演算法,這篇文章比較直觀的比較了Naive Bayes,Logistic Regression,SVM,決策樹等方法的優劣,另外討論了樣本大小、Feature與Model權衡等問題。此外還有已經翻譯了的版本:http://www.52ml.net/15063.html

介紹:作者是來自百度,不過他本人已經在2014年4月份申請離職了。但是這篇文章很不錯如果你不知道深度學習與支援向量機/統計學習理論有什麼聯絡?那麼應該立即看看這篇文章.

介紹:這本書是由谷歌公司和MIT共同出品的電腦科學中的數學:Mathematics for Computer Science,Eric Lehman et al 2013 。分為5大部分:1)證明,歸納。2)結構,數論,圖。3)計數,求和,生成函式。4)概率,隨機行走。5)遞迴。等等

介紹:這是一本由雪城大學新編的第二版《資料科學入門》教材:偏實用型,淺顯易懂,適合想學習R語言的同學選讀。

介紹:這並不是一篇文件或書籍。這是篇向圖靈獎得主Donald Knuth提問記錄稿: 近日, Charles Leiserson, Al Aho, Jon Bentley等大神向Knuth提出了20個問題,內容包括TAOCP,P/NP問題,圖靈機,邏輯,以及為什麼大神不用電郵等等。

介紹:不會統計怎麼辦?不知道如何選擇合適的統計模型怎麼辦?那這篇文章你的好好讀一讀了麻省理工Joshua B. Tenenbaum和劍橋Zoubin Ghahramani合作,寫了一篇關於automatic statistician的文章。可以自動選擇迴歸模型類別,還能自動寫報告...

介紹:對深度學習和representation learning最新進展有興趣的同學可以瞭解一下

介紹:這是一本資訊檢索相關的書籍,是由斯坦福Manning與谷歌副總裁Raghavan等合著的Introduction to Information Retrieval一直是北美最受歡迎的資訊檢索教材之一。最近作者增加了該課程的幻燈片和作業。IR相關資源:http://www-nlp.stanford.edu/IR-book/information-retrieval.html

介紹:Deniz Yuret用10張漂亮的圖來解釋機器學習重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰

介紹:雅虎研究院的資料集彙總: 包括語言類資料,圖與社交類資料,評分與分類資料,計算廣告學資料,影象資料,競賽資料,以及系統類的資料。

介紹:機器學習最佳入門學習資料彙總是專為機器學習初學者推薦的優質學習資源,幫助初學者快速入門。而且這篇文章的介紹已經被翻譯成中文版。如果你不怎麼熟悉,那麼我建議你先看一看中文的介紹。

介紹:主要是順著Bengio的PAMI review的文章找出來的。包括幾本綜述文章,將近100篇論文,各位山頭們的Presentation。全部都可以在google上找到。

介紹:這是一本書籍,主要介紹的是跨語言資訊檢索方面的知識。理論很多

介紹:康奈爾大學資訊科學系助理教授David Mimno寫的《對機器學習初學者的一點建議》, 寫的挺實際,強調實踐與理論結合,最後還引用了馮 • 諾依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."

介紹:這是一本關於分散式並行處理的資料《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。著重介紹了各種神級網路演算法的分散式實現,做Distributed Deep Learning 的童鞋可以參考下

介紹:【“機器學習”是什麼?】John Platt是微軟研究院傑出科學家,17年來他一直在機器學習領域耕耘。近年來機器學習變得炙手可熱,Platt和同事們遂決定開設部落格,向公眾介紹機器學習的研究進展。機器學習是什麼,被應用在哪裡?來看Platt的這篇博文

介紹:2014年國際機器學習大會(ICML)已經於6月21-26日在國家會議中心隆重舉辦。本次大會由微軟亞洲研究院和清華大學聯手主辦,是這個有著30多年曆史並享譽世界的機器學習領域的盛會首次來到中國,已成功吸引海內外1200多位學者的報名參與。乾貨很多,值得深入學習下

介紹:這篇文章主要是以Learning to Rank為例說明企業界機器學習的具體應用,RankNet對NDCG之類不敏感,加入NDCG因素後變成了LambdaRank,同樣的思想從神經網路改為應用到Boosted Tree模型就成就了LambdaMART。Chirs Burges,微軟的機器學習大神,Yahoo 2010 Learning to Rank Challenge第一名得主,排序模型方面有RankNet,LambdaRank,LambdaMART,尤其以LambdaMART最為突出,代表論文為:From RankNet to LambdaRank to LambdaMART: An Overview此外,Burges還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition
Some Notes on Applied Mathematics for Machine Learning

介紹:100 Best GitHub: Deep Learning

介紹:本教程將闡述無監督特徵學習和深度學習的主要觀點。通過學習,你也將實現多個功能學習/深度學習演算法,能看到它們為你工作,並學習如何應用/適應這些想法到新問題上。本教程假定機器學習的基本知識(特別是熟悉的監督學習,邏輯迴歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這裡機器學習課程,並先完成第II,III,IV章(到邏輯迴歸)。此外這關於這套教程的原始碼在github上面已經有python版本了UFLDL Tutorial Code

介紹:這份文件來自微軟研究院,精髓很多。如果需要完全理解,需要一定的機器學習基礎。不過有些地方會讓人眼前一亮,毛塞頓開。

介紹:這是一篇介紹影象卷積運算的文章,講的已經算比較詳細的了

介紹:一個超級完整的機器學習開源庫總結,如果你認為這個碉堡了,那後面這個列表會更讓你驚訝:【Awesome Awesomeness】,國內已經有熱心的朋友進行了翻譯中文介紹

介紹:ACL候任主席、斯坦福大學計算機系Chris Manning教授的《自然語言處理》課程所有視訊已經可以在斯坦福公開課網站上觀看了(如Chrome不行,可用IE觀看) 作業與測驗也可以下載。

介紹:對比 Deep Learning 和 Shallow Learning 的好文,來著浙大畢業、MIT 讀博的 Chiyuan Zhang 的部落格。

介紹:利用卷積神經網路做音樂推薦。

介紹:Java機器學習相關平臺和開源的機器學習庫,按照大資料、NLP、計算機視覺和Deep Learning分類進行了整理。看起來挺全的,Java愛好者值得收藏。

介紹:機器學習最基本的入門文章,適合零基礎者

介紹:機器學習的演算法很多。很多時候困惑人們都是,很多演算法是一類演算法,而有些演算法又是從其他演算法中延伸出來的。這裡,我們從兩個方面來給大家介紹,第一個方面是學習的方式,第二個方面是演算法的類似性。

介紹:看題目你已經知道了是什麼內容,沒錯。裡面有很多經典的機器學習論文值得仔細與反覆的閱讀。

介紹:視訊由加州理工學院(Caltech)出品。需要英語底子。

介紹:總結了機器學習的經典書籍,包括數學基礎和演算法理論的書籍,可做為入門參考書單。

介紹:16本機器學習的電子書,可以下載下來在pad,手機上面任意時刻去閱讀。不多我建議你看完一本再下載一本。

介紹:標題很大,從新手到專家。不過看完上面所有資料。肯定是專家了

介紹:入門的書真的很多,而且我已經幫你找齊了。

介紹:Sibyl 是一個監督式機器學習系統,用來解決預測方面的問題,比如 YouTube 的視訊推薦。

介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville著

介紹:關於(Deep) Neural Networks在 NLP 和 Text Mining 方面一些paper的總結

介紹:計算機視覺入門之前景目標檢測1(總結)

介紹:計算機視覺入門之行人檢測

介紹:Important resources for learning and understanding . Is awesome

介紹:這又是一篇機器學習初學者的入門文章。值得一讀

介紹:線上Neural Networks and Deep Learning電子書

介紹:python的17個關於機器學習的工具

介紹:作者王益目前是騰訊廣告演算法總監,王益博士畢業後在google任研究。這篇文章王益博士7年來從谷歌到騰訊對於分佈機器學習的所見所聞。值得細讀

介紹:把機器學習提升的級別分為0~4級,每級需要學習的教材和掌握的知識。這樣,給機器學習者提供一個上進的路線圖,以免走彎路。另外,整個網站都是關於機器學習的,資源很豐富。

介紹:機器學習各個方向綜述的網站

介紹:深度學習閱資源列表

介紹:這是一本來自微的研究員 li Peng和Dong Yu所著的關於深度學習的方法和應用的電子書

介紹:2014年七月CMU舉辦的機器學習夏季課剛剛結束 有近50小時的視訊、十多個PDF版幻燈片,覆蓋 深度學習,貝葉斯,分散式機器學習,伸縮性 等熱點話題。所有13名講師都是牛人:包括大牛Tom Mitchell (他的[機器學習]是名校的常用教材),還有CMU李沐 .(1080P高清喲)

介紹:在今年的IEEE/IFIP可靠系統和網路(DSN)國際會議上,Google軟體工程師Tushar Chandra做了一個關於Sibyl系統的主題演講。 Sibyl是一個監督式機器學習系統,用來解決預測方面的問題,比如YouTube的視訊推薦。詳情請閱讀google sibyl

介紹:谷歌研究院的Christian Szegedy在谷歌研究院的部落格上簡要地介紹了他們今年參加ImageNet取得好成績的GoogLeNet系統.是關於影象處理的。

介紹:網友問伯克利機器學習大牛、美國雙料院士Michael I. Jordan:"如果你有10億美金,你怎麼花?Jordan: "我會用這10億美金建造一個NASA級別的自然語言處理研究專案。"

介紹:常見面試之機器學習演算法思想簡單梳理

介紹:Videolectures上最受歡迎的25個文字與資料探勘視訊彙總

介紹:在Kaggle上經常取得不錯成績的Tim Dettmers介紹了他自己是怎麼選擇深度學習的GPUs, 以及個人如何構建深度學習的GPU叢集:http://t.cn/RhpuD1G

介紹:對話機器學習大神Michael Jordan

介紹:是Stanford 教授 Andrew Ng 的 Deep Learning 教程,國內的機器學習愛好者很熱心的把這個教程翻譯成了中文。如果你英語不好,可以看看這個

介紹:因為近兩年來,深度學習在媒體界被炒作很厲害(就像大資料)。其實很多人都還不知道什麼是深度學習。這篇文章由淺入深。告訴你深度學究竟是什麼!

介紹:這是斯坦福大學做的一免費課程(很勉強),這個可以給你在深度學習的路上給你一個學習的思路。裡面提到了一些基本的演算法。而且告訴你如何去應用到實際環境中。

介紹:這是多倫多大學做的一個深度學習用來識別圖片標籤/圖轉文字的demo。是一個實際應用案例。有原始碼

介紹:機器學習模型,閱讀這個內容需要有一定的基礎。

介紹: (CRAN Task Views, 34種常見任務,每個任務又各自分類列舉若干常用相關工具包) 例如: 機器學習,自然語言處理,時間序列分析,空間資訊分析,多重變數分析,計量經濟學,心理統計學,社會學統計,化學計量學,環境科學,藥物代謝動力學 等

介紹: 機器學習無疑是當前資料分析領域的一個熱點內容。很多人在平時的工作中都或多或少會用到機器學習的演算法。本文為您總結一下常見的機器學習演算法,以供您在工作和學習中參考.

介紹: 很多幹貨,而且作者還總結了好幾個系列。另外還作者還了一個文章導航.非常的感謝作者總結。

介紹:傳送理由:Rob Fergus的用深度學習做計算機是覺的NIPS 2013教程。有mp4, mp3, pdf各種下載他是紐約大學教授,目前也在Facebook工作,他2014年的8篇論文

介紹:FudanNLP,這是一個復旦大學計算機學院開發的開源中文自然語言處理(NLP)工具包 Fudan NLP裡包含中文分詞、關鍵詞抽取、命名實體識別、詞性標註、時間詞抽取、語法分析等功能,對搜尋引擎 文字分析等極為有價值。

介紹:LinkedIn 開源的機器學習工具包,支援單機, Hadoop cluster,和 Spark cluster 重點是 logistic regression 演算法

介紹:對於英語不好,但又很想學習機器學習的朋友。是一個大的福利。機器學習週刊目前主要提供中文版,還是面向廣大國內愛好者,內容涉及機器學習、資料探勘、並行系統、影象識別、人工智慧、機器人等等。謝謝作者

介紹:《線性代數》是《機器學習》的重要數學先導課程。其實《線代》這門課講得淺顯易懂特別不容易,如果一上來就講逆序數及羅列行列式性質,很容易讓學生失去學習的興趣。我個人推薦的最佳《線性代數》課程是麻省理工Gilbert Strang教授的課程。課程主頁

介紹:大資料資料處理資源、工具不完備列表,從框架、分散式程式設計、分散式檔案系統、鍵值資料模型、圖資料模型、資料視覺化、列儲存、機器學習等。很讚的資源彙總。

介紹:雅虎邀請了一名來自本古裡安大學的訪問學者,製作了一套關於機器學習的系列視訊課程。本課程共分為7期,詳細講解了有關SVM, boosting, nearest neighbors, decision trees 等常規機器學習演算法的理論基礎知識。

介紹:應對大資料時代,量子機器學習的第一個實驗paper 下載

介紹:Wired雜誌報道了UCLA數學博士Chris McKinlay (圖1)通過大資料手段+機器學習方法破解婚戀網站配對演算法找到真愛的故事,通過Python指令碼控制著12個賬號,下載了婚戀網站2萬女使用者的600萬問題答案,對他們進行了統計抽樣及聚類分析(圖2,3),最後終於收穫了真愛。科技改變命運!

介紹:MIT的Underactuated Robotics於 2014年10月1日開課,該課屬於MIT研究生級別的課程,對機器人和非線性動力系統感興趣的朋友不妨可以挑戰一下這門課程!

介紹:mllib實踐經驗分享

介紹:Google用Deep Learning做的antispam(反垃圾郵件)

介紹:機器學習速查表

介紹:從1996年開始在電腦科學的論文中被引用次數最多的論文

介紹:把今年的一個ACM Trans. on Graphics (TOG)論文中的程式碼整理為一個開源的演算法框架,共享出來了。歡迎大家使用。可以實時的採集3D資料、重建出三維模型。Online learning,GPU Random forest,GPU CRF也會後續公開。

介紹:【神經網路黑客指南】現在,最火莫過於深度學習(Deep Learning),怎樣更好學習它?可以讓你在瀏覽器中,跑起深度學習效果的超酷開源專案convnetjs作者karpathy告訴你,最佳技巧是,當你開始寫程式碼,一切將變得清晰。他剛釋出了一本圖書,不斷線上更新

介紹:前Google廣告系統工程師Josh Wills 講述工業界和學術界機器學習的異同,大實話

介紹:使用Neo4j做電影評論的情感分析。

介紹:不僅是資料,而且還對有些資料做了註釋。

介紹:深度學習入門的初級讀本

介紹:機器學習教會了我們什麼?

介紹:scikit-learn是在SciPy基礎上構建的用於機器學習的Python模組。

介紹:喬丹教授(Michael I. Jordan)教授是機器學習領域神經網路的大牛,他對深度學習、神經網路有著很濃厚的興趣。因此,很多提問的問題中包含了機器學習領域的各類模型,喬丹教授對此一一做了解釋和展望。

介紹:A*搜尋是人工智慧基本演算法,用於高效地搜尋圖中兩點的最佳路徑, 核心是 g(n)+h(n): g(n)是從起點到頂點n的實際代價,h(n)是頂點n到目標頂點的估算代價。合集

介紹:本專案利用了Microsoft Azure,可以在幾分種內完成NLP on Azure Website的部署,立即開始對FNLP各種特性的試用,或者以REST API的形式呼叫FNLP的語言分析功能

介紹:現任復旦大學首席教授、計算機軟體博士生導師。電腦科學研究所副所長.內部課程

介紹:好東西的乾貨真的很多

介紹:從硬體、影象到健康、生物、大資料、生物資訊再到量子計算等,Amund Tveit等維護了一個DeepLearning.University小專案:收集從2014年開始深度學習文獻,相信可以作為深度學習的起點,github

介紹:作者是深度學習一線大牛Bengio組寫的教程,演算法深入顯出,還有實現程式碼,一步步展開。

介紹:許多傳統的機器學習任務都是在學習function,不過谷歌目前有開始學習演算法的趨勢。谷歌另外的這篇學習Python程式的Learning to Execute也有相似之處

介紹:作者是華為技術有限公司,諾亞方舟實驗室,首席科學家的李航博士寫的關於資訊檢索與自然語言處理的文章

介紹:利用機用器學習在謠言的判別上的應用,此外還有兩個。一個是識別垃圾與虛假資訊的paper.還有一個是網路輿情及其分析技術