1. 程式人生 > >AI工程師必讀的10本ML讀物(附PDF下載)

AI工程師必讀的10本ML讀物(附PDF下載)

640?wx_fmt=png&wxfrom=5&wx_lazy=1

作者:PRANAVDAR

翻譯:李海明

本文共1728字,建議閱讀4分鐘
本文為大家帶來3個方向共10本的機器學習讀物,附帶免費的書籍資源哦~

微信後臺回覆“學習讀物”獲取文章內的書籍資源

介紹

你嗜書如命卻囊中羞澀?很多機器學習與資料科學書籍的價格都令人退避三舍。其實這也無可厚非,畢竟是作者嘔心瀝血、臥薪嚐膽換來的碩果。

然而,這些作者中也不乏善良仁愛之士,將其作品無償分享給他人。這對於那些有志成為資料科學家和AI工程師的人,似如獲至寶。

以下附上機器學習方向的電子書10本,均可免費獲取。書單方面,我們先引入統計學基礎類書籍,隨後是機器學習原理類,最後介紹機器學習進階類。

統計類

統計思維——程式設計師必備的概率與統計知識

Think Stats –Probability and Statistics for Programmers

640?wx_fmt=png&wxfrom=5&wx_lazy=1

作者:Allan B. Downey

《統計思維》是一本關於概率與統計知識的入門書,它主要針對Python程式設計的初學者。本書基於Python庫中的概率分佈(質量函式和累積分佈函式)所著。為了便於初學者學習,此書的程式設計練習大都簡短易懂。此外,該書還使用了美國衛生研究院的資料作為案例進行研究。

《統計思維》的亮點之一就是涵蓋了貝葉斯統計學的基礎知識,對於任何有著雄心壯志的資料科學家來說,這無疑是非常重要的一類學科知識。

貝葉斯推理與機器學習

Bayesian Reasoning and Machine Learning

640?wx_fmt=png

作者: David Barber

《貝葉斯推理與機器學習》是一本關於貝葉斯統計的典範之作。該書引入貝葉斯統計方法來解決機器學習問題。對於任何希望投身機器學習領域的學習者來說,此書都值得一讀。

機器學習與統計學基礎類

統計學習方法概論

An Introduction to Statistical Learning

640?wx_fmt=png

作者: Gareth James, Daniela Witten, TrevorHastie and Robert Tibshirani

《統計學方法概論》是本書單最受歡迎的入門讀物之一。它從機器學習的角度對資料科學進行了介紹。本書介紹了關於如何使用統計計算與機器學習的方法,為剛剛進入機器學習領域的初學者提供了明確清晰的指導。此外,本書還囊括了諸多應用例項與演算法解析。對於那些青睞R程式設計的學習者,本書也有例項介紹。如果你不是程式設計師,可千萬別被這本書嚇倒。無論如何,這本書堪比無價之寶。

有償中文版  http://download.csdn.net/download/majinlei121/9658748

機器學習入門

Understanding Machine Learning

640?wx_fmt=png

作者: Shai Shalev-Shwartz and Shai Ben-David

《機器學習入門》系統介紹了機器學習的知識體系,並重點介紹了機器學習的基本理論與數學推導。這些數學推導可將理論轉化為應用演算法。除此之外,《機器學習入門》還羅列了一個機器學習演算法表。包括(且不限於)隨機梯度下降、神經網路以及結構輸出學習等知識。

程式設計師資料探勘導論

AProgrammer’s Guide to Data Mining

640?wx_fmt=png

作者: RonZacharski

我個人青睞這本書中介紹推薦系統的幾個章節。它以有趣、具象且娛樂的角度來看待社交過濾和基於專案的過濾方法以及如何應用機器學習得以實現目標。本書還介紹了樸素貝葉斯和聚類分析的內容。書中還有一章介紹了非結構文字及其處理方法,是為那些打算學習自然語言處理的學習者而準備的。

本書還提供了基於Python的例題便於學習者進行練習。

海量資料集挖掘

Miningof Massive Datasets

640?wx_fmt=png

作者:Anand Rajaraman and Jeffrey David Ullman

隨著大資料時代的到來,通過挖掘資料來獲取可操作的見解已成為備受追捧的技能。本書重點介紹了曾用於解決資料探勘中關鍵問題的一些演算法,該演算法甚至可用於處理龐大的資料集。

機器學習進階

神經網路簡介

A Brief Introduction to Neural Networks

640?wx_fmt=png

作者:David Kriesel

如果你對神經網路興致濃厚,那麼這本書就是為你而寫的。《神經網路簡介》首先講述了神經網路歷史,隨後又深入探討並研究了不同型別的神經網路數學模型與解釋。此書的讀者需要具備一定的線性代數與微積分的基礎知識。

深度學習

DeepLearning

640?wx_fmt=png

作者: IanGoodfellow, Yoshua Bengio and Aaron Courville

本書是一本由一眾深度學習領域的大咖撰寫的最全面的深度學習讀本。書中具體闡述了諸如蒙特卡羅方法,遞迴與遞迴網路,自動編碼器和深度生成模型等概念。

(有中文版(draft))

用Python處理自然語言

Natural Language Processing with Python

640?wx_fmt=png

作者: StevenBird, Ewan Klein, and Edward Loper

對自然語言處理有濃厚興趣的讀者應該讀讀這本書。本書內容清晰明瞭,擁有極為漂亮的Python程式碼段落。本書還為讀者提供了註釋清楚易懂的資料集,用以分析並理解非結構化資料,文字中的語言結構以及其他自然語言處理問題。

(本書有中文版PDF)

機器學習憧憬

MachineLearning Yearning

640?wx_fmt=png

作者: AndrewNg

任何機器學習的書單中少了Andrew Ng的著作都是不完整的。本書將幫助讀者快速構建AI系統。通過這本書讀者將很快學會如何做出組織機器學習專案所需的各種決策。

本書仍然在定期更新,讀者可以在每個章節釋出後在網站上註冊以獲取更新。

我們希望這個書單可以幫到你,如果你還讀過或者打算閱讀一些其他與機器學習有關的免費書籍,歡迎留言給我們。

(部分翻譯內容  http://blog.csdn.net/nnnnnnnnnnnny/article/details/53524858)

微信後臺回覆“學習讀物”獲取文章內的書籍資源

譯者簡介

640?wx_fmt=jpeg

李海明  中國科學院大學在讀研究生,鐵人三項業餘運動員,熱愛音樂、藝術、生活。喜歡結交各路神仙~一起坐馳神遊,一起南轅北轍

翻譯組招募資訊

工作內容:需要一顆細緻的心,將選取好的外文文章翻譯成流暢的中文。如果你是資料科學/統計學/計算機類的留學生,或在海外從事相關工作,或對自己外語水平有信心的朋友歡迎加入翻譯小組。

你能得到:定期的翻譯培訓提高志願者的翻譯水平,提高對於資料科學前沿的認知,海外的朋友可以和國內技術應用發展保持聯絡,THU資料派產學研的背景為志願者帶來好的發展機遇。

其他福利:來自於名企的資料科學工作者,北大清華以及海外等名校學生他們都將成為你在翻譯小組的夥伴。

點選文末“閱讀原文”加入資料派團隊~

轉載須知

如需轉載,請在開篇顯著位置註明作者和出處(轉自:資料派ID:datapi),並在文章結尾放置資料派醒目二維碼。有原創標識文章,請傳送【文章名稱-待授權公眾號名稱及ID】至聯絡郵箱,申請白名單授權並按要求編輯。

釋出後請將連結反饋至聯絡郵箱(見下方)。未經許可的轉載以及改編者,我們將依法追究其法律責任。

640?wx_fmt=jpeg

點選“閱讀原文”擁抱組織

相關推薦

AI工程師必讀10ML讀物PDF下載

作者:PRANAVDAR翻譯:李海明本文共1728字,建議閱讀4分鐘。本文為大家帶來3個方向共1

重磅 | 美國發布機器智慧6大國家戰略PDF下載

來源:csis.rog本文約2500字,建議閱讀5分鐘。通過本文為大家從6個方面簡單解讀美國機器

畢馬威:2018全球科技創新報告PDF下載

來源:走向智慧論壇摘要:日前,畢馬威釋出《2018全球科技創新報告》,報告顯示,我們如今正處在一

運維俠客行杭州站沙龍回顧 | 雲時代下的運維管理實踐乾貨下載

我們處在一個鉅變的時代,在雲端計算、大資料和物聯網等新技術、新理念不斷更新的大背景下,企業同時面臨著數字化和“網際網路+”轉型的雙重挑戰,企業對於“穩態IT”和“敏態IT”都提出了強烈的需求,如何推進雙態環境下的技術演進變成全行業共同面臨的難題。 在這樣一個“時空交錯”中,優雲軟體推出了一個名為

JAVA小白啟蒙篇:第一個SSM框架搭建示例原始碼下載

  HelloWorld工程原始碼下載 http://download.csdn.net/detail/baidu_31657889/9682606 有償連結(0.1rmb):https://www.fageka.com/Home/Index/sell?id=ctLT7f4

一文看懂 BDTC 2018:探祕大資料新應用 PPT 下載

12 月 8 日,北京新雲南皇冠假日酒店,由中國計算機學會主辦,CCF 大資料專家委員會承辦,CSDN、中科天璣資料科技股份有限公司協辦的 2018 中國大資料技術大會(BDTC)圓滿落下帷幕。 從 2008 第一屆 Hadoop 沙龍,到 2018 的千人大會,活動已

Spring boot基於redis實現附近的人原始碼下載

核心原始碼 public class NearbyPO { @NotNull(message = "id值不能為空") private Integer id; @NotBlank(message

一文看懂BDTC 2018:探祕大資料新應用PPT下載

12 月 8 日,北京新雲南皇冠假日酒店,由中國計算機學會主辦,CCF 大資料專家委員會承辦,CSDN、中科天璣資料科技股份有限公司協辦的 2018 中國大資料技術大會(BDTC)圓滿落下帷幕。 從 2008 第一屆 Hadoop 沙龍,到 2018 的千人大會,活動已

日本大資料應用環境和發展狀況PPT下載

本篇選自野村綜合研究所數字基礎開發部部門經理、高階研究員城田真琴先生近日在“大資料應用中日交流論壇”上所做的題為《日本的大資料應用環境和發展狀況》的演講。 公眾號後臺回覆"181206"即可獲取PPT原文 本篇主要分為四點與大家分享: 日本大資料發

獨家 | 王海峰:百度大資料與人工智慧PPT下載

1月28日上午,由中國工程院和清華大學聯合主辦的“長城工程科技會議”第四次會議工業大資料分會在清

PayPal高階工程總監:讀完這100篇論文 就能成大資料高手論文下載

Big Data technology has been extremely disruptive with open source playing a dominant role in shaping its evolution. While on one hand it has been disrup

java爬蟲爬取網際網路上的各大影視網站---360影視原始碼下載

關於爬蟲: 全球資訊網上有著無數的網頁,包含著海量的資訊,無孔不入、森羅永珍。但很多時候,無論出於資料分析或產品需求,我們需要從某些網站,提取出我們感興趣、有價值的內容,但是縱然是進化到21世紀的人類,依然只有兩隻手,一雙眼,不可能去每一個網頁去點去看,然後再複製貼上。所以

可在廣域網部署執行的即時通訊系統 -- GGTalk總覽原始碼下載

    (最新版本:V6.0,2017.12.11 。即將推出Xamarin移動端版本,包括 Android 和 iOS)        GGTalk開源即時通訊系統(簡稱GG)是QQ的高仿版,同時支援區域網和廣域網,包括客戶端(PC客戶端、android移動端)、服務端、資料庫。從2013年最初的GG1.

Android中AIDL實現程序通訊原始碼下載

AIDL概述 之前的部落格《Android中通過Messenger與Service實現程序間雙向通訊》演示瞭如何通過Messenger實現與Service進行跨程序通訊,即IPC。但用Messenger實現的IPC存在一點不足:Service內部維護著一個Me

【android】自定義ProgressDialog實現暫時隱藏進度值並顯示等待狀態原始碼下載

有時,我們需要訪問網路才能獲取到需要操作的任務數(例如下載的檔案數),而在伺服器返回任務數之前要想隱藏進度百分比和進度數值,就需要我們自己重寫ProgressDialog。等到獲取到任務數後再把進度值和百分比顯示出來。先上效果圖: 關鍵程式碼: public clas

Android 音視訊深入 十六 FFmpeg 推流手機攝像頭,實現直播 原始碼下載

原始碼地址https://github.com/979451341/RtmpCamera/tree/master配置RMTP伺服器,雖然之前說了,這裡就直接貼上過來吧1.配置RTMP伺服器這個我不多說貼兩個部落格分別是在mac和windows環境上的,大家跟著弄MAC搭建RT

從零到一 | 14本書人工智慧入門必備書單PDF連結

來源:AI前線本文共2000字,建議閱讀7分鐘。本文為想要入門機器學習以及夯實數學基礎的學習者提

AS完美匯入Android原始碼原始碼下載

android原始碼版本: android-8.1.0_r1,大約佔34g,刪除了.repo等檔案,可以完美匯入Android Studio,不報錯誤,提供給硬碟不夠充足的朋友們,如下圖所示。 下載地址 匯入Android Studio只需三步

Android 音視訊深入 十七 FFmpeg 獲取RTMP流儲存為flv 原始碼下載

專案地址 https://github.com/979451341/RtmpSave 這個專案主要程式碼我是從雷神那弄過來的,不愧是雷神,我就配個環境搞個介面就可以用程式碼了。 這一次說的是將RTMP流媒體儲存成為一個本地的FLV檔案。因為播放視訊本身佔有很多技術難點,我先不

乾貨 | 國內網際網路公司是如何做微服務實踐的?PPT下載

微服務的概念最早由Martin Fowler與James Lewis於2014年共同提出,並隨著Netflix最佳實踐的釋出而為業界所知。如今,在國內有了大量的微服務實踐案例,5月18日,網易雲聯合雲片在武漢主辦“微服務架構落地的最佳實踐”活動,網易雲、雲片、美洽、網易雲音樂