1. 程式人生 > >REAL-WORD MACHINE LEANING(翻譯本--關於本書)

REAL-WORD MACHINE LEANING(翻譯本--關於本書)

關於本書

《現實生活中的機器學習》(Real-World Machine Leaning)是一本為想要將機器學習技術(Machine Leaning, ML)應用於現實生活中的人們而寫的一本書。該書描述了ML領域主流的演算法與工具。該書的關鍵在於實操,而非從頭開始搭建模型。搭建和使用ML的每一個流程,書中都用由簡到繁的例子進行說明。

學習路徑

本書的第一部分“機器學習的工作流程”主要由5部分構成:

  • 第一章 “什麼是機器學習”主要介紹什麼是機器學習,並闡述機器學習的用途;

  • 第二章 “現實生活中的資料” 深入研究機器學習流程中資料的準備與處理過程;

  • 第三章 “建模與預測”闡述如何構建簡單的機器學習模型,並使用經典的演算法和模型庫進行預測;

  • 第四章 “模型驗證與優化”,本章主要是深入研究建立的機器學習模型,並對其進行驗證與優化;

  • 第五章 “基本特徵工程”,本章介紹了一些常用的特徵工程方法。

第二部分,主要介紹了一些用於模型建立和特徵提取的技術。這部分共有5章,主要包含三個完整的例子:

  • 第六章 “例子”NYC計程車資料”,本章中你講對計程車乘客的支付小費行為進行預測。

  • 第七章 “高階特徵工程”,本章中主要介紹了從自然語言文字、影象、以及時間序列資料中提取特徵的技術與方法。

  • 第八章 “NLP例子:影評”,本章中利用特徵工程的方法對線上影評進行預測。

  • 第九章 “調整機器學習工作流”,本章中提出了將ML系統更適應更大的資料量、更高的預測吞吐量和更低的預測延遲的技術。

  • 第十章 “例如:數字顯示廣告“,本章中根據大量資料建立機器學習模型,對線上數字顯示廣告點選行為進行預測。

如何使用本書

如果你是一個初學者,那麼本書的第一到第五章會引導您通過資料準備和探索、特徵工程、建模和模型評估的過程。書中的python程式使用了主流的機器學習庫(pandas和sklearn).第6章到第10章中包括三個完整的機器學習例子,以及特徵工程方法和模型優化方法。因為所使用的庫都進行了很好的封裝,所以,書中的程式碼可以很好的移植到你的ML應用中。

目標讀者

本書可供程式設計師、資料分析師、統計學家、資料科學家以及希望將機器學習技術應用於實際問題或者僅僅希望瞭解機器學習技術的人們進行閱讀。閱讀本書的人可以在沒有深刻理論推導的前提下對現實生活中的資料進行處理、建模、優化及部署。並且為那些準備深入理解ML的人們進行了數學討論。總之,本書的重點是利用ML解決實際問題。

配套程式碼下載及環境需求

原始碼使用Python、pandas和sklearn,每章中的IPython notebook 都可以從Github中獲取。每章中的(.ipynb)檔案所關聯的資料都在對應的目錄中。需安裝ipython(新手建議直接安裝anaconda)。文中的圖片是通過matplotlib和Seaborn庫生成的。

一些例子中的圖片是在ipython中直接生成的。

最後,有些圖片最好看彩色的。如果在一些電子讀物上閱讀內容則只能看黑白的。本書的連線如下,link

關於作者

Henrik Brink:在學界和業界具有豐富經驗的資料科學家和軟體工程師。
Joseph Richards:是一位擁有應用統計和預測分析專業知識的高階資料科學家。與**Henrik Brink**WiS.IO的共同創始人,同時也是工業機器學習解決方案的領先開發商。
Mark Fetherolf :Nminary Data Science創始人.曾在社會科學研究、化學工程、資訊系統效能、容量規劃、有線電視和線上廣告應用領域擔任統計和分析資料庫開發人員。


翻譯:猛張飛 某司人工智慧工程師
校對:羊咩咩 人類靈魂工程師
交流:
[email protected]