1. 程式人生 > >《機器學習實戰》高清版pdf免費下載(資源分享)

《機器學習實戰》高清版pdf免費下載(資源分享)

《機器學習實戰》高清版pdf免費下載

《機器學習實戰》高清版pdf免費下載


下載地址:網盤下載




編輯推薦

介紹並實現機器學習的主流演算法

面向日常任務的高效實戰內容

《機器學習實戰》沒有從理論角度來揭示機器學習演算法背後的數學原理,而是通過“原理簡述+問題例項+實際程式碼+執行效果”來介紹每一個演算法。學習計算機的人都知道,計算機是一門實踐學科,沒有真正實現執行,很難真正理解演算法的精髓。這本書的好處就是邊學邊用,非常適合於急需邁進機器學習領域的人員學習。實際上,即使對於那些對機器學習有所瞭解的人來說,通過程式碼實現也能進一步加深對機器學習演算法的理解。

《機器學習實戰》的程式碼採用Python語言編寫。Python程式碼簡單優雅、易於上手,科學計算軟體包眾多,已經成為不少大學和研究機構進行計算機教學和科學計算的語言。相信Python編寫的機器學習程式碼也能讓讀者儘快領略到這門學科的精妙之處。

內容簡介

機器學習是人工智慧研究領域中一個極其重要的研究方向,在現今的大資料時代背景下,捕獲資料並從中萃取有價值的資訊或模式,成為各行業求生存、謀發展的決定性手段,這使得這一過去為分析師和數學家所專屬的研究領域越來越為人們所矚目。 

《機器學習實戰》主要介紹機器學習基礎,以及如何利用演算法進行分類,並逐步介紹了多種經典的監督學習演算法,如k近鄰演算法、樸素貝葉斯演算法、Logistic迴歸演算法、支援向量機、AdaBoost整合方法、基於樹的迴歸演算法和分類迴歸樹(CART)演算法等。第三部分則重點介紹無監督學習及其一些主要演算法:k均值聚類演算法、Apriori演算法、FP-Growth演算法。第四部分介紹了機器學習演算法的一些附屬工具。 

《機器學習實戰》通過精心編排的例項,切入日常工作任務,摒棄學術化語言,利用高效的可複用Python程式碼來闡釋如何處理統計資料,進行資料分析及視覺化。通過各種例項,讀者可從中學會機器學習的核心演算法,並能將其運用於一些策略性任務中,如分類、預測、推薦。另外,還可用它們來實現一些更高階的功能,如彙總和簡化等。

作者簡介

  Peter Harrington,擁有電氣工程學士和碩士學位,他曾經在美國加州和中國的英特爾公司工作7年。Peter擁有5項美國專利,在三種學術期刊上發表過文章。他現在是Zillabyte公司的首席科學家,在加入該公司之前,他曾擔任2年的機器學習軟體顧問。Peter在業餘時間還參加程式設計競賽和建造3D印表機。

精彩書評

“易學易懂,用處很大。” 

——Alexandre Alves,Oracle CEP的架構師 

“精心織構的程式碼完美地詮釋出機器學習的核心要義。” 

——Patrick Toohey,Mettler-Toledo Hi-Speed軟體工程師 

“例項很棒!可用於任何領域!” 

——John Griffin,Hibernate Search in Action一書的合作者 

“敘述循序漸進,巧妙地闡述了演算法之間的差異。” 

——Stephen McKamey,Isomer Innovations技術實踐總監

目錄

第一部分 分類 

第1章 機器學習基礎 

1.1  何謂機器學習 

1.1.1  感測器和海量資料 

1.1.2  機器學習非常重要 

1.2  關鍵術語 

1.3  機器學習的主要任務 

1.4  如何選擇合適的演算法 

1.5  開發機器學習應用程式的步驟 

1.6  Python語言的優勢 

1.6.1  可執行虛擬碼 

1.6.2  Python比較流行 

1.6.3  Python語言的特色 

1.6.4  Python語言的缺點 

1.7  NumPy函式庫基礎 

1.8  本章小結 

第2章 k-近鄰演算法 

2.1  k-近鄰演算法概述 

2.1.1  準備:使用Python匯入資料 

2.1.2  從文字檔案中解析資料 

2.1.3  如何測試分類器 

2.2  示例:使用k-近鄰演算法改進約會網站的配對效果 

2.2.1  準備資料:從文字檔案中解析資料 

2.2.2  分析資料:使用Matplotlib建立散點圖 

2.2.3  準備資料:歸一化數值 

2.2.4  測試演算法:作為完整程式驗證分類器 

2.2.5  使用演算法:構建完整可用系統 

2.3  示例:手寫識別系統 

2.3.1  準備資料:將影象轉換為測試向量 

2.3.2  測試演算法:使用k-近鄰演算法識別手寫數字 

2.4  本章小結 

第3章 決策樹 

3.1  決策樹的構造 

3.1.1  資訊增益 

3.1.2  劃分資料集 

3.1.3  遞迴構建決策樹 

3.2  在Python中使用Matplotlib註解繪製樹形圖 

3.2.1  Matplotlib註解 

3.2.2  構造註解樹 

3.3  測試和儲存分類器 

3.3.1  測試演算法:使用決策樹執行分類 

3.3.2  使用演算法:決策樹的儲存 

3.4  示例:使用決策樹預測隱形眼鏡型別 

3.5  本章小結 

第4章 基於概率論的分類方法:樸素貝葉斯 

4.1  基於貝葉斯決策理論的分類方法 

4.2  條件概率 

4.3  使用條件概率來分類 

4.4  使用樸素貝葉斯進行文件分類 

4.5  使用Python進行文字分類 

4.5.1  準備資料:從文字中構建詞向量 

4.5.2  訓練演算法:從詞向量計算概率 

4.5.3  測試演算法:根據現實情況修改分類器 

4.5.4  準備資料:文件詞袋模型 

4.6  示例:使用樸素貝葉斯過濾垃圾郵件 

4.6.1  準備資料:切分文字 

4.6.2  測試演算法:使用樸素貝葉斯進行交叉驗證 

4.7  示例:使用樸素貝葉斯分類器從個人廣告中獲取區域傾向 

4.7.1  收集資料:匯入RSS源 

4.7.2  分析資料:顯示地域相關的用詞 

4.8  本章小結 

第5章 Logistic迴歸 

5.1  基於Logistic迴歸和Sigmoid函式的分類 

5.2  基於最優化方法的最佳迴歸係數確定 

5.2.1  梯度上升法 

5.2.2  訓練演算法:使用梯度上升找到最佳引數 

5.2.3  分析資料:畫出決策邊界 

5.2.4  訓練演算法:隨機梯度上升 

5.3  示例:從疝氣病症預測病馬的死亡率 

5.3.1  準備資料:處理資料中的缺失值 

5.3.2  測試演算法:用Logistic迴歸進行分類 

5.4  本章小結 

第6章 支援向量機 

6.1  基於最大間隔分隔資料 

6.2  尋找最大間隔 

6.2.1  分類器求解的優化問題 

6.2.2  SVM應用的一般框架 

6.3  SMO高效優化演算法 

6.3.1  Platt的SMO演算法 

6.3.2  應用簡化版SMO演算法處理小規模資料集 

6.4  利用完整Platt SMO演算法加速優化 

6.5  在複雜資料上應用核函式 

6.5.1  利用核函式將資料對映到高維空間 

6.5.2  徑向基核函式 

6.5.3  在測試中使用核函式 

6.6  示例:手寫識別問題回顧 

6.7  本章小結 

第7章 利用AdaBoost元演算法提高分類 

效能 

7.1  基於資料集多重抽樣的分類器 

7.1.1  bagging:基於資料隨機重抽樣的分類器構建方法 

7.1.2  boosting 

7.2  訓練演算法:基於錯誤提升分類器的效能 

7.3  基於單層決策樹構建弱分類器 

7.4  完整AdaBoost演算法的實現 

7.5  測試演算法:基於AdaBoost的分類 

7.6  示例:在一個難資料集上應用AdaBoost 

7.7  非均衡分類問題 

7.7.1  其他分類效能度量指標:正確率、召回率及ROC曲線 

7.7.2  基於代價函式的分類器決策控制 

7.7.3  處理非均衡問題的資料抽樣方法 

7.8  本章小結 

第二部分 利用迴歸預測數值型資料 

第8章 預測數值型資料:迴歸 

8.1  用線性迴歸找到最佳擬合直線 

8.2  區域性加權線性迴歸 

8.3  示例:預測鮑魚的年齡 

8.4  縮減係數來“理解”資料 

8.4.1  嶺迴歸 

8.4.2  lasso 

8.4.3  前向逐步迴歸 

8.5  權衡偏差與方差 

8.6  示例:預測樂高玩具套裝的價格 

8.6.1  收集資料:使用Google購物的API 

8.6.2  訓練演算法:建立模型 

8.7  本章小結 

第9章 樹迴歸 

9.1  複雜資料的區域性性建模 

9.2  連續和離散型特徵的樹的構建 

9.3  將CART演算法用於迴歸 

9.3.1  構建樹 

9.3.2  執行程式碼 

9.4  樹剪枝