1. 程式人生 > >機器學習(書籍推薦)

機器學習(書籍推薦)

機器學習資料:書籍,資源,方法

2016年12月01日 00:06:43 閱讀數:264 標籤: 機器學習 深度學習 自然語言處理

數學基礎

微積分:偏導數,梯度等等
概率論與數理統計:極大似然估計,中央極限定理,大數法則
最優化:梯度下降,牛頓-拉普拉斯,變分法(尤拉-拉格朗日方程),凸優化等
  • 1
  • 2
  • 3
  • 4

1.線性代數:

3.統計學
幾種型別的書:

Machine Learning Notes in cousera : 如果沒有時間看2中的視訊的話,可以直接看這個部落格:

進階(選擇)學習:
Pattern Recognition And Machine Learning(有點偏Bayesian了,初學者看起來可能有些困難,可以和機器學習,統計學習方法,機器學習公開課視訊結合起來看)
The Elements of Statistical Learning
Machine Learning: A Probabilistic Perspective
《PRML》、《ESL》、《MLAPP》這類進階類書籍。包涵大量理論知識和數學推導(尤其是習題),有助於瞭解Machine Learning方法背後的本質和思想。
Machine Learning學習的過程,就是一個 what -> how -> why 的過程。而PRML,或者說同類的ESL等書籍,最大的作用就是讓你知道為什麼會有這樣的方法,為什麼會有這樣的模型,它背後的intuition和motivation是什麼。而這恰恰是一個Machine Learning Researcher想要進一步使用模型、看懂別人paper中的模型、甚至自己提出新模型的基礎。看PRML會帶給你在Machine Learning上的理解和使用能力一個質的飛躍。

Convex Optimization: Boyd

下面是專業方向書籍)
Introduction to Information Retrieval(資訊檢索入門書籍)
Modern Information Retrieval(現代資訊檢索第二版)
Foundations of Statistical Natural Language Processing(自然語言處理經典之作)
斯坦福自然語言處理公開課: http://www.52ml.net/14247.html
http://www.52nlp.cn/category/mit-nlp

相關推薦

機器學習書籍推薦

機器學習資料:書籍,資源,方法 2016年12月01日 00:06:43 閱讀數:264 標籤: 機器學習 深度學習 自然語言處理 數學基礎 微積分:偏導數,梯度等等 概率論與數理統計:極大似然估計,中央極限定理,大數法則 最優化:梯度下降,牛頓-拉普拉斯,變分法

Java學習之路書籍推薦

個人 分布式 方法 都是 操作 測試 對象 web編程 數據庫 一、基礎類 1、《Thinking in java》(閱讀2遍),入門第一位是建立正確的概念 2、《Core Java》這本書更貼近實踐,更多API的介紹,同樣,更新也更頻繁。(可以選重點章節讀一下) 二、進階

Java學習之路 Java學習之路書籍推薦

Java學習之路(書籍推薦)   一、基礎類 1、《Thinking in java》(閱讀2遍),入門第一位是建立正確的概念 2、《Core Java》這本書更貼近實踐,更多API的介紹,同樣,更新也更頻繁。(可以選重點章節讀一下) 二、進階類 1、

吳恩達機器學習十四推薦系統基於梯度下降的協同過濾演算法

目錄 0. 前言 學習完吳恩達老師機器學習課程的推薦系統,簡單的做個筆記。文中部分描述屬於個人消化後的理解,僅供參考。 如果這篇文章對你有一點小小的幫助,請給個關注喔~我會非常開心的~ 0. 前言 在推薦系統中,主要有兩種方法,基於內容的推薦

機器學習十七——決策樹, 推薦系統進階

PLSA Probabilistic Latent Semantic Analysis是Thomas Hofmann於1999年在UCB讀博期間提出的演算法。 原文: 示意圖: PLSA將生成文件的過程,分為兩個步驟: 1.生成文件的主題。(d

機器學習西瓜書模型評估與選擇

str 驗證 選擇 復雜 集合 數據集 枚舉 重新 模型 1、評估標準   1)經驗誤差 :訓練集上產生的誤差   2)泛化誤差:對新樣本進行預測產生的誤差   3)過擬合:經驗誤差很小甚至為零,泛化誤差很大(模型訓練的很復雜,幾乎涵蓋了訓練集中所有的樣本點)   4)欠擬

機器學習1-1 監督學習

收集 是否 分開 希望 專業 思想 技術分享 多個 無限 監督學習 在本視頻中,我將介紹一種也許是最常見的機器學習問題。即監督學習。後面將給出監督學習更正式的定義,現在最好以示例來說明什麽是監督學習。之後再給出正式的定義。 假設你想預測房價(無比需要啊!),之前,某學生已經

機器學習Machine Learning大家與資源

內容挺多的,轉過來吧 =======================國外==================== Machine Learning 大家(1):M. I. Jordan (http://www.cs.berkeley.edu/~jordan/)  &nbs

吳恩達機器學習十六機器學習流水線、上限分析

目錄 0. 前言 1. 流水線 2. 上限分析(Ceiling analysis) 學習完吳恩達老師機器學習課程的照片OCR,簡單的做個筆記。文中部分描述屬於個人消化後的理解,僅供參考。 如果這篇文章對你有一點小小的幫助,請給個關注

吳恩達機器學習第一章

機器學習可以分為監督學習和無監督學習兩大類。 一、監督學習 監督學習就是在資料中有特定標註,會對資料進行分類,比如癌症例子。監督學習得到的結果可以預測某個新資料對應的結果(線性迴歸)或是該資料屬於哪一類(邏輯迴歸)。比如癌症的預測,房價的預測等。 圈和叉就分別標識兩類資料,即在學習

機器學習 十六電商O2O優惠券使用預測-2

介紹        這篇文章是想繼續總結一遍優惠券預測,寫寫感受並進行一個記錄總結,零零散散以作為記錄整理之用。 本篇是選了三點本人覺得專案中重要的寫了一下,其它內容暫時略過 第一部分:資料清洗資料分析程式碼

機器學習 十七kaggle競賽之泰坦尼克號專案實戰-2

導航        想寫這篇部落格的由衷是做完幾個專案,有時對於圖的畫法和模型融合演算法原理理解還很膚淺,特此加深一下印象。 內容概覽 圖 pandas、matplotlib、seaborn 餅圖 直方圖

機器學習 十五 關聯分析之Apriori演算法

前言        目前隨著資料量迅速增多,從海量資料中尋找有價值的資訊帶來的成本也在不斷增加,傳統的搜尋資料方式已經不能滿足我們的需要,我們先來通過一個演算法看一下演算法時間複雜度快慢帶來的影響,通過計算耗時我們會有個感性

機器學習 十四輕鬆理解模型評價指標

篇首語        相信大家都知道下面的圖片是啥意思,每個無論在啥公司、無論哪個行業都有自己的KPI評價指標,公司會根據公司情況設定公司戰略KPI、部門KPI、以及每個人的指標,對於員工也是比較關心自己的KPI因為關係著你

機器學習 十二讓你輕鬆理解K-means 聚類演算法

前言        你還記得菜市場賣菜的嗎?書店賣書的或者是平時去超市買東西時的物品,它們是不是都根據相似性擺放在一起了呢,飲料、啤酒、零食分佈在各自區域,像這樣各級事物的相似特點或特性組織在一起的方法,在機器學習裡面即成為

機器學習 十一 SVM-支援向量機

春夜喜雨 好雨知時節,當春乃發生。 隨風潛入夜,潤物細無聲。 野徑雲俱黑,江船火獨明。 曉看紅溼處,花重錦官城。 前言         週末很多城市下開了雨,下雨中也不乏忙忙碌碌的人們,有的天不亮已經忙碌匆

機器學習評估方法

2.留出法:將資料集D劃分為兩個互斥的集合,其中一個集合作為訓練集S,另一個作為測試集T,隨機劃分,重複實驗產生多個訓練/測試集,取實驗平均值。(注:通常,會將D中大約2/3−4/5的樣本作為訓練集,其餘的作為測試集,不然,可能會導致評估結果不夠準確穩定。) 3.交叉驗證法

機器學習線性代數筆記

機器學習中的“向量”是指的只有一列的“矩陣”,這個矩陣有多少行就稱其為有多少維度 矩陣的加(減)法:兩個矩陣必須維度相同(行數列數相同)才可以加減,對應的元素相加減 矩陣的乘(除)法:     1、標量與矩陣的乘(除)法:標量與矩陣中的每個元素進行相乘(

機器學習與深度學習系列連載: 第一部分 機器學習十一決策樹2Decision Tree

決策樹2 決策樹很容易出現過擬合問題,針對過擬合問題,我們採用以下幾種方法 劃分選擇 vs 剪枝 剪枝 (pruning) 是決策樹對付“過擬合”的 主要手段! 基本策略: 預剪枝 (pre-pruning): 提前終止某些分支的生長 後剪枝 (post-pr

機器學習建模過程簡概

資料集 資料來源: 公開資料 企業資料 爬取資料 預分析 問題定義 可行性分析 模型預選擇 特徵工程 (特徵工程決定了模型的上限,對模型優化只是逼近這個上限) 資料預處理: 缺失值處理 異常處理 資料歸一化 探索性分析 相似性度量 特徵選擇: Fi