機器學習升級版（VII）——第1課機器學習與數學分析

阿新 • • 發佈：2018-06-09

矩陣分解變化回歸分析兩個例如處理 fff mage 我們

參考：鄒博《機器學習升級版》

1. 機器學習概論

1. 什麽是機器學習
- 定義：對於某給定的任務T，在合理的性能度量方案P的前提下，某計算機程序可以自主學習任務T的經驗E；隨著提供合適、優質、大量的經驗E，該程序對於任務T的性能逐步提高。——by Tom Michael Mitchell
- 通俗理解：機器學習是人工智能的一個分支。我們使用計算機設計一個系統，使它能夠根據提供的訓練數據按照一定的方式來學習；隨著訓練次數的增加，該系統可以在性能上不斷學習和改進；通過參數優化的學習模型，能夠用於預測相關問題的輸出。——by 鄒博
- 機器學習的對象（最重要）
  - 任務 Task,T ，一個或者多個
  - 經驗 Experience,E
  - 性能 Performance,P
- 結論：隨著任務的不斷執行，經驗的累積會帶來計算機性能的提升。

2. 機器學習的內涵與外延

- 學習方式：
  - 有監督學習
  - 無監督學習
  - 增強學習
- 可以解決：
  - 數據清洗/特征選擇
  - 確定算法模型/參數優化
  - 結果預測

- 不可以解決：
  - 大數據存儲/並行計算
  - 做一個機器人
3. 機器學習的一般流程
- 數據挖掘 / 機器學習的流程與西紅柿炒雞蛋
4.機器學習方法

2. 數學分析基礎

1.問題分析
2.構造數列{x_n}
3.自然常數
4.導數

5.常用函數的導數
6.應用1
7.求解 x^x
8.積分應用2：
9.Taylor公式–Maclaurin公式
10.Taylor公式的應用1：計算e^x
11.Taylor公式的應用2
12.方向導數
13.梯度
14.Γ函數：
15.凸函數
16.一階可微
17.二階可微
18.凸函數舉例

3. 術語摘錄

頻數：也稱“次數”，對總數據按某種標準進行分組，統計出各個組內含個體的個數。我們把各個類別及其相應的頻數全部列出來就是“頻數分布”或稱“次數分布”。
- Count(X)
凝固程度：
- X = A.B
- P(A)P(B) vs P(X)
自由程度：
- aXb
- 信息熵 H(a) 、 H(b)
熵：熱力學中表征物質狀態的參量之一，用符號S表示，其物理意義是體系混亂程度的度量。
最大熵模型 ：給定一個概率分布，則熵的定義為：Hp=−p（x）logp(x)
- 自然語言處理解決標記問題
線性回歸：線性回歸是利用數理統計中回歸分析，來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法，運用十分廣泛。其表達形式為y = w‘x+e，e為誤差服從均值為0的正態分布。
正態分布：正態分布（Normal distribution），也稱“常態分布”，又名高斯分布（Gaussian distribution）。
- 正態曲線呈鐘型，兩頭低，中間高，左右對稱因其曲線呈鐘形，因此人們又經常稱之為鐘形曲線。圖像如下所示：
標準正態分布：若隨機變量X服從一個數學期望為μ、方差為σ^2的正態分布，記為N(μ，σ^2)。其概率密度函數為正態分布的期望值μ決定了其位置，其標準差σ決定了分布的幅度。當μ = 0,σ = 1時的正態分布是標準正態分布。
EM算法：指的是最大期望算法（Expectation Maximization Algorithm，又譯期望最大化算法），是一種叠代算法，在統計學中被用於尋找，依賴於不可觀察的隱性變量的概率模型中，參數的最大似然估計。
GMM ：高斯混合模型，也可以簡寫為MOG。
高斯模型：就是用高斯概率密度函數精確地量化事物，將一個事物分解為若幹的基於高斯概率密度函數形成的模型。
卷積：簡單定義：卷積是分析數學中一種重要的運算。
- 設:f(x),g(x)是R1上的兩個可積函數，作積分：
- 可以證明，關於幾乎所有的實數x，上述積分是存在的。這樣，隨著x的不同取值，這個積分就定義了一個新函數h(x)，稱為函數f與g的卷積，記為h(x)=(f*g)(x)。
- 卷積與傅裏葉變換有著密切的關系。利用一點性質，即兩函數的傅裏葉變換的乘積等於它們卷積後的傅裏葉變換，能使傅裏葉分析中許多問題的處理得到簡化。
正則化：由卷積得到的函數f*g一般要比f和g都光滑。特別當g為具有緊致集的光滑函數，f為局部可積時，它們的卷積f * g也是光滑函數。利用這一性質，對於任意的可積函數f，都可以簡單地構造出一列逼近於f的光滑函數列fs，這種方法稱為函數的光滑化或正則化。
- 訓練方法：
  - 梯度下降法：
  - 牛頓法：
ICA : ICA是20世紀90年代提出的，起初是神經網絡的研究中有一個重要的問題，獨立成分分析是一個解決問題的新方法。在許多應用方面，包括特征識別、信號分離。這種方法是用一種解線性方程組的方式的估計方式求解信號源。
SVM：SVM(Support Vector Machine)指的是支持向量機，是常見的一種判別方法。在機器學習領域，是一個有監督的學習模型，通常用來進行模式識別、分類以及回歸分析。
- 與核技術相結合
HMM : 隱馬爾可夫模型（Hidden Markov Model，HMM）是統計模型，它用來描述一個含有隱含未知參數的馬爾可夫過程。其難點是從可觀察的參數中確定該過程的隱含參數。然後利用這些參數來作進一步的分析，例如模式識別。
馬爾可夫過程：馬爾可夫過程（Markov process）是一類隨機過程。它的原始模型馬爾可夫鏈，由俄國數學家A.A.馬爾可夫於1907年提出。馬爾可夫過程是研究離散事件動態系統狀態空間的重要方法，它的數學基礎是隨機過程理論。
LDA : 是一種文檔主題生成模型，也稱為一個三層貝葉斯概率模型，包含詞、主題和文檔三層結構。
生成模型：就是說，我們認為一篇文章的每個詞都是通過“以一定概率選擇了某個主題，並從這個主題中以一定概率選擇某個詞語”這樣一個過程得到。文檔到主題服從多項式分布，主題到詞服從多項式分布。
輿情：是指在一定的社會空間內，圍繞中介性社會事件的發生、發展和變化，作為主體的民眾對作為客體的社會管理者、企業、個人及其他各類組織及其政治、社會、道德等方面的取向產生和持有的社會態度。它是較多群眾關於社會中各種現象、問題所表達的信念、態度、意見和情緒等等表現的總和。
聚類：將物理或抽象對象的集合分成由類似的對象組成的多個類的過程被稱為聚類。
- K-means/K-Mediods/密度聚類/譜聚類
K-means：K-means算法是很典型的基於距離的聚類算法，采用距離作為相似性的評價指標，即認為兩個對象的距離越近，其相似度就越大。該算法認為簇是由距離靠近的對象組成的，因此把得到緊湊且獨立的簇作為最終目標。
K-Mediods：K-mediods算法就是基於劃分方法的一種聚類算法，確切的說，是對K-means算法的一種改進算法。
降維：通過單幅圖像數據的高維化，將單幅圖像轉化為高維空間中的數據集合，對其進行非線性降維。尋求其高維數據流形本征結構的一維表示向量，將其作為圖像數據的特征表達向量。
- PCA/SVD/ICA
PCA : PCA(principal Component Analysis)，即主成分分析方法，是一種使用最廣泛的數據壓縮算法。在PCA中，數據從原來的坐標系轉換到新的坐標系，由數據本身決定。轉換坐標系時，以方差最大的方向作為坐標軸方向，因為數據的最大方差給出了數據的最重要的信息。第一個新坐標軸選擇的是原始數據中方差最大的方法，第二個新坐標軸選擇的是與第一個新坐標軸正交且方差次大的方向。重復該過程，重復次數為原始數據的特征維數。
SVD：奇異值分解（Singular Value Decomposition）是線性代數中一種重要的矩陣分解，是矩陣分析中正規矩酉對角化的推廣。在信號處理、統計學等領域有重要應用。
主題模型pLSA/LDA：主題模型（Topic Model）是用來在一系列文檔中發現抽象主題的一種統計模型。
- 與聚類、標簽傳遞算法相結合
標簽傳遞算法：標簽傳播（LPA）算法是最早的基於標簽的一種算法，是所有基於標簽的算法的基礎。標簽傳播算法最大的特色是簡單、高效，缺點是每次叠代結果不穩定，準確率不高。
條件隨機場
- 無向圖模型，鏈式條件隨機場解決標記問題
變分推導Variation Inference：
- 與EM、貝葉斯相結合，參數、隱變量的學習
深度學習：
- 大規模神經網絡

機器學習升級版（VII）——第1課機器學習與數學分析

矩陣分解變化回歸分析兩個例如處理 fff mage 我們參考：鄒博《機器學習升級版》 1. 機器學習概論 1. 什麽是機器學習定義：對於某給定的任務T，在合理的性能度量方案P的前提下，某計算機程序可以自主學習任務T的經驗E；隨著提供合適、

標準日本語（初級）——第1課李さんは中國人です

# 単語中國人「ちゅうごくじん」：中國人中國「ちゅうごく」中國語「ちゅうごくご」日本人「にほんじん」：日本人日本「にほん」 &nbs

吳恩達（Andrew Ng）《機器學習》課程筆記（1）第1周——機器學習簡介，單變數線性迴歸

吳恩達（Andrew Ng）在 Coursera 上開設的機器學習入門課《Machine Learning》：目錄一、引言一、引言 1.1、機器學習（Machine Learni

2017面向對象程序設計（Java）第1周學習指導及要求（2017.8.24-2017.8.27）

令行 str applet 面向學習目標對象 com 變量課程學習 2017面向對象程序設計（Java）第1周學習指導及要求（2017.8.24-2017.8.27）學習目標了解課程上課方式及老師教學要求，掌握課程學習必要的軟件工具；簡單了解Java特點

洛谷P1919 【模板】A*B Problem升級版（FFT）

targe 空間 break 這就是 bre color show print lex 傳送門話說FFT該不會真的只能用來做這種板子吧…… 我們把兩個數字的每一位都看作多項式的系數然後這就是一個多項式乘法上FFT就好了然後

Linux系統程式設計學習常見問題（一）：VMware虛擬機器下Ubuntu18.04突然上不了網的問題解決方案

問題描述：VMware虛擬機器下Ubuntu18.04突然上不了網的問題：如下圖所示：更改這裡的三種連線方式都是這樣 2. 分析：IP衝突或者配置出了問題，需重新更新設定。 3. 解決：（1）將模式調整為

例項學習ansible系列（13）第一個playbook

知識點：ansible使用playbook來管理自動化task。playbook是yaml格式的檔案，其基本內容可以認為是多條ansible的ad-hoc的語句組成。我們在前面嘗試了很多常用module的ad-hoc的寫法，接下來通過一個最簡單的例子來看看使用playbook怎麼用。

設計模式深入學習IOS版（3）工廠方法模式

1 前言上篇部落格我們學習了簡單工廠模式，今天我們深入一點，學習一下工廠方法模式。工廠方法模式是在簡單工廠模式的基礎上延伸出來的，只不過把原來的工廠類給抽象出來了，這樣是的工廠類可擴充套件性增強。從而進一步的進行了抽象。 2 詳述 2.1 定義定義一個用於建立

Flask學習日誌一（2）-第一個flask程式

# 從flask這個框架匯入flask這個類 from flask import Flask #初始化一個Flask物件 # Flask() # 需要傳遞一個引數 __name__ # 1.方便fla

深度學習筆記（五）第五章深度學習基礎

深度學習是一種特殊的機器學習。要了解深度學習需要對機器學習有紮實的理解。本章是對整本書需要使用的最重要的通用原理的簡單課程。什麼是學習演算法？比如：線性迴歸。大多數學習演算法需要預先設定好超級引數（hyperparameters）。我們要討論怎麼去設定它。

強化學習第二版（翻譯）第二版前言

（由百度翻譯修改而來，儘量保證邏輯通順，建議以原文為主）自本書第一版出版以來的二十年裡，人工智慧取得了巨大的進步，這在很大程度上得益於機器學習的進步，包括強化學習的進步。雖然現有的令人印象深刻的計算能力是這些進步的主要原因，但理論和演算法的新發展也推動了這些力量的發展

（6）第1部分：C++基礎的尾巴~

區別 nbsp 自己字符串處理函數處理 com bsp 操作串處理這篇文章有問題！！！待改 2.6.3編寫自己的頭文件P67中提到：“庫類型string在名為string的頭文件中定義。又如，我們應該把Sales_data類定義在名為Sales_data.h的頭

（基礎篇）第1課：C#程序設計基礎——動起來的Label控件

創建文本編輯器 ble 知識項目 pac too cli 雙擊參考：學通C#的24堂課（羊皮卷系列） 1. Tool：VS2017(VS2008 VS2010 都可以) 2. 新建項目：C# -> Windows應用窗體程序 3. 在彈出的Form窗口中添加L

從零開始學習HTML+CSS（4）Flex佈局中的排列與換行

0.參考網址：https://www.runoob.com/w3cnote/flex-grammar.html 1.排列預設值：橫向排列（從左邊開始排） div { display:flex;/*設定為flex佈局*/ flex-direction:row;/*這

Java程式設計思想讀書筆記（一）第1~13、16章

目錄：第1章物件導論 1.1 伴隨多型的可互換物件面向物件程式設計語言使用了後期繫結的概念。當向物件傳送訊息時，被呼叫的程式碼直到執行時才能確定。也叫動態繫結。編譯器確保被呼叫方法的存在，並對呼叫引數和返回值執行型別檢查（Java是強型別的語言，無法

全國綠色計算大賽模擬賽第二階段（Java）第3關：渡口與船

挑戰任務給定一個渡口（二維的），請計算渡口中停了多少艘船。船用 + 表示，空位用字母o表示。你需要遵守以下規則：給你一個有效的渡口（二維陣列），僅由船和空位組成。船隻能水平或者垂直放置。

標準日本語（初級）——第2課これは本です

#単語本「ほん」：書鞄「かばん」：包，公文包ノート：（note）筆記本，本子；筆記鉛筆「えんぴつ」：鉛筆　　ペン：（pen）筆　　ボールペン：（ballpen）圓珠筆傘「かさ」：傘靴「くつ」：鞋　　ブーツ：（boots）靴子新聞「しんぶん」：報紙　　ニュース：

後端碼農談前端（CSS篇）第七課：定位與浮動

一、定位： 1、定位的理解（1）相對定位相對定位是一個非常容易掌握的概念。如果對一個元素進行相對定位，它將出現在它所在的位置上。然後，可以通過設定垂直或水平位置，讓這個元素“相對於”它的起點進行移動。如果將 top 設定為 20px，那麼框將在原位置頂部下面 20 畫素的地方。如果 left 設定為 3

LINQ學習心得分享----（一）LINQ簡介和基礎學習

第二個問題，LINQ主要解決什麼問題？也就是LINQ的設計目的。我們知道在LINQ之前，面向物件和資料訪問這兩個領域是相互分裂的，程式語言中的資料型別，和資料庫中的資料型別也有一些出入，同時SQL和XML都有自己的查詢語言而物件卻沒有自己的查詢語言，這些在很大程度上限制開發的效率，而LINQ的設計理

計算機組成原理（上） | 第1章測試

1單選(1分) 以小規模積體電路為主要器件的是_ A.第一代計算機 B.第三代計算機 C.第四代計算機 D.第二代計算機答案：B 2單選(1分) 下列器件中，_是16位處理器 A.Intel P6000 B.Intel 80486 C.I

機器學習升級版（VII）——第1課 機器學習與數學分析

1. 機器學習概論

1. 什麽是機器學習

2. 機器學習的內涵與外延

3. 機器學習的一般流程

4.機器學習方法

2. 數學分析基礎

1.問題分析

2.構造數列{xn}

3.自然常數

4.導數

5.常用函數的導數

6.應用1

7.求解 xx

8.積分應用2：

9.Taylor公式–Maclaurin公式

10.Taylor公式的應用1：計算ex

11.Taylor公式的應用2

12.方向導數

13.梯度

14.Γ函數 ：

15.凸函數

16.一階可微

17.二階可微

18.凸函數舉例

3. 術語摘錄

相關推薦

機器學習升級版（VII）——第1課機器學習與數學分析

2.構造數列{x_n}

7.求解 x^x

10.Taylor公式的應用1：計算e^x

14.Γ函數：