1. 程式人生 > >【機器學習】吳(一)

【機器學習】吳(一)

什麼是機器學習?

①Two definitions of Machine Learning are offered. Arthur Samuel described it as: "the field of study that gives computers the ability to learn without being explicitly programmed." This is an older, informal definition.

②Tom Mitchell provides a more modern definition: "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."

任何機器學習問題可以分為兩大類:監督學習和無監督學習

什麼是監督學習?

在監督學習中,我們給出了一個數據集,並且已經知道我們正確的輸出應該是什麼樣子,認為輸入和輸出之間存在關係。

監督學習問題被歸類為“迴歸”和“分類”問題。在迴歸問題中,我們試圖在連續輸出中預測結果,這意味著我們試圖將輸入變數對映到一些連續函式。在分類問題中,我們試圖在離散輸出中預測結果。換句話說,我們試圖把輸入變數對映成離散的類別。

(a)迴歸-給定一個人的照片,我們必須根據給定的圖片來預測他們的年齡。

1、找到代價函式:是用迴歸找到最佳答案的一個主要方法

例如下面這個線性迴歸:


為了找到J的使J為最小值的(θ的值),一般會使用梯度下降演算法

2、梯度下降演算法:


3、多特徵線性迴歸


4、多特徵線性迴歸的梯度下降演算法


①特徵縮放:

特徵值之間的取值範圍儘可能得相似,區別過大會導致求最優值時變得複雜,可以才用縮放的方法去縮放特徵值使他們的範圍足夠接近,且可以縮放到-n~+n

②選擇適合的特徵

5、正規方程


①正規方程的不可逆性

   a.當兩個特徵存在密切的相關例如線性相關時,正規方程右邊存在無意義或者求不出θ

    b.當特徵值比較多而樣本比較少時

6、正規方程和梯度下降演算法都是用來求θ的

二者區別即使用情況,當特徵值的數量n小於10000時採用正規方程,因為正規方程更加方便快捷

但是當n大於10000時,這一項比較難以得出,時間複雜度太高,所以需要選擇使用梯度下降演算法


(b)分類-對於一個腫瘤患者,我們必須預測腫瘤是惡性還是良性。

什麼是無監督學習?

我們不知道問題的模樣,但是演算法會自動抽出資料中的結果集,聚類或非聚類

(a)聚類分析:以100萬不同的收集和尋找基因,對這些基因的方式自動組組,是由不同的“類似或相關的變數,如lifespan,位置,角色,和作業系統。

(b)非聚類演算法:雞尾酒會”,讓你在尋找混沌結構的環境。(即個人的聲音識別聲音和音樂從網格剖分(雞尾酒會)。

相關推薦

機器學習

什麼是機器學習?①Two definitions of Machine Learning are offered. Arthur Samuel described it as: "the field of study that gives computers the abil

機器學習正確率Precision和召回率Recall

在二分類問題中, 如果將一個正例判別為正例,那這就是一個真正例(True Positive, TP); 如果將一個反例判別為反例,那麼這就是一個真反例(True Negative,TN); 如果將

機器學習TensorFlow 優化器Optimizer

昨天整理了一下梯度下降演算法及其優化演算法,傳送門:https://blog.csdn.net/zxfhahaha/article/details/81385130 那麼在實戰中我們如何用到這些優化器,今天就整理一下TensorFlow中關於優化器Optimi

科普周機器學習掃盲篇

給大家舉個例子:以我們之前做的波士頓房價視覺化迴歸預測來看,如果告訴機器一棟房子所在地區的住宅地比例、環保的指標、自住的比例、便利的指數、以及不動產稅率等指標,以及不同指標下房屋的價格,這樣機器就能學習這些指標的特點和房價的關係,而給出當前指標下具體的房屋價格。但是這個價格準確率的問題要看機器通過不同模型和演

學習reactjs——使用npm創建react項目並整合elementUI

web -s from 頁面 rain tle export build head 在實習的過程中了解了react,所以打算使用react搭建一個屬於自己的頁面,如有問題請教正,謝謝。 Github:https://github.com/yclxt/react-elemen

恩達老師機器學習筆記SVM

時隔好久沒有再拾起機器學習了,今日抽空接著學 今天是從最簡單的二維資料分類開始學習SVM~ (上圖為原始資料) SVM的代價函式 這裡套用以前logistic迴歸的模板改一下下。。 load('ex6data1.mat'); theta=rand(3,1); [

機器學習LDA線性判別分析或fisher判別分析

內容目錄: 一、LDA/fisher判別分析 二、LDA判別分析與PCA對比 一、fisher判別分析 1.首先在模式識別課程上學習的是fisher判別,LDA概念是看川大同學寫的500問接觸的,兩者是一樣的東西。 2推薦:深度學習500問 github連結形式是問答形式,初學者概念

機器學習LR線性迴歸—— python3 實現方案

import numpy as np class LR: def calcost(self, X, y, theta, lamb=1): ''' 平方誤差代價函式,使用L2正則化 :param X: 特徵集 m*n,m

機器學習LFMLatent Factor Model

LFM(Latent Factor Model) 參考了[Key_Ky部落格](%28http://www.cnblogs.com/Key-Ky/p/3579363.html%29)的潛在矩陣分解的

Coursera恩達機器學習教程筆記

    人工智慧行業如火如荼,想要入門人工智慧,吳恩達老師的機器學習課程絕對是不二之選(當然,這不是我說的,是廣大網友共同認為的)    教程的地址連結:    有的同學可能進不去這個網站,解決辦法參照如下連結:    這個辦法本人親測有效,因為我看的時候也打不開(囧!!) 

機器學習CNN簡化模型—— python3 實現方案

import numpy as np from scipy.io import loadmat class CNN: def __init__(self, layer1=2, learning_rate=0.1, iters=10000): sel

mybatis學習之入門

前言:       從開始的JDBC經歷dbuttls,mybatis,Hebernate,JDBC是最熟悉不過的了,JDBC提供了一種基準,據此可以構建更高階的工具和介面,使資料庫開發人員能夠編寫

中國mooc北京理工大學機器學習第一周

lib odi pen 運行 numpy 聚類 準則 ++ mooc 從今天開始跟著北理工的老師走一遍sklearn,在這裏做筆記。 一、聚類 1、K-Means方法 先貼代碼,所有數據的下載地址:http://pan.baidu.com/s/1hrO5NW4

中國mooc北京理工大學機器學習第二周:分類

kmeans 方法 輸入 nump arr mod 理工大學 each orm 一、K近鄰方法(KNeighborsClassifier) 使用方法同kmeans方法,先構造分類器,再進行擬合。區別是Kmeans聚類是無監督學習,KNN是監督學習,因此需要劃分出訓練集和測試

機器學習入門點滴待補充完整

arr intro 統計 int ica nts 機器學習算法 .com 場景 Step1-知識準備: 1. 數學:線性代數,概率論和統計,高數 2. 程序語言:Matlab R 或 Python(只用於學習入門,不是實現的最佳語言) 3. 推薦書籍:選擇一到兩本公式較少、

《Python 機器學習》筆記

環境 成功 設定 相關 reward 能力 學習 一定的 env 賦予計算機學習數據的能力涵蓋:1.機器學習的一般概念2.機器學習方法的三種類型和基本術語3.成功構建機器學習系統所需的模塊機器學習的三種不同方法1.監督學習2.無監督學習3.強化學習通過監督學習對未來事件進行

算法排序選擇排序

如何 接下來 運行時 images 復雜度 分析 穩定性 stat ima 在排序算法中,最簡單的莫過於選擇排序了。 排序思路: 在選擇排序算法中分別有一個外循環和一個內循環,假設需要排序的序列共有n個元素,所以外循環的次數為n次,在n次交換(外循環)中,每次設置序列中的第

機器學習實戰教程:線性回歸基礎篇

學習 reg style spa 目標 pub auto 機器 輸入 一 什麽是回歸?   回歸的目的是預測數值型的目標值,最直接的辦法是依據輸入,寫入一個目標值的計算公式。   假如你想預測小姐姐男友汽車的功率,可能會這麽計算:               Ho

機器學習基礎概念

“無監督學習”是指人們在獲得訓練的向量資料後在沒有標籤的情況下嘗試找出其內部蘊含關係的一種挖 掘工作,這個過程中使用者除了可能要設定一些必要的超引數( hyper-parameter)以外,不 用對這些樣本做任何的標記甚至是過程干預; “有監督學習”與此不同,每一個樣本都有著 明確的標籤,最

系統學習機器學習之總結--常見分類演算法優缺點

主要是參考網上各種資源,做了整理。其實,這裡更多的是從基礎版本對比,真正使用的時候,看資料,看改進後的演算法。 1. 五大流派 ①符號主義:使用符號、規則和邏輯來表徵知識和進行邏輯推理,最喜歡的演算法是:規則和決策樹 ②貝葉斯派:獲取發生的可能性來進行概率推理,最喜歡的演算法是:樸素貝葉