【基礎知識八】集成學習

阿新 • • 發佈：2017-08-12

大致 p s 學習方法 ron 完成 ima 結合 alt http

難點：如何產生“好而不同”的個體學習器；“好而不同”：“準確性”和“多樣性”

一、個體與集成

構建並結合多個學習器來完成學習任務

集成：結果通過投票法voting產生，“少數服從多數”

獲得整體性能提升要求個體學習器：好而不同

1）個體學習器有一定的“準確性”

2）學習器間具有差異

集成學習的錯誤率：

技術分享

假設基學習器的誤差相互獨立，隨著集成中個體分類器數目T的增大，集成的錯誤率將指數級下降，最終趨向於零

事實上，個體學習器是為了解決同一個問題訓練出來的，它們不可能相互獨立

集成學習方法大致分兩大類：

個體學習器之間存在強依賴關系：代表是Boosting

個體之間不存在強依賴關系：代表是Bagging和“隨機森林”

二、Bagging

bootstrap sampling產生T個訓練樣本的采樣集，基於每個采樣集訓練處一個基學習器

隨機森林是Bagging的一個擴展變體

在以決策樹為基學習器構建Bagging集成的基礎上，進一步在決策樹的訓練過程中引入隨機屬性選擇

三、結合策略

數值型輸出：

1. 簡單平均法

2. 加權平均法

標記分類：

1.絕對多數投票法

2.相對多數投票法

3. 加權投票法

學習法

四、多樣性

1. 多樣性度量

通常，考慮個體分類器的兩兩相似/不相似性：

不合度量

相關系數

Q-統計量

K-統計量

2. 多樣性增強

數據樣本擾動

輸入屬性擾動

輸出表示擾動

算法參數擾動

【基礎知識八】集成學習

大致 p s 學習方法 ron 完成 ima 結合 alt http 難點：如何產生“好而不同”的個體學習器；“好而不同”：“準確性”和“多樣性” 一、個體與集成構建並結合多個學習器來完成學習任務集成：結果通過投票法voting產生，“少數服從多數” 獲得整體性能提升要

【基礎知識三】線性模型

解決方法最小方法不能其余比例 http 正則註意一、基本形式通過屬性的線性組合來進行預測，許多非線性模型可以在線性模型的基礎上，引入層級結構或高維映射而得。二、線性回歸最小二乘法：求解ω和b；多元線性回歸：樣本由多個屬性描述，即x為多維向量；若矩

【基礎知識十六】強化學習

動態 sof col -s 範例如何差分 ash 抽象一、任務與獎賞我們執行某個操作a時，僅能得到一個當前的反饋r（可以假設服從某種分布），這個過程抽象出來就是“強化學習”。強化學習任務通常用馬爾可夫決策過程MDP來描述：強化學

【問鏈財經-區塊鏈基礎知識系列】第十八課區塊鏈應用於貸款結算

編者按：在金融業務中，企業或個人向金融機構進行借貸，產生貸款業務，貸款結算是當貸款所有本金、利息和費用都收回後，貸款即告結清。貸款結清是信貸資金的風險已不存在，貸款安全回收，併為銀行帶來了收益。那結合區塊鏈，貸款結算會帶來哪些改變？商業銀行的主要業務有三類：其一，存款

【基礎知識】ActiveMQ基本原理

system 鏈接以及重啟 alt 過濾器全部 pro 相關 “來，根據你的了解說下 ActiveMQ 是什麽。” “這個簡單，ActiveMQ 是一個 MOM，具體來說是一個實現了 JMS 規範的系統間遠程通信的消息代理。它&h

【SpringBoot】集成 Web Flux

ssi ren 接口 you ini TP AS AD util 前言: 必需學會SpringBoot基礎知識簡介: Takes an opinionated view of building production-ready Spring applications

【知識小結】Git 個人學習筆記及心得

art over round TP 緩存 PE QQ 的區別 rda https://mp.weixin.qq.com/s/D96dXYfu3XAA4ac456qo0g git架構工作區：就是你在電腦裏能看到的目錄。版本庫：工作區有一個隱藏目錄.git，，而是

UmengShareDemo【友盟分享SDK集成，基於V6.9.3版本】

【問鏈-區塊鏈基礎知識系列】第十課首席架構師談區塊鏈技術演進

一、區塊鏈和比特幣，都有“幣-鏈-網”三層含義 1、第一層含義是“幣”。這個“幣”並不是剛才王行長所說的真正意義上的“貨幣”，而是一種與區塊鏈密切相關的通證（Blockchain Token）。其本質，是記錄在區塊鏈賬本結構中的某個“元資訊”。例如，比特幣區塊鏈的賬本中的記錄的主要元資料

【問鏈財經-區塊鏈基礎知識系列】第十六課區塊鏈將變革教育產業，未來有六大應用方向

區塊鏈是什麼？ 2008 年中本聰發表的論文《比特幣：一種點對點的電子現金系統》。文章提出，希望可以建立一套新型的電子支付系統，這套系統“基於密碼學原理而不是基於信用，使得任何達成一致的雙方能夠直接進行支付，從而不需要第三方中介參與”。 2009 年 1 月 3 日，區塊鏈的第一個區

Android學習之基礎知識八—Android廣播機制

iss 所有系統運行 perm 情況 space dcom image 一、廣播機制簡介　　Android提供了一套完整的API，允許應用程序自由的發送和接受廣播，發送廣播借助於我們之前學過的：Intent，而接收廣播需要借助於廣播接收器（Broadcast Rece

【問鏈財經-區塊鏈基礎知識系列】第十七課區塊鏈應用於汽車保險行業所帶來的變革

編者按：在一般汽車保險詐騙案，汽車駕駛會故意安排假車禍，然後向保險公司提出各種不實和非法的索賠。據德勤(Deloitte)統計，這些假車禍每年讓保險業損失約7億新元。汽車駕駛若對不同保險公司索賠，除非共享跨產業資料，否則很難發現欺詐行為。區塊鏈結合汽車保險行業將會產生新的火花。

NEON 指令集【基礎備忘】

轉自 http://blog.sina.com.cn/s/blog_602f87700102wj5w.html 作者：Sam (甄峰) [email protected] 之前在一些ARM CPU下，曾在編譯時指定過Neon。

【問鏈財經-區塊鏈基礎知識系列】第十九課區塊鏈應用於電子存證

編者按：在傳統的具有法律效益的存證需要第三方權威公證處進行公證，並且需要繫結時間戳和相關資訊，步驟繁瑣，進度比較慢，後來存證電子化後一定程度上提高了效率、節省了成本，但也會有一些其他的問題，比如第三方篡改電子存證，雖然絕大多數這種情況不會發生，但是當涉及到巨大的利益時，就很難保證

【基礎知識】:比特幣原理解析

一、比特幣的背景對於當下流行的電子貨幣-比特幣系統，朋友圈裡有很多介紹性的文章，也有人試圖通過漫畫來生動的解釋比特幣的特性，但是始終不得要領，總是有些問題想不清楚，為了弄清楚這些問題，最近深入的研讀了幾本比特幣的書籍以及中本聰本人發表的比特幣論文，感覺茅塞頓開，迫不及待的與大家分享我的理解，希望與大家

【問鏈財經-區塊鏈基礎知識系列】第二十課區塊鏈聯盟鏈攻伐戰

編者按：聯盟鏈是目前區塊鏈落地實踐的熱點，也是大家對“殺手級應用”期望最大的區塊鏈部署形態。聯盟鏈的誕生源於對區塊鏈技術的“反思”，是對比特幣、以太坊所體現的技術特點與企業客戶實際需要的融合與折衷，蘊含了大量區塊鏈工作者的智慧與辛勞。由於對未來價值的“共識”，很多廠商推出了自

【C++基礎之八】函式指標和回撥函式

C++很多類庫都喜歡用回撥函式，MFC中的定時器，訊息機制，hook機制等待，包括現在在研究的cocos2d-x中也有很多的回撥函式。1.回撥函式什麼是回撥函式呢？回撥函式其實就是一個通過函式指標呼叫的函式！假如你把A函式的指標當作引數傳給B函式，然後在B函式中通過A函式傳進

【基礎知識思考整理】Mysql高效率的分頁查詢

在工程實踐中，資料庫表中的資料量一般不超過 100W行。當我們想要查詢資料表中滿足條件的第 n個100 行資料的時候，怎樣的查詢方法才能保證較高的效能呢？首先想到的，一般分頁都是用 “limit 起始, 行數” 這樣的方式。上面的含義是：即使我們

Linux學習筆記一【甚而知識篇】

所有 bash 簡單的擴展分區 var 類型 rsh ctr ini 基本知識： Linux中磁盤分區表示：如：/dev/hda5 ：/dev/目錄是存放硬件設備文件，hd表示IDE設備，sd表示SCSI設備，a表示硬盤的順序號，即第一塊硬盤是a，第二塊

【基礎知識思考整理】Zero-copy原理理解（使用者角度）

關於Zero-Copy的原理。主要參照的是一篇03年的文章[1]（Linux Journal），原理講得很明白。首先需要知道應用場景：適用於靜態資源從磁碟到網路的傳送（中間不對資源進行改變），這在web server提供的功能中很常見，一個例子是：

【基礎知識八】集成學習

相關推薦