1. 程式人生 > >beiyangdashu的專欄

beiyangdashu的專欄

===============================================================================================

又到了大家喜聞樂見的淘寶推薦環節(咦?拿錯劇本了)趁這個坑我們八一下貝葉斯吧。
宣告:我貝葉斯也沒學好,如果你想更深入的瞭解這一流派請回去看書,我瞎扯的東西不要輕易相信

===============================================================================================

說起貝葉斯啊,我們先將祖師爺的照片拿出來拜一拜,晨昏三叩首,早晚一炷香


1.jpg

貝葉斯為我們留下的偉大遺產是貝葉斯公式,也就是
P(wj|x)=p(x|wj)P(wj)p(x)
很熟悉對不對?是的,你在任何一本概率論的書上都能找到這個公式,遺憾的是國內的很多教材對貝葉斯的內容提及很少(基本就是幾頁的篇幅),反倒是頻率學派的內容要比貝葉斯的多。

頻率學派跟貝葉斯學派打架的歷史很悠久,這場戰爭就像VIM與Emacs,程式碼大括號寫後面與另起一行類似,雙方互掐了很多年(不過最近好像打得不那麼激烈了?)

那麼貝葉斯與頻率的區別是什麼?下面給出一個不正確的說法:

貝葉斯學派重視先驗
頻率學派重視似然

既然都不正確為什麼還要提出來呢?因為這兩句話有助於你後面的理解,但貝葉斯學派和頻率學派的本質差別是對待引數的觀念不一樣,這兩者就是兩個不同世界的人,關於這點我們留後面聊。


怎麼理解“貝葉斯重先驗,頻率重似然”這個說法?下面我們先來舉幾個通俗易懂的例子

假如你今天很不幸點進這個帖子,假設你又很不幸的看到我的答案有很多贊,排除朋友圈那些點贊狂人的存在,我們就假設這些贊都是正常人點的好了。
那麼現在的問題是“這個瞎扯的答案是否是可靠的?”

很多人就會覺得,臥槽好NB,這麼多贊,這個答案肯定可靠啦,這就是頻率學派的觀點。頻率學派重視資料,而不會對資料帶有任何有色眼鏡來看待,某種程度上來說,頻率學派的人有種“Talk is cheap, show me the code(英語八級翻譯:沒資料你跟我扯什麼犢子)”的性格。

但假如Ng也很不幸地點進這個帖子,然後看到我的答案,你知道的啦,Ng要是一輛波音747的話,那答主充其量只能算臺拖拉機的嘛。Ng看完我的廢話,說“kie lie fie(粵語八級翻譯:我都點進來了你就讓我看這個?!)”然後Ng拍拍答主的肩膀“今天我作為一位長者告訴你一些人生經驗,我覺得你啊,還需要學習,搞深度學習的LeCun,Hinton等人,不知道比你高到哪裡去了,我和他們是談笑風生,不信你看 

↓ ↓ ↓ ↓”
3.jpg
Ng叔叔你都四十多了吐舌頭賣萌真的好?麼麼噠
(沒有徵得劉老師的同意就盜圖,如果劉老師覺得我冒犯了我就刪)

為什麼會這樣呢?用貝葉斯的看法就是,因為Ng的知識比我豐富,所以他的先驗告訴他,這將會是一堆瞎扯的文字,所以他對點讚的數量就不再完全相信了(人家壓根就不會看好嗎......),然後一看文章,果然是篇垃圾。所以,貝葉斯流派對待資料,是帶有感情色彩的。

“我交朋友從來不看他有沒有錢,反正都沒有我有錢”-------低調網紅小王
吶你看,這就是一種先驗

換句話說,貝葉斯看重的是人的知識,也就是人的推測可以新增到估計中去,而頻率流派的只談資料。所以,大家現在能看懂下面這幅漫畫的梗了嗎?

4.jpg

輕鬆愉快喜聞樂見的扯淡環節到此就結束啦,下面我們從數學的角度上來看看頻率學派以及貝葉斯學派的差異

貝葉斯觀點與頻率觀點其本質區別在於:
貝葉斯學派認為引數是變數,而頻率學派認為引數是定常的,只是我們不知道其取值而已

為了更好的理解這個說法,我們將舉一個簡單例子,用兩種觀點去分別處理

假設我們有一個多維的高斯分佈
p(x)=1(2π)d/2|Σ|1/2exp[12(xμ)TΣ1(xμ)]
對於這個分佈,我們假定只有引數μ,也就是高斯分佈的均值是未知的,而引數Σ,也就是協方差矩陣是已知的。現在我們有一系列的訓練集,也就是樣本D=x1,x2,,xn,我們需要根據這些樣本去估計模型的均值。(為什麼我們假定協方差是已知的呢?確實,在實際中我們也不會知道協方差矩陣,但是如果這裡我們也將Σ未知,那麼大家就不想往下看了=。=所以這只是一個簡單的例子)

頻率學派的做法是:
既然樣本已知,而樣本往往是獨立同分布的(I.I.D),那麼我們就有如下的似然函式:
L=p(D|μ)=k=1np(xk|μ)
在這裡,頻率學派就把p(D|μ)看成是引數

相關推薦

beiyangdashu專欄

=============================================================================================== 又到了大家喜聞樂見的淘寶推薦環節(咦?拿錯劇本了)趁這個坑我們八一

愛留圖 - 一個定期開設專欄活動的圖片收集網站誕生。

數據庫 解決方案 sql 本章和大家分享的是一個自制的圖片收集網站:愛留圖;本章不打算分享什麽技術知識點,而分享的主要內容有網站的創立的需求,現階段采用的技術架構,服務器配置等信息;在站點服務構建時用到的部分技術,知識點,以及遇到的問題會在後面分不同的章節+不同的小節來講解,樂於和大家分享自己的經

java執行程序的內存分析系列專欄

運行時 nbsp oid main 空間 如圖所示 jvm 性別 class 近段時間研究了java的程序執行過程中的內存分配,收獲頗多,解決了我最近時間學習java的很多困惑點。寫java內存分析系列的目的主要有兩個,一來是希望給像我一樣的java初學者

李開復華盛頓郵報專欄:發錢解決AI失業潮

2-2 都在 替代 客戶 人在 ews 狀況 職業 屬於 昨天,創新工場創始人兼 CEO 李開復博士在《華盛頓郵報》撰文稱,人工智能革命即將到來,這可能是一個最好的時代,也可能是最壞的時代。   好與壞,將取決於我們如何解決人工智能的副作用之一——失業問題。   根據牛津

【專家專欄】淺談百度搜索排序

百度搜索排序站長圈經常聊的話題中,怎麽提升百度排序一定是排名TOP3的問題,那百度排序的原理是什麽,該怎麽提升,今天給大家分享一下經驗心得。關於排序這件事兒對於像百度搜索來說,並沒有排序這一說法,搜索引擎認為排序是在特定的關鍵詞下網站內容的位置,而關鍵詞是由用戶搜索產生,如果一個關鍵詞沒有被搜索,也就意味著這

(轉載)【笨木頭Lua專欄】基礎補充20:面向對象——類和繼承

笑話 ava span 生成 code BE 手機 情況 忽略 終於來了,在Lua中的面向對象編程,相信目前學習Lua的大部分人都是為了開發手機網遊吧。而且基本都是奔著腳本語言的熱更新特性去的,所以全腳本開發變得十分流行。 對於普及不太廣的Lua(相對於C++、Java等主

(轉載)【笨木頭Lua專欄】基礎補充22:弱引用table

ive AC -c 所在 lan contain 函數 貢獻 缺陷 這次要介紹的內容比較少,就一個——弱引用table 笨木頭花心貢獻,哈?花心?不,是用心~ 轉載請註明,原文地址:http://www.benmutou.com/archives/1808 文章來源:

(轉載)【笨木頭Lua專欄】基礎補充21:面向對象——多重繼承、私密性

子類 先來 nta 參數 hive lua 封裝 完成 存在 在Lua中的多重繼承和私密性可能用得比較少,也可能只是我個人用得比較少。 本來想偷懶不寫這文章的,因為我今天剛買了個漂移板,連起步都還沒學會啊,想多學一會。 咳咳,本著堅持不懈、負責到底的態度,我還是決定隨便寫幾

SQLmap攻防實戰技術專欄開通

SQLmap攻防實戰技術專欄開通以前做專題研究,覺得專題研究才有意義,因為專題更加系統,更加科學,更加條理化,這次應51cto網站的邀請,準備了一個攻防實戰的專欄:滲透攻擊入門到實踐鏈接地址:http://blog.51cto.com/cloumn/detail/3目前該專欄已經正式上線,第一次做專欄,有些地

完成sqlmap滲透攻擊入門到實戰專欄文章初步目標

sqlmap滲透攻擊《滲透攻擊入門到實戰》專欄文章http://blog.51cto.com/cloumn/detail/3從推出到目前基本預訂目標17章內容完成更新。回顧整個過程有以下一些感受:1.技術的東西必須深入,目前安全圈安全生態不是特別好,很多內容都是copy,筆者在對某些內容進行查看時,根據文章提

【重大好消息】51CTO博客滲透攻擊專欄的陳小兵老師開直播啦~

博客專欄 專欄直播 直播課 【重大好消息】51CTO博客滲透攻擊專欄的陳小兵老師開直播啦~ 直播主題:SQLmap數據庫脫褲攻擊與防範 直播時間:2018年5月28日20:30-10:30 直播形式:(QQ群:430231379)群直播 點擊鏈接加入群聊【51CTO博客滲透專欄直播】

關於運維,你想知道的都在這兒了;運維專欄推薦及精選文章合集

運維 網絡運維 合集 推薦文章 博客專欄推薦:老司機網絡運維幹貨集錦(含路由交換安全Qos優化) 簡介:新西蘭某大型企業首席網絡設計師,負責全網的總體設計規劃,包含MPLS網絡總體規劃設計,數據中心規劃設計,全新西蘭分支機構WAN網絡和國際互聯網絡規劃設計等。 網絡運維,這是一個多坑的世

[算法專欄] 爬樓梯問題

窗口 dfs rst 狀態壓縮 ID 問題分析 復雜 else !=   題目:   一個臺階總共有n 級,如果一次可以跳1 級,也可以跳2 級,求總共有多少種跳法。   備註:   這個題目經常出現,包括Microsoft 等比較重視算法的公司都曾先後選用過個這道題

學習要趁早,專欄上新,早鳥訂閱送圖書

sant coo 變現 企業級 精品 阿根廷 玩轉 lov ech 51CTO博客專欄又有新內容了《負載均衡高手煉成記》從入門到實操,Linux老鳥帶你走上高並發架構之路。 為了貫徹學習要趁早的理念,我們特意為前100名訂閱專欄的小夥伴免費贈送紙質圖書一本,特別強調!!是!

喜迎學院周年慶,博客好禮送不停,51CTO博客專欄送書送T恤!!!

log 51cto 7月 負載 指定 定制 提升 圖書 訂閱 好禮一:訂閱新上專欄《負載均衡高手煉成記》就送自選圖書一本。 簡介:學習要趁早,你定專欄我送書,前100名(目前僅剩30名額)訂閱指定專欄就送圖書一本,為早鳥加餐,為夢想增值。 活動地址:學習要趁早,專欄上新,早

51CTO博客專欄匯總貼,聽說看了博客專欄的人工資都漲了~~

~~ 人工 lmap 入門到 案例 開發模式 路由 微服務 網站 新上專欄 專欄名稱:負載均衡高手煉成記簡介:老板要省錢,要求用負載均衡部署linux集群網站?負載均衡是衡量初中級以上運維技術水平的重要標尺?負載均衡是普通運維人員很難有機會接觸和系統學習的知識?本專欄依托

雷霄驊(leixiaohua1020)的專欄

過程 博客 .net title detail bsp -a 雷神 媒體播放 雷神的博客,很值得研究 https://blog.csdn.net/leixiaohua1020/article/list/28 RTMP流媒體播放過程 https://blog.csdn.n

博客專欄上新,早鳥訂閱送書,新上兩個專欄,總有一個你的菜。

nosql數據庫 集群架構 主從復制、 主從 mongodb 互聯 運維 一個 ron 專欄一:十年老兵教你練一套正宗的MySQL降龍十八掌 簡介:本專欄匯集了作者在MySQL運維及教學領域從業十年經驗,針對初學者量身定做,註重實例的操作與分析。由淺入深地剖析MySQL的體

不用每周等更新,一次訂閱看到爽,51CTO博客專欄更新完畢專欄合集

高級運維 com 容器雲 企業架構 公司 跟著 進行 高級工程師 狀態 51CTO博客訂閱專欄自上線以來就收到了廣大技術愛好者的支持,雖然以滿滿的幹貨俘獲了無數技術小哥哥的心,但是因為專欄內容每周更新一篇也讓無數技術小哥哥倍感煎熬。 BUT,現在已經有部分專欄內容已經更新完

周末炎熱不出門,難道宅家吃西瓜?精選助手為您帶來2個最新上線訂閱專欄,周末繼續漲知識

linux 高級 養成 web rip 設計 研究 高並發 javascrip 推薦專欄 一 訂閱專欄:JavaScript全棧工程師養成記 專欄作者:範濟穎(邊城),從事軟件開發 20 年,在軟件分析、設計、架構、開發及軟件開發技術研究和培訓等方面有著非常豐富的經驗,