1. 程式人生 > >hellation_王東的專欄

hellation_王東的專欄

資料探勘和機器學習的區別和聯絡

周志華 《機器學習和資料探勘》

資料探勘受到很多學科領域的影響,其中資料庫、機器學習、統計學無疑影響最大。
對資料探勘而言,資料庫提供資料管理技術,機器學習和統計學提供資料分析技術。

統計學往往醉心於理論的優美而忽視實際的效用。
因此,統計學界提供的很多技術通常都要在機器學習界進一步研究,變成有效的機器學習演算法之後才能再進入資料探勘領域。

從這個意義上說,統計學主要是通過機器學習來對資料探勘發揮影響,而機器學習和資料庫則是資料探勘的兩大支撐技術。

從資料分析的角度來看,絕大多數資料探勘技術都來自機器學習領域,但機器學習研究往往並不把海量資料作為處理物件,因此,資料探勘要對演算法進行改造,使得演算法效能和空間佔用達到實用的地步。同時,資料探勘還有自身獨特的內容,即關聯分析。

而模式識別和機器學習的關係是什麼呢,傳統的模式識別的方法一般分為兩種:統計方法和句法方法。句法分析一般是不可學習的,而統計分析則是發展了不少機器學習的方法。也就是說,機器學習同樣是給模式識別提供了資料分析技術。

至於,資料探勘和模式識別,那麼從其概念上來區分吧,資料探勘重在發現知識,模式識別重在認識事物

機器學習的目的是建模隱藏的資料結構,然後做識別、預測、分類等。因此,機器學習是方法,模式識別是目的

總結一下吧。只要跟決策有關係的都能叫 AI(人工智慧),所以說 PR(模式識別)、DM(資料探勘)、IR(資訊檢索) 屬於 AI 的具 體應用應該沒有問題。 研究的東西則不太一樣, ML(機器學習) 強調自我完善的過程。 Anyway,這些學科都是相通的。

相關推薦

hellation_專欄

資料探勘和機器學習的區別和聯絡 周志華 《機器學習和資料探勘》 資料探勘受到很多學科領域的影響,其中資料庫、機器學習、統計學無疑影響最大。 對資料探勘而言,資料庫提供資料管理技術,機器學習和統計學提供資料分析技術。 統計學往往醉心於理論的優美

嶽:中國文化絕不產生科學

       轉載地址:https://t.qianzhan.com/daka/detail/160819-8c807f50.html#comment              &n

海天之專欄-----讓優秀成為一種習慣!

1、我們可以通過在百度輸入“Sublime” ,就可以下載Sublime的英文版本。下載好後我們可以直接安裝,安裝方法同其他軟體沒有異同。 2、安裝好後的Sublime是英文版本的,我們要進行漢化必須還要下載一些漢化的檔案,下面提供下載地址: 3、做好上面的工作了,我們

鄧仰專欄|機器學習的那些事兒(一)

目錄 1.緒論 1.1.概述 1.2 機器學習簡史 1.3 機器學習改變世界:基於GPU的機器學習例項      1.3.1 基於深度神經網路的視覺識別      1.3.2 AlphaGO      1.3.3 IBM Waston 1.4 機器學習方

專訪宜信AI中臺團隊負責人:智慧金融時代,大資料和AI如何為業務賦能

前言:宜信技術人物專訪是宜信技術學院推出的系列性專題,我們邀請軟體研發行業的優秀技術人,分享自己在軟體研發領域的實踐經驗和前瞻性觀

第一次作業

直接 漂亮 論文 似的 工作流程 odin 合格 width 方式    作業一之讀《構建之法》 自從拜讀了鄒欣老師的力作《構建之法》後,感觸頗深。從書中不難看出鄒老師是一個才華橫溢、卓爾不群的人。《構建之法》言辭精辟,引人入勝。雖然只是淺讀了《構建之法》的部分章節,但是對

軟件工程第二次作業(

ring 重復 for 單詞數 span 做人 深深 [] com   一周的時光轉瞬即逝,第二周的作業也悄悄地開始了。楊老師的一言一行都深深地刻在我的心裏,“不遲到”是做人做事的根本,努力則是成就人生的基石。正如《道德經》中所言“天地不仁,視萬物為芻狗”,上天對待世間萬物

第二周例行報告(

es2017 size ron 編碼 技術 資料 -s 技術分享 bsp (一)PSP 類別 內容 開始時間 結束時間 中斷時間(min) 中斷原因 預計時間(min) 凈花費時間(min) 編碼及寫博客(一) 程序功能一及看書 9.14 19:35 9.14 2

烏鎮網際網路大會 | 院士談人工智慧:計算力就是生產力

11月8日,由工業和資訊化部主辦,世界智慧財產權組織聯合主辦的人工智慧論壇在世界網際網路大會期間召開。 工業和資訊化部副部長陳肇雄、世界智慧財產權組織副總幹事王彬穎出席論壇並致辭。阿聯酋人工智慧部部長奧拉馬,中國工程院院士鄔賀銓,中國工程院院士、浪潮集團首席科學家王恩東,百度公司創始人、

(Kevin P. Wang)鵬的專欄

本應用尊重並保護所有使用服務使用者的個人隱私權。為了給您提供更準確、更有個性化的服務,本應用會按照本隱私權政策的規定使用和披露您的個人資訊。但本應用將以高度的勤勉、審慎義務對待這些資訊。除本隱私權政策另有規定外,在未徵得您事先許可的情況下,本應用不會將這些資訊對外披露或向第三

junehappylove(俊偉)的專欄

Rancher搭建 首先rancher需要安裝了docker的linux環境,我的系統版本為 cat /etc/redhat-release CentOS Linux release 7.5.1804 (Core) 在docker的基礎上啟動rancher伺

《計算機演算法設計與分析 第4版 () 課後答案[1-9章]》pdf版電子書附下載連結+30個總結JVM虛擬機器的技術文排版好(收藏版)

技術書閱讀方法論 一.速讀一遍(最好在1~2天內完成) 人的大腦記憶力有限,在一天內快速看完一本書會在大腦裡留下深刻印象,對於之後複習以及總結都會有特別好的作用。 對於每一章的知識,先閱讀標題,弄懂大概講的是什麼主題,再去快速看一遍,不懂也沒有關係,但是一定要在不懂的

鶴霖的專欄

大部分的人,覺得八小時之內是工作,八小時之外是生活,工作和生活之間有明顯的界限,工作和生活是需要平衡的兩極。而實際上,工作即生活,生活即工作,八小時以內和八小時以外沒有界限。工作是為了更好的生活,生活中的歷練,又能讓我們更好的生活。兩者水乳一體,相互交融。 巧用下班後的時間

8601 最大長方體問題(優先做) 時間限制:1000MS 記憶體限制:1000K 提交次數:950 通過次數:383 計算機演算法設計與分析

題目 8601 最大長方體問題(優先做) 時間限制:1000MS 記憶體限制:1000K 提交次數:950 通過次數:383 題型: 程式設計題 語言: G++;GCC;VC Description 一個長,寬,高分別是m,n,p的長方體被分割成mnp個小

志強_android_專欄

banner使用步驟  1---新增依賴  compile 'com.youth.banner:banner:1.4.9' //最新版本  2--- 新增許可權*<uses-permission android:name="android.permission.INT

【正一專欄】馬蓉到底對寶強還有啥感情?

馬蓉到底對王寶強還有啥感情? 新聞要連起來看才有意思,昨天消沉許久的王寶強離婚事件有了最新的進展,王寶強的前助理宋喆因為涉嫌職務犯罪而被刑事拘留,這真是大快人心、吃王寶強的喝王寶強的,還搶王寶強的老婆,最後連王寶強的公司都要搶去,這樣的人一直逍遙法外,真是太沒天理

計算機演算法設計與分析課本(著)課後演算法實現題1-3 最多約數問題

問題描述: 正整數x的約數是能整除x的正整數。正整數x的約數個數記為div(x)。例如,1 2 5 10都是10的約數,且div(10)=4。設a和b是2個正整數,a<=b,找出a和b之間約數個數最多的數x。 演算法設計: 對於給定的2個正整數a<=b,計算a和b之間約數個數最多

字典序問題(計算機演算法與分析 1-2

問題描述: 在資料加密和資料壓縮中常需要對特殊的字串進行編碼.給定的字母表A由26個小寫英文字母組成,即A={a,b...z}.該 字母表產生的長序字串是指定字串中字母從左到右出現的次序與字母在字母表中出現的次序相同,且每個字元最 多出現1次.例如,a,b,ab,bc,xy

《計算機演算法設計與分析 第2版+第3版+第4版 () 》原書附答案pdf版電子書附下載連結+30個總結JVM虛擬機器的技術文排版好(收藏版)

技術書閱讀方法論 一.速讀一遍(最好在1~2天內完成) 人的大腦記憶力有限,在一天內快速看完一本書會在大腦裡留下深刻印象,對於之後複習以及總結都會有特別好的作用。 對於每一章的知識,先閱讀標題,弄懂大概講的是什麼主題,再去快速看一遍,不懂也沒有關係,但是一定要在不懂的

曉雨的專欄

     突然之間,烏雲密佈,伴隨著雷公斷斷續續地怒吼,大雨嘩嘩的下起來了,這情景彷彿深夜的驟然降臨,又彷彿老天爺大筆一揮創作的潑墨風景。無奈發現沒有帶傘,只好在工位上等待。自己衝了一杯摩卡,戴上耳機開始聽音樂,耳畔響