周志華:機器學習與資料探勘
“機器學習”是人工智慧的核心研究領域之一, 其最初的研究動機是為了讓計算機系統具有人的學習能力以便實現人工智慧,因為眾所周知,沒有學習能力的系統很難被認為是具有智慧的。目前被廣泛採用的機器學習的定義是“利用經驗來改善計算機系統自身的效能”[1]。事實上,由於“經驗”在計算機系統中主要是以資料的形式存在的,因此機器學習需要設法對資料進行分析,這就使得它逐漸成為智慧資料分析技術的創新源之一,並且為此而受到越來越多的關注。
“資料探勘”和“知識發現”通常被相提並論,並在許多場合被認為是可以相互替代的術語。對資料探勘有多種文字不同但含義接近的定義,例如“識別出巨量資料中有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程”[2]。其實顧名思義,資料探勘就是試圖從海量資料中找出有用的知識。大體上看,資料探勘可以視為機器學習和資料庫的交叉,它主要利用機器學習界提供的技術來分析海量資料,利用資料庫界提供的技術來管理海量資料。
因為機器學習和資料探勘有密切的聯絡,受主編之邀,本文把它們放在一起做一個粗淺的介紹。
特別提示:如果你有興趣閱讀全文,請ofollow,noindex">點此跳轉至本文原始出處 。