1. 程式人生 > >資料探勘,機器學習,自然語言處理這三者是什麼關係?

資料探勘,機器學習,自然語言處理這三者是什麼關係?

資料探勘與機器學習是兩個不同的概念;
資料探勘中使用到機器學習的各種工具,而自然語言處理也是是一種機器學習的方式,屬於資料探勘的範疇。
資料探勘(英語:Data mining),又譯為資料探勘、資料採礦。它是資料庫知識發現
(英語:Knowledge-Discovery in Databases,簡稱:KDD)
中的一個步驟。資料探勘一般是指從大量的資料中自動搜尋隱藏於其中的有著特殊關係性
(屬於Association rule learning)的資訊的過程。
資料探勘通常與電腦科學有關,並通過統計、線上分析處理、情報檢索、機器學習、
專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現
上述目標。
機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、
凸分析、演算法複雜度理論等多門學科。
專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構
使之不斷改善自身的效能。
它是人工智慧的核心,是使計算機具有智慧的根本途徑,其應用遍及人工智慧的各個領域,
它主要使用歸納、綜合而不是演繹。
自然語言處理是電腦科學領域與人工智慧領域中的一個重要方向。它研究能實現人與計算機之間用
自然語言進行有效通訊的各種理論和方法。
自然語言處理是一門融語言學、電腦科學、數學於一體的科學。因此,這一領域的研究將涉及自然語言,
即人們日常使用的語言,
所以它與語言學的研究有著密切的聯絡,但又有重要的區別。自然語言處理並不是一般地研究自然語言,
而在於研製能有效地實現自然語言通訊的
計算機系統,特別是其中的軟體系統。因而它是電腦科學的一部分。
自然語言處理(NLP)是電腦科學,人工智慧,語言學關注計算機和人類(自然)語言之間的相互作用的領域。