1. 程式人生 > >大資料探勘

大資料探勘

定義:大資料探勘是指從大量的、不完全的、有噪聲的、模糊的、隨機的資料中提取隱含在其中的、人們事先不知道的、但又是潛在有用的資訊和知識的過程。隨著資訊科技的高速發展,人們積累的資料量急劇增長,動輒以tb計,如何從海量的資料中提取有用的知識成為當務之急。資料探勘就是為順應這種需要應運而生髮展起來的資料處理技術。

資料探勘問題型別對應的技術:
①資料描述和彙總
②分群: 聚類、神經網路、視覺化
③概念描述: 規則歸納、概念聚類
④分類: 判別分析、規則歸納、決策樹、神經網路、K最近鄰、基於案例的推理、遺傳演算法
⑤預測: 迴歸分析、迴歸樹、神經網路、K最近鄰、博克斯一詹金斯、遺傳演算法
⑥相關分析: 相關分析、迴歸分析、關聯規則、貝葉斯網路、歸納邏輯程式設計、視覺化技術

資料探勘工具分類
資料探勘工具根據其適用的範圍分為兩類:專用挖掘工具和通用挖掘工具。
1.1 專用資料探勘工具
專用資料探勘工具是針對某個特定領域的問題提供解決方案,在涉及演算法的時候充分考慮了資料、需求的特殊性,並作了優化。對任何領域,都可以開發特定的資料探勘工具。例如,IBM公司的AdvancedScout系統針對NBA的資料,幫助教練優化戰術組合。特定領域的資料探勘工具針對性比較強,只能用於一種應用;也正因為針對性強,往往採用特殊的演算法,可以處理特殊的資料,實現特殊的目的,發現的知識可靠度也比較高。
1.2 通用資料探勘工具
通用資料探勘工具不區分具體資料的含義,採用通用的挖掘演算法,處理常見的資料型別。通用的資料探勘工具不區分具體資料的含義,採用通用的挖掘演算法,處理常見的資料型別。例如,IBM公司Almaden研究中心開發的QUEST系統,SGI公司開發的MineSet系統,加拿大SimonFraser大學開發的DBMiner系統。通用的資料探勘工具可以做多種模式的挖掘,挖掘什麼、用什麼來挖掘都由使用者根據自己的應用來選擇。

  鄭州專業婦科醫院 www.120zzzy.com/

  鄭州中原科大婦科醫院 www.120zzzzyy.com/

  中原婦科醫院 www.zyfuke.com/

  鄭州無痛人流 www.zzzykdfk.com/