趨勢分析之資料探勘
AMiner全新功能技術趨勢分析Trend analysis(http://trend.aminer.cn)基於AMiner 2億篇論文資料進行深入挖掘,包括對技術來源、熱度、發展趨勢進行研究,進而預測未來的技術前景。技術趨勢分析描述了技術的出現、變遷和消亡的全過程,可以幫助研究人員理解領域的研究歷史和現狀,快速識別研究的前沿熱點問題。
我們目前已釋出了5期分析內容,具體如下:
資料探勘(data mining)是資料庫知識發現(Knowledge-Discovery in Databases,簡稱KDD)中的一個步驟,指的是從大量的模糊的資料集合中提取人們感興趣的知識和資訊。資料探勘設計到機器學習、模式識別、歸納推理、統計學、資料庫、高效能計算等多個領域。
下面我們用Trend analysis分析資料探勘領域內的研究熱點。
上圖是當前該領域的熱點技術趨勢分析,通過Trend analysis分析挖掘可以發現當前該領域TOP10的熱點研究話題如下:
-
data mining
-
social network
-
applied science
-
social science
-
graph theory
-
heterogeneous information network
-
big data
-
feature extraction
-
feature selection
-
anomaly detection
根據Trend analysis我們可以發現,當前最熱門的話題是data mining,該技術的話題熱度穩定,發表論文數量相對其他技術而言也較多;heterogeneous informationnetwork和big data從2011年開始話題熱度穩步增長;data stream的熱度變化則是經歷了一定的起伏,2001年後的十年期間話題熱度曾經一度僅次於data mining,但在近幾年話題熱度明顯下降。
美國伊利諾伊大學香檳分校的韓家煒教授是資料探勘領域的代表學者之一,同時也是IEEE和ACM Fellow。他曾經擔任美國ARL資助的資訊網路聯合研究中心主任,KDD、SDM和ICDM等國際知名會議的程式委員會主席,並創辦了ACM TKDD學報並任主編。
他在資料探勘、資料庫和資訊網路領域發表論文600餘篇。出版了資料探勘專著《Data Mining: Concepts and Techniques》,成為資料探勘國內外經典教材。曾獲ICDE 2002傑出貢獻獎、SIGKDD 2004最佳創新獎、 2009年麥克道爾獎(the McDowell Award)。在谷歌學術的 H-index中,名列全球電腦科學領域高引作者前三。
ACM SIGKDD 創新獎是知識發現與資料探勘領域(KDD)的最高榮譽,授予對這一領域做出重大技術貢獻的研究人員。根據評審要求,其研究成果必須在資料探勘理論或商業資料探勘系統的開發上能夠產生深遠的影響。歷屆 SIGKDD 創新獎的獲得者都是資料探勘領域的傑出研究者,曾經獲得這一獎項的華人包括:
(2004 年)韓家煒(Jiawei Han)博士
美國伊利諾伊大學香檳分校計算機系教授,ACM、IEEE Fellow。值得一提的是,韓家煒博士是裴健教授在加拿大西蒙弗雷澤大學的博士導師。
(2016 年)俞士綸 (Philip S. Yu) 博士
美國伊利諾伊大學芝加哥分校特聘主任教授、清華大學資料科學研究院院長。
(2017年) 裴健(Jian Pei)博士
加拿大西蒙弗雷澤大學計算機學院教授,ACM、IEEE Fellow,加拿大研究講席教授(Canada Research Chair, Tier I)。
(2018年) 劉兵(Bing Liu)博士
美國伊利諾伊大學芝加哥分校傑出教授,ACM、AAAI、IEEE Fellow。
作為一門新興的資訊處理技術,資料探勘技術的應用領域十分廣泛,包括交通、金融投資、市場營銷等方面都得到了應用,顯示出其強大的生命力。