1. 程式人生 > >NLPIR智能挖掘技術為經濟發現新的增長點

NLPIR智能挖掘技術為經濟發現新的增長點

新興 非結構化數據 高速 knowledge 積累 定時 信號 語法 自然語言理解

  隨著計算機技術的革新,互聯網新媒體的快速發展,人們的生活已經進入高速信息時代。我們每天的生活都要產生大量數據,因此我們獲取數據的速度和規模不斷增長,大量數據不斷的被存入存儲介質中形成海量數據。海量數據的存儲、應用及挖掘已成為人們急需解決的難題。

  數據挖掘是一門新興的學科,它誕生於20世紀80年代,主要面向商業應用的人工只能研究領域。大數據是無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合。大數據包括海量的數據信息與高強度的數據處理能力,對於傳統的數據處理系統來說,大數據處理有著相當多的優勢,可以對於大型復雜的數據模塊進行高效地分析,包括數據的收集、分析、共享與傳輸等。大數據可以采用預測的方式進行分析,在用戶分析後進行數據提取,將其價值體現出來。

  大量數據的生成和累積是信息化的必然結果。現代企業在采購、倉儲、運輸、產品設計、生產、銷售和客戶服務等諸多環節都采集並積累了大量的供應商、服務提供商和客戶的交易數據,生產和經營數據,產品研發數據,財務及人力資源管理數據等,因此可以說現代企業是運營在數據之上,諸多生產和經營的決策問題必須通過數據分析才能解決。

  隨著消費者、企業和各經濟部門充分發揮大數據的潛力,由大數據驅動的創新、生產力提高、經濟增長、以及新的競爭模式和價值取向變革的巨大浪潮將達到巔峰。與過去不同的是,隨著一系列新技術趨勢發展的加速和凝聚,大數據所帶來的變化規模和範圍己經達到新的拐點,將會迅速膨脹。

  大數據帶來的潛在經濟價值和社會價值巨大,但這些價值必須通過數據的有效整合、分析和挖掘才能釋放出來。數據的整合是建立數據倉庫的必要工作,對於結構化數據的整合有很多解決方案和軟件工具。目前的挑戰是非結構化數據的融合和整合,如

:文本數據、圖像數據、信號數據、音頻數據、視頻數據等。

  北京理工大學大數據搜索與挖掘實驗室張華平主任研發的NLPIR大數據語義智能分析技術是對語法、詞法和語義的綜合應用。NLPIR大數據語義智能分析平臺平臺是根據中文數據挖掘的綜合需求,融合了網絡精準采集、自然語言理解、文本挖掘和語義搜索的研究成果,並針對互聯網內容處理的全技術鏈條的共享開發平臺。

  其中KGB(Knowledge Graph Builder)知識圖譜引擎是我們自主研發的知識圖譜構建與推理引擎,基於漢語詞法分析的基礎上,采用KGB語法實現了實時高效的知識生成,可以從非結構化文本中抽取各類知識,並實現了從表格中抽取指定的內容等。KGB同時可以定義不同的動作,如抽取動作,並能自定義各類後處理程序。利用KGB知識圖譜引擎可以抽取到產品的詳細報價信息,方便進行下一步的數據挖掘與圖譜構建。

  數據挖掘技術及其應用是目前國際上的一個研究熱點,並在許多行業中得到了很好的應用,尤其是在市場營銷中獲得了成功,初步體現了其優越性和發展潛力。在信息管理領域,綜合應用數據挖掘技術和人工智能技術,獲取用戶知識、文獻知識等各類知識,將是實現知識檢索和知識管理發展的必經之路。

NLPIR智能挖掘技術為經濟發現新的增長點