1. 程式人生 > >NLPIR-JZSearch智能搜索深層挖掘大數據資源

NLPIR-JZSearch智能搜索深層挖掘大數據資源

自然語言 範圍 毫秒級 軟件 字段 引擎 spa 分詞 歧義

  互聯網在近10年的得到飛速發展,互聯網正在逐漸深入人們的生活,改變人們的生活。互聯網經濟也經歷了風風雨雨,從緩慢起步到急速膨脹,從泡沫破滅到逐步回暖;從“網絡廣告”到“拇指經濟”,從“網絡遊戲”到“搜索力經濟”。目前,搜索引擎成為最受人們關註的焦點之一。

技術分享圖片

  自然語言的理解是中文智能搜索引擎關鍵技術。理解的困難主要來自意義和功能兩個方面,實際上就是歧義的問題。漢語的語音、語調、輕重音及停頓等,一經書面表達就可能產生歧義;中文詞與詞之間沒有界定,在進行分詞時很容易產生歧義;漢語虛詞多,組詞靈活,字在詞中的位置的變化也可能產生歧義。同時,由於搜索引擎所面對的網絡信息不僅數量巨大而且是動態的,給知識表達、組織、存取和更新都帶來了困難。

  自然語言的理解是將信息檢索從目前基於關鍵詞層面提高到基於知識(或概念)層面,對知識有一定的理解與處理能力,能夠實現分詞技術、同義詞技術、概念搜索、短語識別以及機器翻譯技術等。其技術包括機器翻譯技術、語義網絡技術、漢語分詞技術、短語識別技術、同義詞處理技術等。

  靈玖軟件NLPIR大語義智能分析平臺針對大內容采編挖搜的綜合需求,融合了網絡精準采集、自然語言理解、文本挖掘和語義搜索的研究成果,先後歷時十八年,服務了全球四十萬家機構用戶,是大時代語義智能分析的一大利器。

  JZSearch精準搜索引擎具有專業精準、高擴展性和高通用性的特點。可支持文本、數字、日期、字符串等各種數據類型的高效索引,支持豐富的查詢語言和查詢類型,支持少數民族語言的搜索。

  同時,全文搜索中間件通過可視化界面,可以快速地配置相關參數,啟動搜索服務,並提供測試程序,可以無縫地與現有數據庫系統融合,實現全文搜索與相關的數據庫管理應用系統。

  其主要特性包括:

  1. 語義精準搜索:系統不是簡單的關鍵詞匹配,會自動根據語義知識進行聯想,搜索用戶真正需要的信息;並能實現數字、字母的精準搜索,而不是模糊匹配(搜索100,而不會給出1001等不當結果)。

  2. 與業務無縫銜接:JZSearch精準搜索引擎能夠兼容現有的所有數據庫,無需開發,即可實現與現有業務數據庫的無縫銜接,實現任意字段的搜索分析,為數據庫提供毫秒級的搜索服務;而新增或者修改的數據在10秒內,JZSearch搜索引擎就能捕獲並反映在搜索結果中。非常適合企業業務數據的垂直搜索過濾。

  3. 更強搜索功能:JZSearch可以便利的搜索各類信息,對搜索結果自動統計分析,還可以實現指定文字範圍內的搜索,如:搜索招標公告中的公司名稱附件的法人信息,而不是泛泛地搜索,可以實現信息的精準定位。

  4. 系統自主維護:JZSearch搜索引擎可以處理TB級別的大數據業務,索引速度10MB/s,搜索響應1秒以內;整個過程無需人工幹預,系統部署後,自動索引、自動搜索、自動增量更新、自動優化、自動備份與恢復,實現7*24小時在線運行。

  現在是信息化時代,人們越來越依賴互聯網,並在互聯網上得到了很大的便利與利益。因此,了解互聯網目前的發展狀況並有效地改善其自身存在的缺陷,對今後方便人們使用有很大的幫助。為此,更好地理解中文網頁信息,改進搜索關鍵詞與網頁的相關性,提供基於語義聯想的搜索推薦詞已成為JZSearch精準搜索新一代智能中文搜索引擎系統的核心發現方向。

NLPIR-JZSearch智能搜索深層挖掘大數據資源