如何通過搜尋引擎充分利用企業資產?
資料和知識是所有企業的核心資產。現代搜尋引擎可以利用這些知識,這樣員工就可以找到它的源頭和內容。企業可以構建一個比谷歌更加強大的搜尋引擎,並且專注於企業的應用領域、使用者角色和業務目標。
2016年初宣佈了谷歌搜尋的消亡,這標誌著錯誤的企業統一搜索解決方案的夢想終結。取而代之的是愈加智慧化的搜尋引擎,這些應用程式可以搜尋、分析和評估企業資訊。這不僅與傳統文件中的搜尋有關,還涉及資料庫中的資料和語義圖中的實體和聯絡。收集所有來自於企業內部的資訊,再加上來自外部環境的其他資料,彙集後在搜尋、分析和評估的應用程式上進行分層計算,即形成了企業級搜尋應用的新世界。
隨著應用系統越來越複雜,資訊量越來越大,傳統的關鍵字搜尋技術已無法滿足企業對海量資料和各種檔案型別的定位查詢。為解決這一難題,本文詳細講解了啟動企業搜尋專案需注意的10個要點。
要點一:要有雄心 可以比谷歌做得更好
許多搜尋研發團隊對谷歌在網路搜尋方面的成就感到畏懼。但只要有雄心,同樣可以做得更好!谷歌擁有優秀的技術、硬體和一支高精尖人才大軍,每天都要提供數以十億計的搜尋服務。但是企業擁有所有資訊:各類文件、產品、內部網站和客戶資料。且企業對於自身發展領域、使用者角色和業務目標都有更為深度的理解,亦或親自同用戶進行交流。雖然谷歌可以在網路上大行其道,但搜尋研發團隊卻可以深化應用到企業中去。
要點二:處理搜尋
當用戶在文字框中輸入幾個單詞時,這對應用程式來說是一個挑戰,它要找出使用者真正想要的資訊。使用搜索技術,例如詞幹、同義詞、範圍不同的關鍵詞,以確保找到所有正確的資訊。然後應用語義圖關聯現實世界的語境,就像要求一位知識淵博的圖書管理員尋找一本書一樣。幫助企業瞭解使用者想要的拼寫檢查以及自動完成的檢索推薦等。搜尋引擎在實際使用上為使用者提供一目瞭然的結果摘要,並在適用範圍內指導使用者以高效的方法搜尋。
要點三:處理資料
註釋資料,以便快捷地找到它。新增元資料:釋出日期、作者、關鍵詞和出處;查詢並註釋實體和屬性:人員、地點、公司名稱、信用卡號碼等。隨後,將每個文件新增標記並劃分不同的許可權,使搜尋程序快速得到響應。
要點四:獲得最優的搜尋結果
搜尋結果頁面不必僅是連結列表。要使每個搜尋結果儘可能包含豐富的資訊:連結、與搜尋關鍵字匹配該網頁的文字摘要和一些元資料(最後抓取頁面的時間、網頁檔案概況、相關關鍵詞的其他網站連結和其他相關資訊)。為了獲得最優的搜尋結果,需考慮使用包含圖片資訊的卡片。當這些卡片式資訊具有自然屬性的分組時,最終搜尋結果可通過不同頁面跳轉相連線。新增關於整個結果集的資訊:一個資訊面板,描述搜尋中的主要術語、方面和一些圖表。
要點五:切忌重複同樣的搜尋
針對每位使用者最喜歡的搜尋集,在他第一次登入時的搜尋框上顯示結果摘要。如果使用者需要知道一些新的資訊,比如:每當有關於止痛藥對網球肘影響的新研究,一旦發現與搜尋結果相匹配的資訊,即刻返回系統一封電子郵件或一條簡訊。
要點六:跟蹤一切相關資訊
跟蹤所有搜尋,並跟蹤這些搜尋的結果。搜尋“成功”意味著對使用者快速返回結果,點選最上面的結果,閱讀並繼續前進。如果搜尋失敗,調整應用程式、搜尋處理和結果資料。通過以上方法調整搜尋程序,可以考慮建立一個特殊資訊面板或登入介面,並重新引導使用者搜尋。每日列出明細表,之後仔細排出優先次序。
要點七:不斷改進 適應變化
使用者的搜尋量每天都在變化。資料也是如此,為搜尋提供的一些背景環境也發生著變化。每天改進搜尋,並不斷尋找提高使用者體驗度的方法:為其提供更加個性化、智慧化和資料視覺化的建議。
要點八:不要忘記安全
一旦企業級搜尋超越了內網各個部分的基礎知識範疇,它就必須遵守公司的隱私和安全標準。理想情況下,搜尋應用程式將置入到現有的安全基礎設施之中。
要點九:聽起來很難 但谷歌並不會這麼做
谷歌網路搜尋不需要處理安全問題,但企業級搜尋需要考慮安全。相關其他的提示有:谷歌擴大搜索範圍;繪製一個豐富的搜尋結果頁面,其中包含了每個結果和整體結果集的資訊;跟蹤每一條搜尋和結果資料,以便更好地進行搜尋與反饋。谷歌沒有做的一件事就是註釋資料;相反,它記錄了網站開發者應該如何註釋資料便於谷歌定位它。
要點十:最終如何完成搜尋引擎的架構?
找到支援搜尋應用的程式,而不僅僅是搜尋引擎。該平臺必須支援上文中討論過的所有技術,並且必須能夠彙集各種資訊——傳統文件、資料以及語義圖(實體和聯絡),這樣機構就可以構建一個使用企業中所有資訊的搜尋應用程式