1. 程式人生 > >帶你全面瞭解網路輿情監測系統

帶你全面瞭解網路輿情監測系統

網路輿情形成迅速,對社會影響巨大。隨著網際網路在全球範圍內的飛速發展,網路成為反映社會輿情的主要載體之一。網路環境下的輿情資訊的主要來源有:新聞評論、BBS、部落格、聚合新聞(RSS)。網路輿情表達快捷、資訊多元,方式互動,具備傳統媒體無法比擬的優勢。
由於網上的資訊量十分巨大,僅依靠人工的方法難以應對網上海量資訊的收集和處理,需要加強相關資訊科技的研究,形成一套自動化的網路輿情分析系統,及時應對網路輿情,由被動防堵,化為主動梳理、引導。

一、認識網路輿情監測系統

網路輿情監控系統通過對熱點問題和重點領域比較集中的網站資訊,如:網頁、論壇、BBS等,進行24小時監控,隨時下載最新的訊息和意見。下載後完成對資料格式的轉換及元資料的標引。對下載本地的資訊,進行初步的過濾和預處理。對熱點問題和重要領域實施監控,前提是必須通過人際互動建立輿情監控的知識庫,用來指導智慧分析的過程。
通過輿情監測系統,相關部門可以及時瞭解網路輿情動態,關注到自己在網路輿情中的狀態,從而可以產生網路輿情預警,及時糾正應對網路上關於自己的負面輿論影響,為部門網路危機公關或品牌形象營銷提供資料依靠。

二、網路輿情監測系統的優點

1、及時:輿情監測系統通過自主開發的分散式非同步高併發的爬蟲技術保證了採集的及時性。自動調節採集頻率,重點網站優先採集。
2、全面:通過定向採集新聞、論壇、貼吧、電子報、微博、部落格等保證重要資訊優先採集不丟失,通過向主流搜尋引擎進行搜尋補充,保證了資訊收集的全面性。
3、準確:確保了準確抓取資訊,做出分類總結。
4、相似文章識別:準確識別內容相似的文章,可用於文章的去重和突發事件的發現。

三、網路輿情監測系統應該具備的功能

首先,是輿情分析引擎。這是輿情分析系統的核心功能,包括:

1、具有熱點識別能力
可以根據轉載量、評論數量、回覆量、危機程度等引數,識別出給定時間段內的熱門話題。
2、具有傾向性分析與統計
對資訊闡述的觀點、主旨進行傾向性分析,以提供參考分析依據。分析的依據可根據資訊的轉載量、評論的回覆資訊時間密集度來判別資訊的發展傾向。
3、能夠主題跟蹤
主題跟蹤主要是指標對熱點話題進行資訊跟蹤,並對其進行傾向性與趨勢分析。跟蹤的具體內容包括:資訊來源、轉載量、轉載地址、地域分佈、資訊釋出者等相關資訊元素。其建立在傾向性與趨勢分析的基礎上。
4、資訊自動摘要功能
能夠根據文件內容自動抽取文件摘要資訊,這些摘要能夠準確代表文章內容主題和中心思想。使用者無需檢視全部文章內容,通過該智慧摘要即可快速瞭解文章大意與核心內容,提高使用者資訊利用效率。該智慧摘要可以根據使用者需求調整不同長度,滿足不同的需求。主要包括文字資訊摘要與網頁資訊摘要兩個方面。
5、進行趨勢分析
通過圖表展示監控詞彙和時間的分佈關係以及趨勢分析,以提供階段性的分析。
6、突發事件分析
突發事件不外乎有以下幾種:自然災害、社會災難、戰爭、動亂和偶發事件等等。網際網路資訊監控分析系統主要是針對網際網路資訊進行突發事件監聽與分析。對熱點資訊的傾向分析與趨勢分析,以監聽資訊的突發性。
7、報警系統
主要是針對輿情分析引擎系統的熱點資訊與突發事件進行監聽分析,然後根據資訊的語料庫與報警監控資訊庫進行分析。確保資訊的輿論健康發展。
8、統計報告
根據輿情分析引擎處理後的結果庫生成報告。使用者可通過瀏覽器瀏覽,提供資訊檢索功能。根據指定條件對熱點話題、傾向性進行查詢,並瀏覽資訊的具體內容,提供決策支援。

其次,是自動資訊採集功能。
現有的資訊採集技術主要是通過網路頁面之間的連結關係,從網上自動獲取頁面資訊,並且隨著連結不斷向整個網路擴充套件。目前,一些搜尋引擎使用這項技術對全球範圍內的網頁進行檢索。輿情監控系統應能根據使用者資訊需求,設定主題目標,使用人工參預和自動資訊採集結合的方法完成資訊收集任務。

第三,是資料清理功能。
對收集到的資訊進行預處理,如格式轉換、資料清理,資料統計。對於新聞評論,需要濾除無關資訊,儲存新聞的標題、出處、釋出時間、內容、點選次數、評論人、評論內容、評論數量等。對於論壇BBS,需要記錄帖子的標題、發言人、釋出時間、內容、回帖內容、回帖數量等,最後形成格式化資訊。條件允許時,可直接針對伺服器的資料庫進行操作。

總結:
企業網路輿情監測工作不可忽視,在未來資訊社會發展過程中,網路輿情監測工作必然會成為更多企業的工作重點之一,說成是企業快速成長過程中的一劑良藥也不足為過。做好輿情監測將成為一個品牌企業能否健康持續發展的關鍵所在。

來源:世界工廠網線上生態學院