1. 程式人生 > >九眼智能:用大數據技術為網絡信息加層“濾網”

九眼智能:用大數據技術為網絡信息加層“濾網”

技術 智能 公開 噪音 爭奪 新聞 群組 同時 新聞媒體

  隨著信息傳播技術的快速發展和各類互聯網平臺的興起,個人、機構均可通過註冊公眾賬號借助平臺公開發布信息,成為新聞媒體等專業內容生產機構之外的重要內容生產者,互聯網平臺成為用戶獲取信息的重要渠道。互聯網平臺的興起及公眾賬號數量的日益增多,在一定程度上滿足了用戶多元化的信息需求。

  近年來,隨著網絡技術和新媒體應用的不斷叠代創新,自媒體的社會化信息傳播得到了空前釋放,但供大於求的信息產能過剩已經顯現出來。不少年輕人之所以談起“爸媽的朋友圈”就一臉苦笑,正是由於泛濫在朋友圈中的種種不實消息和爭奪眼球無底限的“標題黨”已經成為誤導公眾的隱形公害。

  此外,無門檻亦無監管,導致互聯網群組濫建濫用,致使誤導信息在其中的流通也泥沙俱下。比如,道聽途說不實信息甚或謠言,危害社會、個人安全的涉思想、教唆等有害信息

……一些不實消息借助互聯網群組肆無忌憚地傳播;披著“互聯網新經濟”外衣的網絡傳播等網絡群組也屢見不鮮,所有這些都損害著社會公共秩序和公共安全利益。

  網絡治理工作重心之一是網絡信息流通的安全有序與生態健康管理,唯有管好,才能讓絕大多數網民用好網絡,確保絕大多數網民合法正當的權益不受侵害。只有強化賬號群組的創建者、組織者、運營者的監管責任,強化的是公共信息在進入社會輿論傳播的自律性潔凈機制,唯有從源頭過濾和截留“信息雜質”,才能讓互聯網更積極更健康地服務社會發展。

九眼智能過濾系統是面向復雜文本大數據的內容智能過濾系統,可實時智能識別關鍵詞音變、形變與拆字等常見變體,並實現了語義的精準排歧,系統內置了國內更新更全的知識庫,適用於多場景不文明信息內容的智能過濾發現。

九眼智能過濾三大技術核心:智能變種、語義排歧、快速實時

  1、智能變種識別:九眼智能過濾利用美雙數組TRIE樹詞典管理與檢索方法,系統自動識別形變詞、音變詞、拆字、噪音、繁簡體、全角半角、中間加各類幹擾噪音等變體; 同時,系統支持自定義詞庫,增量添加百萬量級詞庫。

  2、語義排歧:九眼智能過濾利用NLPIR語義精準分詞系統與情感分析系統,精準識別與過濾,排除正面無害的信息,極大降低了誤判率。

  3、快速實時:九眼智能過濾使用專利算法,快速掃描,單機速度30MB/s;支持單機多線程、多機並行、Hadoop雲服務模式,對PB級信息內容實現並行高效在線核查。

九眼智能:用大數據技術為網絡信息加層“濾網”