今日頭條有隻內容看門狗叫“靈犬”,240萬人曾用它來反低俗
2月20日,今日頭條方面宣佈了“靈犬”全面升級的訊息。除了反低俗,新版“靈犬”還加入了反暴力謾罵和反標題黨能力。
至此,“靈犬”的檢測服務,已覆蓋了主要的低俗低質內容型別。
據刺蝟公社(ID:ciweigongshe)瞭解,這是上線近一年後,“靈犬”迎來的首個重大更新版本。資料顯示,截至目前,“靈犬”使用人次已經突破240萬。這也是國內首款反低俗資訊小程式。
檢測內容健康程度
這款小程式脫胎於今日頭條反低俗演算法模型,用於鑑定低俗資訊。使用者將文字或者文章連結放置到搜尋框內,即可查詢該條資訊的健康程度。
據瞭解,“靈犬”這類技術模型,不僅可以為普通網民所用,用以淨化網路空間,同時也有助於平臺內容創作者的內容改進。
不同於一般平臺對低俗低質內容通常採取人工投訴、事後刪除的辦法,“靈犬”作為技術手段,能夠有效幫助平臺將內容質量檢測的機制前置,幫助創作者自查內容是否觸發低俗、暴力謾罵和標題黨等因素。
不過,在文字檢測上,“靈犬”團隊規定,使用者輸入的字數必須超過10個字才能進行檢測。
對此,“靈犬”團隊給出瞭解釋:使用者給的上下文、語境等資訊越充分,機器判斷的準確度就會越高。
在2018年3月份,刺蝟公社曾參與過“靈犬”的內測,在“靈犬”上檢測了“你餓不餓我下面給你吃”幾個字,資料顯示,該內容健康指數為51%,不及格。
2019年2月20日,刺蝟公社再次檢測,該內容的健康概率指數為19%,命中反低俗模型,“不應獲得演算法推薦”。
這是什麼意思呢?
“靈犬”就像一個內容稽核系統,這個系統集納了被評定為低俗內容的所有關鍵詞,一旦“你餓不餓我下面給你吃”觸碰到關鍵詞,該內容將會被提取、分詞和語義識別,然後根據設定的規則,輸出對應的分數、評級和結論。
中國傳媒大學網路法與智慧財產權研究中心主任王四新教授說,在網路上如果低俗內容不被過濾,很容易被當做“產業”進行開發,有商業資本助推,有利可圖,在某些國家允許,但在我國不允許,《刑法》對涉及製作、複製、出版、販賣、傳播淫穢物品有明確罪項規定。
他還介紹說,在我國,傳播淫穢內容,被依法處置的情況很多。此外,還有虛假宣傳、謠言……的傳播者也會被進行處罰。
但處理低俗資訊依舊有難度,“靈犬”團隊曾稱,不同於資訊,處理低俗資訊的一個難點在於,人們對於低俗的判斷標準具有一定的主觀性;資訊很直接,低俗資訊偏隱晦,對於像“靈犬”這種機器就更難了。
今日頭條的做法是,把低俗的標準分為兩個層次:幾乎所有人看來都會一致同意的標準底線,和因人而異的主觀判斷。有些檢測標題,因人而異,仁者見仁智者見智。
不過,今日頭條方面也稱,“靈犬”新版本釋出的背後,伴隨著“靈犬”打擊低俗低質能力的提升。反低俗、反暴力謾罵模型,整體識別準確率約為85%,反標題黨模型識別準確率約為90%。這些技術模型每天仍在持續優化迭代。
國內外都在治理低俗低質內容
近年來,網際網路新聞資訊、網際網路音訊、網路直播等網際網路文化內容領域,都成了監管部門的重點關注目標,監管部門也出臺了不少的監管政策,以規範行業行為。
去年10月,“傅首爾”“紫竹張先生”“有束光”“萬能福利吧”“野史祕聞”“深夜視訊”“唐納德說”等9800多個自媒體賬號被全網處置。這源於國家網信辦會同有關部門,針對自媒體賬號存在的一系列亂象問題,開展的集中清理整治專項行動。
在這次網信辦的通報中,主要在以下5個方面出了問題,這5大問題也足以值得自媒體人深度警惕:
1、有的傳播政治有害資訊,惡意篡改黨史國史、詆譭英雄人物、抹黑國家形象;
2、有的製造謠言,傳播虛假資訊,充當“標題黨”,以謠獲利、以假吸睛,擾亂正常社會秩序;
3、有的肆意傳播低俗資訊,違背公序良俗,挑戰道德底線,損害廣大青少年健康成長;
4、有的利用手中掌握大量自媒體賬號惡意營銷,大搞“黑公關”,敲詐勒索,侵害正常企業或個人合法權益,挑戰法律底線;
5、有的肆意抄襲侵權,大肆洗稿圈粉,構建虛假流量,破壞正常的傳播秩序。
在此基礎上,國家網信辦又依法約談了騰訊微信、新浪微博等自媒體平臺,對其主體責任缺失,疏於管理,放任野蠻生長,造成種種亂象,提出嚴重警告。騰訊微信、新浪微博相關負責人表示將認真接受群眾和輿論監督,自查自糾,積極整改,嚴格管理。
隨後,微博釋出公告,表示將認真接受群眾和輿論監督,自查自糾,積極整改,嚴格管理。微信平臺則發文迴應稱,將加強對政治有害資訊、低俗、謠言、標題黨、抄襲侵權等違規內容的打擊和清理,為使用者提供一個更健康的閱讀空間。
國家網信辦有關負責人指出,自媒體絕不是法外之地。近年來,國家網信辦依據《網路安全法》相繼出臺《網際網路新聞資訊服務管理規定》《網際網路使用者公眾賬號資訊服務管理規定》等法規性檔案,對具有媒體屬性和可對公眾釋出資訊的賬號及平臺作了明確規定。從趨勢上看,自媒體管理已經納入法治化、規範化、制度化軌道。
而今日頭條在去年7月和10月,通過自查、使用者舉報等方式,處罰了近萬個違規賬號。
今日頭條釋出公告稱,因侵犯版權而受到平臺處罰的頭條號賬號,主要包括搬運、篡改和歪曲等行為:一是未經許可轉載、摘編整合或歪曲篡改新聞作品;二是通過“洗稿”方式抄襲剽竊、篡改刪減原創作品;三是未經授權複製、表演、通過網路傳播他人影視、音樂、攝影、文字等作品,或以合理使用為名對他人作品刪減改編。
由此可見,治理低俗低質內容不僅僅是一個平臺的事情,而是整個行業的事情。放眼世界,Facebook也因為低俗低質內容而頭疼,去年10月份,Facebook直接對釋出低俗低質的賬號動刀,一下子刪除了該平臺上559個頁面和251個違反垃圾訊息規則的帳號。這些網頁和帳號使用假帳號來獲取點贊和共享,並引誘使用者點選欺騙性網站連結,後者大多涉及政治內容。
Twitter也對該同類型內容進行技術提示,Twitter在訊息中的連結中新增“可能敏感”標籤。據美國科技部落格Gizmodo報道,Twitter的媒體政策顯示,該公司將“移除有可能被認為是敏感的內容,例如裸露、暴力或醫療流程。”
據新浪科技報道稱,業內人士認為,Twitter早就應該推出這項功能,幫助家長控制兒童所看到的內容,以免他們點選不適當的連結。
據王四新介紹,國外社交媒體對低俗低質內容的整治也在不斷加強,即便西方國家有制度安排等原因在言論面前做支撐,但近十年來,仇恨、種族、暴力等問題越來越突出,相關言論也在社交媒體上散播,他們需要對其進行治理。
“這種方法在未來肯定會大行其道”
2018年11月,今日頭條CEO陳林在生機大會上表示,在鼓勵優質內容、打擊低質內容已經成為全球內容平臺的共同議題時,今日頭條將開放技術模型,和行業一起提高平臺生態標準。開放給社會公眾,也是希望能通過開放平臺技術,促進全行業發展。“靈犬”此次全面升級,無疑驗證了這一點。
據瞭解,目前,今日頭條在平臺內容治理方面,除了配備“靈犬”,還有其他反標題黨、反虛假資訊、反低質內容等數百個技術模型。與此同時,今日頭條投入了上萬人專業稽核編輯團隊,致力於結合人工、技術手段,保障平臺內容健康。
面對低俗低質內容,整個社會都在出謀劃策。2018年10月31日,《經濟日報》發表新聞評論建議,要靠技術來提升低俗內容的識別效率。網際網路企業要善用包括大資料、人工智慧等新技術,與時俱進地更新內容判定標準,細化稽核標準,並升級群發檢測演算法。只有依靠技術不斷完善“遊戲規則”,才能讓違規內容難以“鑽空子”,同時更充分地在版權上保護原創內容,也能防範低俗賬號以微博、微信等平臺為跳板,將使用者導向外部空間再提供違規內容。
這個建議正在被像今日頭條這樣的互聯萬公司實踐。財經國家週刊編委、新媒體資深從業者王新一評價說,今日頭條的slogan是“資訊創造價值”,而靈犬則是通過檢測出有害的資訊來創造價值。內容平臺需要兩手抓,一方面促進平臺產生更多優質資訊,一方面儘量減少低俗低質內容的出現。
“企業主動利用這種技術手段來做好內容稽核工作是一個不錯的方法。”王四新說,其他網際網路公司也在利用大資料技術做安全審查工作,比如滴滴用技術防禦乘客可能遇到的乘車危險。
而知乎在這方面也有實踐。據36氪報道,在2016年,知乎上線了機器人瓦力。瓦力的任務,是識別並處理那些不友善、辱罵、陰陽怪氣、答非所問、內容以及知乎不鼓勵的使用者爆照。
這種趨勢在近兩年逐漸明顯了起來,越來越多的企業主動或被動去探討更靈活、更及時、更有效的技術模型,人工成本會降低。王四新預測,“這種方法在未來肯定會大行其道”。