1. 程式人生 > >某鑑黃師:“我並不幸福”,AI加持下CDN鑑黃又是何物?

某鑑黃師:“我並不幸福”,AI加持下CDN鑑黃又是何物?

鑑黃師大概是屬於最初懷有豐滿的幻想,

卻不料被一次次殘暴的現實無情的摧殘!

某知名網際網路公司面向社會(年薪20萬)招聘鑑黃師,每天的工作就是識別色情淫穢網站,即利用上班時間瀏覽黃網!

當很多人看到這種招聘資訊的時候,尤其在荷爾蒙分泌旺盛的年紀,或許成了心中夢寐以求又充滿好奇的夢想職業之一。因此,在一部分的認知中鑑黃師這個職業一定是個香餑餑,屬於百裡挑一的競爭強度。

鑑黃師日常

其實不然,鑑黃師的門檻並不高,對專業知識並不會做太多要求,畢竟相關的具體操作半個月時間通過培訓也足夠可以掌握。一般而言男女也不會太多限制,當然大多數是年輕群體,也是因為工作屬性所決定的,其次便是對心理成熟度和心理素質有一定的要求。

對鑑黃師的工作內容和體驗,大眾可能還是多了太多美好的幻想!

這裡簡單先分享幾個相關的新聞案例吧:

臉書的女鑑黃師:“每天看8000個辣眼畫面,8個月後決定離開了”

臉書作為擁有20億級使用者的巨無霸產品。內容和畫面的尺度遠超過我們的想象,在臉書這個職位的角色被定義為內容稽核員,鑑別的也不只是“黃”而已,暴力、仇恨、恐怖主義、斷頭、虐待動物、兒童色情、人獸性交。

某網際網路公司女鑑黃師:“其實女生看久了,身體也扛不住”

“每天熟練地點開運營稽核系統,每個使用者的微動態、活動、群、相簿裡的圖片等資訊便會在電腦上一目瞭然地呈現,先快速瀏覽最直觀的圖片,一眼掃到有疑似色情暴力的圖片,點進去進一步確認,再看使用者登記的文字資訊,察覺有敏感詞也要再仔細檢視。不過,對於究竟什麼內容涉黃其實並沒有嚴格、精確的文字表述,每個公司基本都有屬於自己的一套篩選標準,對於我們公司而言採用的是三級標準:A級露性器官的,封號;B級露胸的,刪照片、禁言24小時;C級過分暴露或帶來不良影響的,刪照片”,方便對照使用。

微軟鑑黃師:怒告老東家索賠

2017年初,微軟網路安全部門的兩位員工Henry Soto和Greg Blauert聯手將僱主微軟告上了法庭,並尋求精神損害賠償。這兩名員工日常的工作職責是搜查微軟的電子郵件和網際網路系統,找到兒童被虐待和其他犯罪的證據,在工作中需要觀看兒童色情和謀殺等圖片和視訊,他們起訴微軟沒有充分正確警告和提醒,使得他們反覆接觸的邪惡資訊,造成精神障礙。

相比較圖片、視訊,這類用眼睛就能直觀看到的地方,文字、聲音的鑑黃難度則大得多!說文字難,那是相比較直觀的圖片、視訊來做的比較。但是和聲音相比較之下,則顯得似乎又簡單了很多,語種的豐富和多樣、背景聲音的干擾、資料採集和識別的難度也是超過前三類的。

關於鑑黃師,有幾句話想和各位分享:

如果你在網路上看到一丁點暴力、色情的內容就要破口大罵,不妨想想背後工作的他們! 如果你覺得網路環境還挺好的、沒那麼糟,那是因為這背後有默默幫你過濾防護的他們! 當你看到一些不舒服內容便會做惡夢、食不下咽,那每天閱覽千計普通如你我的他們呢?

我們需要感謝鑑黃師這個職業的存在,這個職業也遠比我們想象的要承受更大的壓力和責任!

說完人作為鑑黃師的部分,接下來聊聊基於機器學習演算法和人工智慧技術的CDN鑑黃,對於鑑黃師而言更需要技術來幫助其工作減壓。

這裡說的CDN鑑黃常規上指的是圖片鑑黃和視訊鑑黃(直播/點播)兩種型別,目前而言基本上主流的CDN服務廠商都會提供這種服務。

何為CDN? CDN全稱是Content Delivery Network,即內容分發網路。CDN是構建在網路之上的內容分發網路,依靠部署在各地的邊緣伺服器,通過中心平臺的負載均衡、內容分發、排程等功能模組,使使用者就近獲取所需內容,降低網路擁塞,提高使用者訪問響應速度和命中率。CDN的關鍵技術主要有內容儲存和分發技術。

CDN圖片鑑黃

依託於深度學習演算法和實時更新的億級影象樣本資料庫,基於雲服務廠商自身的雲端計算平臺,對海量資料進行快速掃描、識別和相關特徵的提取、分析、比較,從而發現其中涉嫌違規內容,違規圖片的連結將會被記錄下來供使用者匯出、刪除,有效解決所有內容安全問題,而對於可疑的色情圖片則交由鑑黃中心專業的鑑黃師再進行人工稽核和定奪,節省90%以上的人工稽核成本。

附:圖片涉黃尺度的一般界定標準

色情:裸露敏感部位,包含露骨鏡頭,描述性交行為和色情場景的圖片。 性感:衣著暴露但沒有裸露敏感部位。 正常:非色情,非性感圖片。

CDN直播鑑黃

對於直播以及短視訊平臺而言,為了保障平臺內容播出的合規,鑑黃對於這部分企業而言是十分必要且重要的一環,稍有閃失,估計就要被請去喝茶聊天了。鑑黃內容和形式一般而言包括視訊截圖、語音稽核、彈幕監控、關鍵詞的提取等方式分析和識別色情內容。

傳統形式上單純的依靠鑑黃師,成本高昂且不說,監測的精準性也很難把握。而平臺通過API系統對接CDN服務廠商,加上AI人工智慧和深度學習演算法的技術加持,全方位的監測平臺風險內容而協助平臺方對內容實時涉黃程度進行評判,從而更好的幫助平臺方進行風險管控!

技術最大的魅力在於解放生產力,降低人類的工作壓力和風險指數。

鑑黃師這個職業值得被尊重,也亟待被技術逐漸從高壓的模式中解放出來!