1. 程式人生 > >2018 雲棲大會七牛雲專場之圓桌論壇 | 多維度內容審核打造零風險運營體系

2018 雲棲大會七牛雲專場之圓桌論壇 | 多維度內容審核打造零風險運營體系

檢索 視覺 問題 細致 市場 pru 很多 遇到的問題 jqm

在 9 月 20 日下午舉辦的雲棲大會分論壇七牛雲專場中,七牛雲人工智能實驗室創始人彭垚、大華研發中心副總裁許焰、科大訊飛政法事業群網絡安全業務部副總經理楊帆、數美科技反欺詐專家施興為我們帶來了精彩的圓桌論壇。以下是圓桌論壇的實錄。
?

技術分享圖片?
(從左到右依次為:彭垚、許焰、楊帆、施興)
?
彭垚:大家下午好,歡迎參加我們的圓桌論壇。我們參加圓桌的四位,其實幹了一件差不多的事情,那就是做基於 AI 的安全業務。我也想請楊總和施興先生來為我們分享,各自公司在 AI 加安全領域取得了什麽樣的成果。
?
?技術分享圖片
(七牛雲人工智能實驗室創始人彭垚)
?
楊帆:非常高興可以參加今天的圓桌分享。大家可能會覺得,訊飛是一家在語音方面的領軍公司,但其實我們迅飛的業務非常廣,有教育、翻譯機、玩具,以及政法相關的業務。而在政法相關行業又覆蓋了包括像網信辦這樣的互聯網內容監管單位的業務。

?
技術分享圖片?
(科大訊飛政法事業群網絡安全業務部副總經理楊帆)
?
其實從 2013 年開始,訊飛就開始相關的工作了。那時候我們發現,音頻、視頻富媒體的載體越來越多,監管廠商內容審核有明顯的短板。我們當時就和網信辦交流,提到用語音技術可以為這方面做些什麽?一個視頻過來,如果我們發現其語種是維語、阿拉伯語、藏語的時候就可以對視頻進行重點識別,同時還可以識別特定群體的聲紋信息,把這些人說話的視頻找出來。這是一個非常好的技術手段。
?
剛剛所講的是用語音技術做一些審核的相關工作。但是從去年開始,很有幸認識了彭垚等很多七牛雲的朋友,發現七牛雲選擇了一個非常好的方向,基於圖片和視頻來進行內容審核,這和迅飛的語音識別,有著非常好的合作點。
?
所以從今年開始,訊飛和七牛雲一起,各取所長進行合作。這樣的合作雙方非常看好,因為我們是想真正做一些有社會意義的事情,而不僅為了這個市場。雖然市場的規模很大,但我們想要的是為網絡空間的幹凈做一些貢獻。在這個基礎之上,再作為企業實現盈利的目的。
?
施興:大家都是做互聯網內容安全工作的,主要的內容其實大同小異。我這裏補充一下,數美所做的兩個領域:一是今天的主題——內容,其二我們稱為「賬號的安全」。
?
?技術分享圖片
(數美科技反欺詐專家施興)
?
在我們身邊,有哪些人幹壞事,不僅是通過發違規的廣告、圖片這些內容,其實像大家平常使用的各種 APP 裏,會有很多優惠券、積分,這方面也涉及到安全問題。這些可能不屬於剛才楊帆先生所分享的領域。
?
數美主要支持的是互聯網,所以有一些其他方面的內容。比如現在比較流行的直播,裏面有主播會通過非文字的一些表述,通過文字識別就無法判斷出它是不是違規的內容,我們最近上線的嬌喘識別,就是針對這個問題的。
?
另外,我們數美會在審核中加入用戶全鏈路的生命周期,從而識別你發內容的設備是不是有問題。比如說一個直播,我們發現它不是通過手機來看的,而是通過虛擬機來看,並且發文本的頻率非常高,那麽我們可以判斷正常普通的用戶,是不會這樣做的,所以它違規的可能度就會很高。
?
在別的維度上,比如賬號、手機號,就像七牛雲上的很多客戶,有一些數據是可以相通的。當發現一個人在某平臺上發布違規內容的時候,同時也會對他在其他平臺上的內容進行審查。
?
彭垚:感謝兩位嘉賓的分享,七牛、訊飛、數美其實都是在做 AI 加安全,同時都是偏互聯網數據這個方向的。而大華一直在做的是線下空間的領域。我其實也有一個問題,也是這個系統的總趨勢,就是不管是我們線下的視頻、還是攝像頭硬件產生各種各樣的視頻、還有我們傳到我們存儲上的內容,在制作、拍攝或者監控時,無意識過程當中產生安全隱患的問題。面對這個問題,長遠來看,應該有哪些規劃?大華可以提供一些信息嗎?
?
許焰:大華現在主要是做線下,像人臉識別或事件類的識別,還是簡單、一次性的事件觸發模式。未來的發展是復雜事件的識別。舉個例子,假設一個人進入場館五分鐘,他進去的時候拿著包,出來卻沒有拿包,我們是否可以識別這種帶場景語意的情況?我們未來要把人工智能維度再上升,來做這樣的事情。另一方面,現在線上線下打通趨勢越來越明顯。我們從智慧城市角度去看,我們把感知綜合起來,通過這些去做畫像會更加完整。
?
技術分享圖片?
(大華研發中心副總裁許焰)
?
彭垚:感謝許總的分享。楊帆是否可以為我們分享一下迅飛的相關規劃嗎?
?
楊帆:我是做政府安全行業的,但是我覺得從市場角度來說,除了政府監管單位要做內容審核,其實每一個互聯網企業也有責任去做內容審核。正如我們和彭總這幾天一直再聊的,把這個放在七牛雲平臺上作為運營商解決方案,來提供增值附加服務。
?
彭垚:謝謝。下面請施興先生為帶來他的分享。
?
施興:我從技術角度來看趨勢。大家現在動不動就說人工智能,但很多創業公司不會留出力量來做特別前沿的探索,大部分都是「拿來主義」。那麽在這方面,我們怎麽去做創新?我覺得可以分為幾個點。
?
首先是審核的細化。在未來,我們很難界定內容的合規與否,像是政府對於內容是否違規的判斷標準並不明確。同時每家公司對是否違規都有自己的解讀,如果是第三方服務,想解決這樣的需求,只能在標準上,可以有更細致的一個劃分。也就是誰我可以講審核分為很多等級或者層級,針對客戶不同的場景,做場景化、定制化的標簽,來實現審核的細化。
?
第二個是數據。未來的數據,如何更好地去解決用戶的痛點,這也是我們現在正在努力的。舉個例子,同樣的場景下一百個主播,其中的幾個主播有幾分鐘的違規內容,我怎麽去找那幾分鐘?這也是我們研究的一個方向。
?
最後一個部分,是從內容以外的層面來這個內容審核進行補充。
?
彭垚:我非常贊同施興的觀點。我看過廣電很多審核的標準,其實對審核的要求非常高,審核員對歷史、文化都特別理解才可以去做審核。因為一般人看不懂有些暗示政治事件的視頻,但這個視頻就是違規的。這個難度非常大,我們現在用深度學習計算機視覺的算法,加上語義、知識庫去解決,都很難解決好,目前的理論基礎還有很多無法高效解決這種高級智能需求。
?
可以說我們的理論研究,是被行業產品推著去發展的。比如說空氣動力學,是在飛機產生後 30 年才產生的。我們現在如同瞎子摸象一樣,在業務上、理論上去改進,急需建一套新的理論來解決我們當下遇到的問題,同時實際產品再做抽象,從而對理論進行反哺,就是我們做的事情。所以始終來說我們是做技術的,做的是技術領域的工程產品。搞研究、搞理論,在學院裏面的特別厲害,但離不開我們技術人員不斷嘗試,發明新產品真正落地,是靠我們技術人員+理論學者共同在推動新的技術和理論體系的發展,我相信一直是這樣的。
?
?
Q&A?
? ? ? ? ?
?
Q:各位好,我想請教一個問題。隨著行業對內容審核的重視程度日益加強,對內容審核的要求也越來越高。以金融行業為例,保監會要求保險不能和理財產品進行收益對比,否則就會被認為是違規的誘導行為。但業務員或保險員的推銷語言,可能會被理解成多種意思,那麽如何判斷他們的話術是否違規呢?按照目前的技術來說,對語意的解讀可以達到什麽樣的水平呢?

A:楊帆:迅飛有很大一部分是做智能客服的,為金融、保險,包括移動運營商等提供服務。這部分的服務其實就是給他們的客服電話做機檢,但是要求非常高。電話接通多長時間?業務有什麽樣的解答?有沒有說不該說的話?機檢都非常嚴格。如果是把語音轉成文字,再按照標準把其中的違規內容檢索出來,就比較簡單。但若是讓機器去理解語言,來判斷有沒有故意誘導,我估計就比較難了。?
?
Q:這是一個行業痛點,因為目前通用的人檢方式,工作量太大了,如果機檢成功率可以在 95% 以上,剩下 5% 不確定的內容再用人審就好得多。不知道現在的成功率可以達到多少?我也期待七牛雲和科大訊飛進一步合作,實現比較高的成功率。
A:彭垚:其實不光是內容審核,包括反欺詐、智能客服、公安安防等方面都有一個共性,就是人工智能再智能,也不是百分之百可以解決問題的。因此最核心的問題是,在你的應用場景下,你對錯誤的容忍度是多少?零容忍當然是沒有辦法做到的,我們可以做的是慢慢叠代產品來提高準確度。但是您剛剛說的場景由於數據量太大,人無能力全檢查,而機器能至少查到部分違規情況,並且隨著機器準確率的提升可以檢查到更多風險點,那就是一個好的應用落地點。?
?
為什麽會有這一波 AI 浪潮?因為有了深度學習技術之後,目前準確率剛好可以面向越來越多行業應用的可容忍的情況,因此我們也可以做一些應用和模型來解決越來越多問題。通過這樣的方式先把研究 AI 的公司養活,在此基礎上,再把準確率和應用能力疊加、叠代、提升。我們可預見 AI 越來越好的發展未來。
?
?
?

2018 雲棲大會七牛雲專場之圓桌論壇 | 多維度內容審核打造零風險運營體系