1. 程式人生 > >騰訊資料安全專家談聯邦學習開源專案FATE:通往隱私保護理想未來的橋樑

騰訊資料安全專家談聯邦學習開源專案FATE:通往隱私保護理想未來的橋樑

資料孤島、資料隱私以及資料安全,是目前人工智慧和雲端計算在大規模產業化應用過程中繞不開的“三座大山”。

 

“聯邦學習”作為新一代的人工智慧演算法,能在資料不出本地的情況下,實現共同建模,提升AI模型的效果,從而保證資料隱私安全,突破資料孤島和小資料的限制,這無疑成為了跨越“三座大山”的途徑之一。因此,作為聯邦學習全球首個工業級開源專案,FATE也受到了各方關注,開發者們對加入社群建設紛紛表示期待。(FATE開源社群地址:https://github.com/FederatedAI/FATE)

 

而在貢獻者激勵機制推出以後,FATE開源社群迎來了首位一級貢獻者——來自騰訊雲的劉洋。聯邦學習怎樣賦能行業資料安全?隱私保護從業者怎樣評價FATE?劉洋博士在採訪中表達了自己的看法。

資料運算提效70% 加速企業應用落地

 

博士畢業於澳大利亞國立大學的劉洋,同時是騰訊雲的高階研究員,負責騰訊神盾沙箱的隱私保護演算法部分。劉洋表示,因自身從業領域的緣故,從年初就開始密切關注著“聯邦學習”。

 

也因此,FATE進入了其視野,受到了劉洋及騰訊雲團隊的重點關注。在對FATE進行深入瞭解後,劉洋認為騰訊神盾沙箱打造的隱私安全+分散式學習的理念,與FATE要解決的“資料安全”“資料隱私”“資料合規”三大問題不謀而合,並逐步開始使用FATE滿足神盾沙箱的功能需求。

劉洋表示,經過長期接觸後,對FATE的邏輯迴歸和XGBoost演算法流十分認同,因此也開始加入FATE開源社群建設,提出了優化建議——利用對稱的仿射密碼替代Paillier密碼,將訓練時間提升70%以上,從而給同態運算“減負”。未來合作企業在應用優化過後的FATE版本時,可以有效降低資料運算的時間成本,提升企業在AI時代的技術競爭能力。

 

行業負重前行 資料安全迫在眉睫

 

AI應用場景中,將多方資料中心式合併處理的傳統合作方式,存在著嚴重的隱私洩露問題,這一癥結甚至成為了企業大規模應用AI的關鍵阻礙。

 

在劉洋看來,破局關鍵仍在於資料安全問題的解決,即資料privacy和utility的折衷問題。具體來說,資料要想安全的從孤島分享出去,必須經歷某些“蒙面”操作:通過密碼學工具將有效資料轉換成亂碼,privacy保住了,但金鑰在誰手中,極大的影響資料的utility;用噪聲混淆原始資料也可以,例如差分隱私,噪聲越大,越保證privacy,但使用者拿到資料發揮的utility越低。怎樣在privacy和utility中尋求一條折衷之路,是資料安全流通的關鍵問題之一。

 

未來理想的狀態是,任何資料使用者能夠在自由流動和聚合的分散式資料之上,進行高效的資料探勘操作,而絲毫感覺不到隱私保護的羈絆。在MPC(Multi-party Computation,多方安全計算)領域,目前行業還停留在混淆電路、可信計算等解決方案,雖然支援的計算任務具有一般性,但需要額外的硬體支援,學習成本較高,阻礙了規模化應用的同時,也不利於安全資料聯盟的形成。

 

而聯邦學習在具有普適性的聯邦框架中,針對每一種或每一類機器學習演算法進行訂製化的隱私保護改造,使它們的使用無異於經典的中心式機器學習模型。相比之下,聯邦學習在穩住成本的基礎上,確保了易用性。劉洋稱,對於企業而言,聯邦學習提供的解決方案更具吸引力;對於行業而言,更便捷的操作將吸引更多開發人員的投入,從而推進安全資料聯盟的構建。

 

FATE生態×騰訊雲 資料安全未來可期

 

今年5月初起,FATE和騰訊雲神盾沙箱就開始進行業務往來和技術交流,目前神盾沙箱的核心計算模組由FATE提供。在搭建平臺過程中,雙方緊密合作。劉洋在採訪中表示,團隊在使用FATE框架、演算法時,會將有效建議貢獻到FATE開源專案中,參與開源社群建設。

這種帶有“互助互惠,開源共築”特色的合作形式,在促進了神盾沙箱的產品打磨和FATE專案的完善的同時,也給其他技術專案或團隊提供了很好的樣板示範——以開放的姿態擁抱新的技術,不僅於自身有利,也將助推整個行業的發展。

 

在劉洋的設想中,未來兩者可以在提升技術影響力和業務落地等方面進行更深層次的協作,例如合作發表重要論文、提交專利和聯手接手內外部實際業務,形成“學術”“業界”兩開花的美好局面。


隨著越來越多貢獻者加入FATE理論標準與行業應用的建設,FATE勢必會迎來更廣闊的前景。對此,劉洋表示,神盾沙箱和FATE的聯手將會加速資料安全的紮根與生長,在資料孤島之上構建起安全資料