資料脫敏平臺-大資料時代的隱私保護利器
什麼是資料脫敏
又稱資料漂白、資料去隱私化或資料變形。是對核心業務資料中敏感的資訊,進行變形、轉換、混淆,使得對業務資料中的身份、組織等隱私敏感資訊進行去除或掩蓋,以保護資料能被合理、安全地利用。
◆ ◆ ◆
資料脫敏的重要性
1)敏感資料洩露風險與日俱增
敏感資料洩露是全球最普遍存在的安全事件,核心業務系統的資料投放到開發、測試、培訓及共享等二級資料應用環境,大資料應用開發環境存在許多資料資源,軟體開發與運維廠商眾多,資料安全管理意識淡薄,在資料趨利的時代,極易引發敏感資料從非生產環境洩露的風險,帶來不可估量損失。
2)遵從安全合規性要求需要
國家總局總行級別機構出臺各類監管條例,對資料安全合規性提出要求。如《資訊保安等級保護管理辦法》、《網路安全法》、《公共及商用服務資訊系統個人資訊保護指南》、金融業《商業銀行資訊科技風險管理指引》等對資料安全提出明確規範。《資訊保安等保三級標準》指出“應用系統必須提供敏感標記設定功能”、“依據安全策略嚴格控制使用者對有敏感標記重要資訊資源的操作”。刑法對資料安全防護缺失的處罰指出“不採取安全技術措施導致嚴重資料安全事件,處1-3年有期徒刑,特別嚴重的判處3-7年有期徒刑”。
3)資料洩露影響大
政務資訊保安關係國家安全和機密、社會穩定。各領域資料資源具有資源多、廣、全、散,涉密高,一旦洩露則侵犯隱私、社會影響大、公信力及聲譽受損。
◆ ◆ ◆
大資料時代的脫敏要求
隨著大資料時代的來臨,大資料、雲端計算、人工智慧等新技術應用的不斷深化,為資料的深度挖掘、分析提供強有力的支撐,大資料中蘊含的巨大價值被逐步挖掘出來。但是同時也帶來隱私、敏感資訊保護方面的棘手難題。如何在實現資料高效共享、分析挖掘的同時,保護敏感及隱私資訊不被洩露對脫敏作業提出了更高的要求。
1. 大資料處理能力
大資料的核心特性便是資料體量巨大,資料量從TB級別躍升到PB級別。傳統脫敏工具無法完成如此海量資料的抽取、脫敏、投遞作業。
2. 相容大資料儲存
傳統脫敏工具多用於關係型資料庫結構化資料的脫敏作業,對大資料平臺(如阿里雲MaxCompute、星環TDH等)不相容,缺乏對大資料平臺的資料脫敏能力。
3. 廣泛的分發模式
資料的交換和共享越來越頻繁,庫到庫的脫敏資料投遞模式已不足以支撐日益多元化的資料分發場景,必須進一步擴充套件支撐庫、檔案、大資料平臺三者間的任意分發模式。
4. 作業規範與監控
資料越集中,資料的安全管控就越重要,對資料的操作就越需慎重。資料分析利用日趨頻繁,作業過程缺乏統一規範和監控易引發資料洩露和資料丟失等安全事故,必須採用必要的手段實現資料脫敏作業統一規範、過程可控。
◆ ◆ ◆
華雲慧通資料脫敏平臺
針對業務系統和大資料平臺,對其資料資源中的敏感資訊進行脫敏保護,高效投遞到開發、測試、培訓、共享等二級資料服務環境,滿足使用者方IT建設的資料多樣化需要,達到資料安全管控的要求。
平臺核心技術特性
1)識別、脫敏、資料投遞一體化
自動化識別敏感資料範圍,提高脫敏目標精準性,廣泛的相容不同資料庫型別,一對多的脫敏拓撲結構,自動化高效的實施脫敏,提高運維能力。
2)敏感資料發現
結合關鍵字、語義特徵,自動化地敏感資料發現,從而降低資料風險,提高安全效率。
3)支援大資料、關係庫、檔案源
廣泛的相容性,支援Oracle、Mysql等關係型資料庫脫敏,也支援大資料平臺例如阿里雲ODPS庫、星環TDH庫的資料脫敏,支援檔案源的資料脫敏,從而滿足客戶不同資料環境下的脫敏投遞需求.
4)保持業務關聯
在資料脫敏的同時,保持資料隱含業務規則的有效性,不破壞資料的業務規則。同時保持資料之間的一致性關聯邏輯,確保脫敏後資料的可用性。
5)配置靈活資源沉澱
摒棄指令碼配置的傳統模式,實現脫敏作業圖形配置、敏感識別策略可維護可擴充套件,脫敏演算法可維護可擴充套件可線上測試,提高平臺相容性和擴充套件性。將任務配置資訊、敏感識別策略、脫敏演算法等元資料沉澱,支撐不同環境的脫敏配置,最大化複用。
6)內建稅務領域常見脫敏規則
可高效地完成不同省份稅務領域資料脫敏的實施工作。
核心功能介紹
1)任務配置
支援圖形化配置及輕量級指令碼兩種模式。
2)敏感資料發現
多種敏感識別策略實現敏感資料的主動掃描,支援自定義掃描任務、掃描任務管控及掃描結果人工核准等功能。
3)運維管理
視覺化運維介面,支援執行狀態檢視、作業啟停等狀態控制、日誌跟蹤檢視、排程管理等功能。
4)敏感識別策略管理
提供給脫敏作業人員進行敏感詞維護、敏感識別策略維護及啟停控制等功能,實現識別策略的可擴充套件。
5)脫敏演算法管理
支援脫敏演算法的啟停控制、新增維護、線上測試功能及脫敏模板維護功能。
6)監控&分析
提供圖表結合的監控儀表盤,對全域性脫敏作業任務進行實時監控,不同維度監控執行狀態。
文章轉自:華雲慧通
更多交流諮詢歡迎加入“MaxCompute開發者社群”釘釘群,群號: 11782920,或掃描二維碼入群。