外套脫掉脫掉,等等,這個不能脫!
這篇推送真的很正經。
脫脫脫……
你以為脫啥?
收起你淫X的小眼神。
我們要脫的東西很高階
·
·
·
Data Masking
資料脫敏,是一種為使用者提供虛假資料而非真實資料、防止敏感資料濫用的技術。
其中靜態脫敏(通常在非生產資料庫中防止靜態資料的濫用)也就是當前世平脫敏系統的執行機制。
脫敏這件事似乎並不複雜,三言兩語間各位看官也能知其所以,畢竟要做到這件事實在是太簡單了——
拿到一份文件,雙擊、全選、鍵入“xxx”、儲存、關閉、收工,你就能相當完美地完成本次的脫敏工作。
然而作為一家 有 追求 有理想 有野心的 優雅的 紳士的 高科技公司,這種 讓人一絲不掛的粗暴脫法 我們是完全不能接受的,採用極端手段來達到某種極端的效果並不是世平做產品做安全的理念。
在產品和服務品質面前,我們
隨機/固定字元替換、簡單位移、欄位標星等常規的脫敏手段確實將資料的敏感性去除了,但也犯了資料處理中 最致命的錯誤 —— 破壞了資料的原始可用性 。
資訊保安的三要素,可用性、完整性、保密性,從任何角度來說,都是一個微妙的平衡、缺一不可。
因此,我們就聊聊到底應該怎麼脫。
為何而脫
人在江湖,就得守江湖規矩。
今年5月,歐洲的江湖出臺GDPR(通用資料保護條例),出臺的目的就是保護公民的個人資訊不被非法使用,其對個人敏感資料的類別定義為:
- 種族或民族出身
- 政治觀點
- 宗教/哲學信仰
- 工會成員身份
- 涉及健康、性生活或性取向的資料
-
基因資料(新)
……
對於上述資料,任何此類資料的持有機構都不能擅自發布、使用和處理。
其中特別提到,對於個人照片的使用,“僅在通過特定技術方法對照片進行處理,使其能夠識別或認證特定自然人時,照片才被認為是生物識別資料。”也就是說,此類個人資料需要精確對應到個人,才被認定為個人資料。
因此當我們在某些場景(如資料分析、統計或定向釋出)需要使用這類資料時,如何合法和合規地去利用它們呢?答案就是“脫”,脫去資料和個人的關聯性。
再看國內,有《網路安全法》、《公共及商用服務資訊系統個人資訊保護指南》以及與金融業密切相關的《商業銀行資訊科技風險管理指引》先後出臺,國家對於個人資訊的保護願景也提升到了歷史最高點。
特別在金融(銀行、證券等)行業,資料脫敏已經被明文寫入相關規劃和管理條例當中,成為行業資料安全“剛需”。
銀行業資料脫敏相關條例
大家都看到啦,江湖規矩,脫脫益善。
脫什麼
即可。
因此很多常規的脫敏手段都能夠達到此類效果,如前文提到的,隨機/固定字元替換、簡單位移、欄位標星等等。
下圖能夠非常清楚的說明常規的資料脫敏手段所能達到的使用效果:
資料脫敏效果展示
從上圖中我們能夠看到,原始的使用者資料經過處理後所得到的變形資料已經不能反映出使用者的原始資訊。
換言之,我們不能通過得到的變形資料來精確定位到真實的使用者個人,因此資料的持有者就能夠根據業務需求自行處理,使用時也不必再擔心觸犯個人資訊的相關保護條例。
脫什麼,另一個層面,我們還應關注哪些資料是我們脫敏的目標物件,經過世平資訊多年的行業資料保護經驗積累,我們建議使用者從以下幾個型別的資料著手關注資料敏感性保護:
- 姓名
- 身份證
- 手機/座機
- 社保資訊
- 銀行卡號
- 交易信息
- 個人衛生資訊
-
中文地址
……
做到上述資料的敏感性保護,我們基本就能降低這些關鍵資料的洩露風險,從安全形度來看,我們的脫敏工作也就到此為止。
然而,話題並沒有結束。
不脫什麼
“猶抱琵琶半遮面”很美,我們不妨想象一下,當琵琶完全遮住了臉,或者完全不遮臉時,整個畫面又是如何?
不難發現,“遮”的度至關重要。
“脫”也同理,所以我們還要聊聊度的問題,也就是在脫敏過程中,哪些是絕對不能脫的。
常規的脫敏手段從安全層面來說完全沒有問題,但大家都不會認同這是一個完美的解決方案。很顯然,它破壞了資料的可用性,這個資料都不能被繼續利用了,我們做脫敏的意義難道僅僅是為了安全嗎?
如果純粹為了安全,不如把資料直接刪除來得可靠。
在一些資料利用場景中我們發現,即便是做資料脫敏,某些特性也必須保留,如資料的原始屬性。舉個例子,“姓名”這一資料經過脫敏後,還是應該保留姓名字元的組合規律。
如此注重資料質量的保留,就需要引入資料治理中對於資料清洗的概念,如下圖所示:
資料清洗架構
大資料時代,資料集中已成為趨勢,得到標準化的高質量的資料是資料治理的最終目標,它是資料利用前最為重要的一個環節。
世平作為一家以資料安全防護和資料安全治理為己任的公司,我們認為脫敏這一資料處理環節也應結合當下資料利用的趨勢,以更精準更貼合數據利用戰略目標的方式來完成資料脫敏這一看似簡單的資料安全環節。
所以,如果處理的結果最終影響資料的再度利用,我們不脫。
脫與不脫,山人自有妙計
針對這樣的資料脫敏理念,世平資訊的脫敏系統提供了能夠同時滿足使用者資料安全和資料利用需求的資料脫敏方案:
世平資料脫敏架構
- 根據實際場景定製脫敏模型
針對不同的使用者行業制定定製化敏感資料發現規則,既然要脫,脫哪兒必須明確!
- 操作簡單,便於運維管理部門維護
脫敏資料準確、高效,提高測試資料質量。
- 脫敏方式豐富,脫敏演算法可自定義
內建多種脫敏演算法,可根據不同場景選擇對應的脫敏演算法,自由調節脫敏後資料關於安全性和可用性的平衡,滿足多場景應用需求。
- 脫敏結果報表可視
內建豐富審計要素,不僅能夠了解任務的執行狀況、詳細錯誤資訊,對於脫敏資料還提供前後對比展示,方便使用者把握脫敏質量。
- 輸出精準
支援庫到庫、庫到檔案、檔案到庫、檔案到檔案形式的脫敏,同時支援異構資料庫的相互載入,完全覆蓋使用者使用場景。
- 資料脫敏過程不落地
當操作的物件為敏感資料時,任何第三方的系統都不能擅自存放使用者資料,世平脫敏的記憶體處理機制能夠最大程度保證使用者資料的安全性,防止出現二次洩露。
— THE END —
杭州世平資訊科技有限公司(簡稱“世平資訊”),致力於智慧化資料管理與應用的深入開拓和持續創新,為使用者提供資料安全、資料治理、資料共享和資料利用解決方案,幫助使用者切實把握大資料價值與資訊保安。