1. 程式人生 > >資料脫敏解決方案——金融行業

資料脫敏解決方案——金融行業

帆 世平資訊 1周前

一、現狀分析

行業背景

金融行業是高度資訊化的行業,在人們的日常生活中扮演著重要的角色,同時也積累了大量的使用者個人資料,如何保證生產環境資料安全已經成為一個行業難題。

在加強金融(銀行)行業監管的大背景下,對資料安全的要求不斷提高,《中國銀行業“十三五”資訊科技發展規則監管指導意見》、《人民銀行(2011〕17號》及《銀監會資訊科技風險現場檢查指南》等行業監管單位指導性檔案中明確要求:

銀行機構應規避資訊風險,加強資料、文件的安全管理,對客戶的敏感資訊提供完善的保護,對用於測試開發的生產資料要進行脫敏、變形、實現有效保護,逐步建立資訊資產分類分級保護機制,完善敏感資訊儲存和傳輸等高風險環節的控制措施。

個人隱私保護趨勢

大資料及雲平臺的發展,最終目的在於提高資訊的利用率、資料的流通性、進一步挖掘資料的價值,尤其是在金融領域長期積累的資料,其本身的價值也越來越高。

如何做到既能充分利用這些資料,又能把這些資料有效地保護起來,成為金融領域資料安全重點關注的領域。

 國內對於個人隱私資料保護的政策法律也日益完善:

  • 憲法和民法通則對個人隱私實行保護;

  • 2009年《刑法》將洩露個人資訊入罪;

  • 2010年《企業內部控制基本規範》(即“中國的薩班斯法案”);

  • GBT 22239-2008 資訊保安技術 資訊系統安全等級保護基本要求;

  • GBT 22240-2008 資訊保安技術 資訊系統安全等級保護定級指南;

  • 我國首個個人資訊保護國家標準——《資訊保安技術公共及商用服務資訊系統個人資訊保護指南》2013年2月1日起實施;

  • 最高人民法院2014年10月9日公佈《最高人民法院關於審理利用資訊網路侵害人身權益民事糾紛案件適用法律若干問題的規定》;

  • 網路安全法第41條、第42條。

個人隱私安全所面臨的挑戰

1. 大量積累的業務資料,在用與防之間的流轉過程中,如何保障個人隱私?

隨著金融業務的快速發展,業務生產系統積累了大量包含客戶賬戶等敏感資訊的資料。而在業務分析、開發測試、審計監管,甚至是外包業務等金融業的工作場景中,工作人員使用的都是真實資料。

如果這些資料發生洩露、損壞,不僅會帶來經濟損失,更重要的是會大大影響使用者對該金融機構的信任度,如何保證生產資料安全已成為銀行必須面對的一個重要問題。

2. 上級主管部門不斷推出針對性的政策法規,如何確保自身資料合規?

上文“行業背景”中已作關於行業政策法規的說明。

3. 現有技術明顯跟不上業務發展的需要,輸出包含有個人隱私資料的過程不夠規範。

(1)備份恢復手段直接獲得測試資料

  • 優點是簡單快捷;

  • 弊端卻是隱私資料毫無保留地被洩露。

(2)由開發商負責脫敏

  • 看似對資料進行了處理,但實際上執行者是開發商,真實資料同樣已外流;

  • 效率低下,佔用大量人力和時間;

  • 規則簡單,通過逆向運算即可得到真實資料,並且簡單的規則還會導致資料大量失真,模擬度太低,影響測試效果。

(3)寫程式、指令碼或命令對資料進行脫敏,效率不高,準確率無法判斷

  • 對客戶員工的技術水平要求較高;

  • 不成熟的演算法導致測試資料質量同樣不高。

二、隱私資料脫敏解決方案

方案定位

基於上述金融行業隱私資料使用以及保護過程中所存在的問題,世平資訊針對銀行非生產環境使用生產環境資料專門設計了“測試與隱私資料保護”解決方案。

該方案能夠幫助金融機構相關部門對敏感資料的訪問進行必要的管理,同時建立完善統一的脫敏機制與管理流程。該方案通過建立可在內部和外部安全共享的真實但無法識別歸屬的資料,防止個人隱私資料與其它重要資訊意外洩露。

方案基本原理

本方案設計的主要目的是解決在金融生產環境與非生產環境敏感隱私資料的使用過程中,如何保護個人隱私資料的難題,實現金融業務與管理無縫對接,快速高效地實現生產環境資料向非生產環境的過渡。

具體原理如下圖所示:

個人隱私資料漂白原理圖

第一步:為生產資料建立一套隱私資料的模型和關係,同時支援自動定義和手工定義兩種模式;

第二步:通過內部儲存的生產資料模型,從生產系統週期性地抽取真實資料;

第三步:根據隱私資料模型,將抽取到的真實資料進行漂白脫敏,生成偽資料,這樣測試資料就準備好待用,由於方案設計的平臺是封閉系統,整個過程能夠很好地避免資料洩露事件的發生;

第四步:當需要使用樣例資料時,使用者並不會直接訪問內部資料,而是使用有限許可權的帳號登入並將資料高速裝載到外部的某個資料庫中。

功能與業務流程設計

功能與流程

上圖是整個方案的功能模組及業務流程,整個方案的功能與業務流程主要分成5個部分:

1. 資料智慧發現

自動掃描並定位銀行生產資料中的敏感資料,建立隱私資料模型,自動識別表與表之間的關聯關係,世平利用自身獨一無二的深度內容識別技術,在敏感資料智慧發現上具有獨一無二的競爭優勢。

2. 資料梳理識別

根據隱私資料模型進行敏感資料匹配,定位哪些表哪些欄位為隱私資料,屬於哪種隱私資料,同時對於出錯的資料進行進一步梳理,剔除錯誤資料,保證隱私資料模型的準確;

3. 資料自動抽取

根據自身記錄的生產系統的元資料定義,從生產系統資料庫當中抽取資料,抽取的資料來源支援主流的資料庫系統及檔案。為安全起見,隱私資料在完成漂白之前,非資料管理員看到的都是空表。

4. 資料高效脫敏

資料漂白會自動根據元資料中隱私資料的定義,內建豐富的隱私資料模型規則,同時也可以自定義修改脫敏規則,對相應的資料進行脫敏變形。生成的偽資料具備以下特徵:

  • 高度模擬;

  • 保持資料關聯性;

  • 保持資料的唯一性;

  • 隱私演算法靈活,保證資料的完整性。

5. 資料裝載

面向不同的元資料,可以提供豐富多樣的資料分發方式,同時支援對目標源的自動校驗,最大限度保障使用者資料的安全。

  • 支援異構平臺;

  • 支援元資料的裝載;

  • 支援全量裝載;

  • 使用操作簡單且批量寫入高速。

方案收益

通過本方案的設計與實施,實現了金融行業的敏感資料保護,使其在保留資料意義和有效性的同時保證資料的安全性,並遵從金融行業資料隱私法律和法規。具體價值如下:

1. 實現了個人名稱、地址、聯絡電話、身份證號碼、卡號等個人資訊資料與組織機構資訊的脫敏處理。例如用相似的字元替代一些欄位,用遮蔽字元替代字元等,使顯示的資料是“逼真”的;

2. 脫敏後各表格中的資料關聯關係依然保持一致,只需在一個表中應用替換演算法,其它表格中客戶相關資訊同時自動更改;

3. 形成企業內部完善統一的脫敏機制與管理流程;

4. 同時整個解決方案還具有高效、易用、可擴充套件的特點,為後期推廣打下堅實的基礎。

方案特色

1. 治

依法合規,提供專業的多源異構資料管理,實現敏感資訊的審計追溯,滿足監管要求;

2. 智

基於深度內容識別技術的敏感資訊智慧發現,定製適合使用者實際場景的模型;

3. 簡

一站式資料脫敏任務制定,重複使用無影響,脫敏流程符合實際使用者使用習慣,同時簡化操作流程,脫敏規則雙向保證,按需定製的同時,保證脫敏後的資料有效、多樣、真實、高效及穩定;

4. 富

豐富的資料脫敏方式,支援刪除、常數替換、隨機查表替換等多重組合,形成對敏感生產資料的天然保護屏障;

5. 視

脫敏過程全程跟蹤,結果快速比對,簡化二次稽核過程,脫敏結果報表視覺化展現;

6. 準

靈活&自動化資料分發,支援庫到庫、庫到檔案、等多種精準輸出方式;

7. 安

高等級安全標準設計系統,內建三權分立模組,脫敏結果不落地,同時提供“資料清理”功能,確保無任何剩餘資訊殘留。

—END—

杭州世平資訊科技有限公司(簡稱“世平資訊”),致力於智慧化資料管理與應用的深入開拓和持續創新,為使用者提供資料安全、資料治理、資料共享和資料利用解決方案,幫助使用者切實把握大資料價值與資訊保安。

近期熱點