java、python--差分隱私拉普拉斯分佈（Laplace）實現

阿新 • • 發佈：2018-12-31

最近在研究差分隱私，先用java實現了拉普拉斯分佈，做了個Hive互動式介面。後來又用python畫圖，準備做個非互動式資料釋出。

差分隱私的原理我先簡單介紹一下，Apple 用它來實現資訊保安。這裡舉一個例子來幫助理解，考慮一個醫療資料場景：

上圖顯示了一個醫療資料集D，其中每條記錄表示一個患者是否患有癌症，當資料集作為科研資料或者社會調研被髮布出來時，他對使用者僅提供前n 行的統計查詢服務，這裡選取計數查詢，用count (n) 表示前n 行裡有多少個人患有癌症。

這裡攻擊者A 知道Jack 排在第3行（醫療資料記錄一般按一定順序排列，例如身份證號等），由於不能直接訪問D

（注意 D 僅提供 count (n) 查詢服務）， A 一開始並不知道Jack 的第二列屬性值是否為1，但是A 可以通過如下攻擊獲取Jack 的個人隱私資訊（是否患有癌症）：count (3) - count (2)。

那麼差分隱私技術在該案例中是如何保證資訊保安的呢？我們可以把刪除掉Jack 一行的資料集（或修改）看成D'，要求A 根據D 獲取的count 值，與根據D' 獲取的count 值的概率分佈差不多，假設count (3) 的輸出可能來自{1.5, 2}，那麼count (2) 以近似的概率輸出{1.5, 2} 中的任意值，Laplace 機制便能實現此功能，具體證明這裡就不說了都是複雜的數學公式。 ϵ-DP

的 ϵ 值就是用來控制概率分佈的相似性，當 ϵ 越小時，exp( ϵ ) 越接近於1。

拉普拉斯分佈圖：

廢話不說上程式碼，java程式碼：

import org.apache.commons.math3.distribution.LaplaceDistribution;
double laplaceMechanismCount(long realCountResult, double epsilon) {
LaplaceDistribution ld = new LaplaceDistribution(0, 1 / epsilon);
double noise = ld.sample();
return realCountResult + noise;
}

python程式碼：

import numpy as np
loc, scale = 0., 1.
s = np.random.laplace(loc, scale, 1)
ss=s[0]
print ss

其中epsilon和scale調節保護性的大小。

java、python--差分隱私拉普拉斯分佈（Laplace）實現

java、python--差分隱私拉普拉斯分佈（Laplace）實現

differential privacy 差分隱私摔門（三）

4、python簡單線性迴歸程式碼案例（完整）

JAVA實驗二：利用二維陣列（double[]）實現一個矩陣類：Matrix的相乘、轉置、相加等

JAVA網路程式設計 ——基於TCP的Socket程式設計（1）——實現伺服器端與客戶端的實時對話

影象處理之探索與驗證拉普拉斯運算元（Laplace）與 Hessian矩陣特徵值之間的關係

Java、Python分別是解釋型還是編譯型語言？

C++差分隱私的指數機制的一種實現方法

Unix時間戳轉日期時間格式，C#、Java、Python各語言實現！

fasttext的基本使用 java 、python為例子

黑馬基礎階段測試題：創建一個存儲字符串的集合list，向list中添加以下字符串：”C++”、”Java”、” Python”、”大數據與雲計算”。遍歷集合，將長度小於5的字符串從集合中刪除，刪除成功後，打印集合中的所有元素

大數據、java、Python、區塊鏈、人工智能哪個發展前景剛好？

以太坊Go、Java、Python、Ruby、JS客戶端介紹

Java、Python、C++這些語言的作用是什麼

免費視訊教程，2018最新Java、PYthon、web視訊

差分隱私（I）

比較分析C++、Java、Python、R語言的面向物件特徵，這些特徵如何實現的？有什麼相同點？

單端、差分、偽差分輸入

差分隱私保護及應用簡略瞭解

環境變數配置（Java、Python、Tomcat、Maven）

java、python--差分隱私拉普拉斯分佈（Laplace）實現

相關推薦