1. 程式人生 > >區塊鏈和大資料的關係

區塊鏈和大資料的關係

    馬雲說過,這是一個變化的年代,當很多人還沒有搞懂PC網際網路的時候,移動網際網路來了,當很多人還沒弄懂移動網際網路,大資料來了。而今天,很多人還沒弄懂大資料,區塊鏈又來了。區塊鏈與大資料究竟有著怎樣的關係?看完本文的五大觀點,你會認同賽智時代的這個結論:區塊鏈讓大資料洶湧而來。

這裡寫圖片描述

       一、資料安全:區塊鏈讓資料真正“放心”流動起來

       區塊鏈以其可信任性、安全性和不可篡改性,讓更多資料被解放出來。用一個典型案例來說明,即區塊鏈是如何推進基因測序大資料產生的。區塊鏈測序可以利用私鑰限制訪問許可權,從而規避法律對個人獲取基因資料的限制問題,並且利用分散式計算資源,低成本完成測序服務。區塊鏈的安全性讓測序成為工業化的解決方案,實現了全球規模的測序,從而推進資料的海量增長。

       二、資料開放共享:區塊鏈保障資料私密性

       政府掌握著大量高密度、高價值資料,如醫療資料、人口資料等。政府資料開放是大勢所趨,將對整個經濟社會的發展產生不可估量的推動力。然而,資料開放的主要難點和挑戰是如何在保護個人隱私的情況下開放資料。基於區塊鏈的資料脫敏技術能保證資料私密性,為隱私保護下的資料開放提供瞭解決方案。資料脫敏技術主要是採用了雜湊處理等加密演算法。例如,基於區塊鏈技術的英格碼系統(Enigma),在不訪問原始資料情況下運算資料,可以對資料的私密性進行保護,杜絕資料共享中的資訊保安問題。例如,公司員工可放心地開放可訪問其工資資訊的路徑,並共同計算出群內平均工資。每個參與者可得知其在該組中的相對地位,但對其他成員的薪酬一無所知。

這裡寫圖片描述

資料HASH脫敏處理示意圖

       三、資料儲存:區塊鏈是一種不可篡改的、全歷史的、強背書的資料庫儲存技術

       區塊鏈技術,通過網路中所有節點共同參與計算,互相驗證其資訊的真偽以達成全網共識,可以說區塊鏈技術是一種特定資料庫技術。迄今為止我們的大資料還處於非常基礎的階段,基於全網共識為基礎的資料可信的區塊鏈資料,是不可篡改的、全歷史的、也使資料的質量獲得前所未有的強信任背書,也使資料庫的發展進入一個新時代。

       四、資料分析:區塊鏈確保資料安全性

       資料分析是實現資料價值的核心。在進行資料分析時,如何有效保護個人隱私和防止核心資料洩露,成為首要考慮的問題。例如,隨著指紋資料分析應用和基因資料檢測與分析手段的普及,越來越多的人擔心,一旦個人健康資料發生洩露,將可能導致嚴重後果。區塊鏈技術可以通過多簽名私鑰、加密技術、安全多方計算技術來防止這類情況的出現。當資料被雜湊後放置在區塊鏈上,使用數字簽名技術,就能夠讓那些獲得授權的人們才可以對資料進行訪問。通過私鑰既保證資料私密性,又可以共享給授權研究機構。資料統一儲存在去中心化的區塊鏈上,在不訪問原始資料情況下進行資料分析,既可以對資料的私密性進行保護,又可以安全地提供給全球科研機構、醫生共享,作為全人類的基礎健康資料庫,對未來解決突發疾病、疑難疾病帶來極大的便利。

       五、資料流通:區塊鏈保障資料相關權益

       對於個人或機構有價值的資料資產,可以利用區塊鏈對其進行註冊,交易記錄是全網認可的、透明的、可追溯的,明確了大資料資產來源、所有權、使用權和流通路徑,對資料資產交易具有很大價值。

       一方面,區塊鏈能夠破除中介拷貝資料威脅,有利於建立可信任的資料資產交易環境。資料是一種非常特殊的商品,與普通商品有著本質區別,主要是具有所有權不清晰、 “看過、複製即被擁有”等特徵,這也決定了使用傳統商品中介的交易方式無法滿足資料的共享、交換和交易。因為中介中心有條件、有能力複製和儲存所有流經的資料,這對資料生產者極不公平。這種威脅僅僅依靠承諾是無法消除的,而這種威脅的存在也成為阻礙資料流通巨大障礙。基於去中心化的區塊鏈,能夠破除中介中心拷貝資料的威脅,保障資料擁有者的合法權益。

       另一方面,區塊鏈提供了可追溯路徑,能有效破解資料確權難題。區塊鏈通過網路中多個參與計算的節點來共同參與資料的計算和記錄,並且互相驗證其資訊的有效,既可以進行資訊防偽,又提供了可追溯路徑。把各個區塊的交易資訊串起來,就形成了完整的交易明細清單,每筆交易來龍去脈非常清晰、透明。另外,當人們對某個區塊的“值”有疑問時,可方便地回溯歷史交易記錄進而判別該值是否正確,識別出該值是否已被篡改或記錄有誤。

       一切在區塊鏈上有了保障,大資料自然會更加活躍起來。