1. 程式人生 > >基於區塊鏈的資訊資源共享模式研究

基於區塊鏈的資訊資源共享模式研究

1 區塊鏈介紹
區塊鏈(Blockchain)為公眾所知緣於比特幣(Bitcoin),由Satoshi Nakamoto提出[3]。比特幣是一種創新性的支付系統和全新的數字貨幣,而區塊鏈則是支撐比特幣的底層技術和基礎架構。區塊鏈是由若干區塊通過雜湊指標連結而成的連結串列,如圖1所示:

 
圖1 區塊鏈基本結構

區塊的基本結構則如圖2所示:

 
圖2 區塊基本結構

一個完整的區塊鏈系統具有分層架構[4],如圖3所示:

 
圖3 區塊鏈的分層架構

區塊鏈涉及的資訊科技包括對等網路(P2P)技術、非對稱加密演算法、資料庫技術、數字貨幣[5],也包括Merkle樹、Hash演算法、時間戳技術、多種共識機制(Consensus Mechanism)等[6]。這些技術多為已有的成熟技術,而非新創技術,因此區塊鏈是由已有資訊科技經巧妙組合而形成的新技術,或者是已有資訊科技相互結合的顛覆性應用。
區塊鏈雖然因比特幣而出現,但是區塊鏈並不依賴比特幣。針對不同行業和不同應用,可以構造不同的區塊鏈,選擇或創造不同的共識機制,並在其上定義不同於比特幣的虛擬貨幣,即競爭幣。對於區塊鏈來說,虛擬貨幣是區塊鏈運轉的驅動機制,而對於虛擬貨幣來說,區塊鏈則是虛擬貨幣的產生和流通平臺。區塊鏈是分散式資料庫、分散式賬本的一種較為理想的實現,也是網際網路金融發展的趨勢之一[7,8]。
區塊鏈作為一種新的IT基礎設施,具備五個基本特徵:去中心化,不存在中心化的硬體或監管機構,交易無需中介;自治性,採用基於協商一致的規範和協議,所有節點均能在去信任的環境中自由安全通訊,運轉無需人工干預,人為干預也不起作用;安全可信,採用非對稱加密技術對交易資料加密,並採用工作量證明機制(POW)等保證資料不可篡改、不可撤銷;公開透明,每個節點都可有一份完整的區塊鏈,區塊鏈的資料對全網公開,可通過公開的介面查詢,區塊鏈軟體也是開源的,打破了資訊不對稱;匿名性,區塊鏈上的交易無須知道雙方實際身份,也很難將賬戶與賬戶所有人關聯起來[9,10]。
按照區塊鏈發展階段及功能的不同,區塊鏈有三個版本:區塊鏈1.0是貨幣,是一種安全的分散式的資料庫,解決了數字貨幣和支付的去中心化;區塊鏈2.0是合約,是一種完全的分散式的智慧合約(Smart Contract)資料庫,解決了各類資產和市場的去中心化;區塊鏈3.0則是超越了貨幣、經濟和市場等的公正應用,是新的高效的活動組織模式和社會治理模式[11]。區塊鏈3.0通過去中心化的社會公共專案,將更深入地影響人們的生活[12],並形成區塊鏈自洽組織(DAO)和區塊鏈自洽公司(DAC),以至區塊鏈大社會[13]。
按照面向的服務群體範圍不同,區塊鏈被分為三類:公有鏈(Public Blockchain)、聯盟鏈(Consortium Blockchain)和私有鏈(Private Blockchain)。公有鏈對任何人都開放,任何人都可自由加入並參與共識過程;聯盟鏈則對特定的組織或團體開放,只有通過聯盟確認後才能加入聯盟鏈。私有鏈僅對特定主體內部開放,參與共識的權力被分配給特定節點[14]。聯盟鏈介於公有鏈與私有鏈之間,本質上仍屬於私有鏈,通常被認為“部分去中心化”,外人可以查閱和交易,但不能驗證交易或釋出智慧合約。比特幣區塊鏈為典型的公有鏈,採用POW共識機制,交易速度較低,而Hyperladger則為典型的聯盟鏈(私有鏈),採用實用拜占庭容錯(PBFT)共識機制,交易速度較高。
依據區塊鏈的分層架構,利用區塊鏈的不同版本和型別,在區塊鏈的應用層可以構建多種應用,而資訊資源共享是重要的應用之一。
2 資訊資源共享的模式
2.1 資訊資源共享的兩種基本模式
依據資訊傳播方式的不同,資訊資源共享有兩種基本模式,即有中心模式和無中心模式,分別如圖4、圖5所示:
 
圖4 有中心模式

 
圖5 無中心模式

有中心模式的典型代表是C/S、B/S應用,其中存在服務方和使用者兩個固定角色。無中心模式的典型代表是各種P2P應用,其中只有平等的參與者。
資訊資源共享的前提是資訊資源聚積,即通過某種方式和手段將資訊資源組織起來。有中心模式下,所有資訊資源均被集中配置到中心,並會聚集形成資訊資源中心;而無中心模式下,所有資訊資源被分散配置到各個節點,因而不會形成資訊資源中心。依據資訊資源聚集過程和組織方式的不同,可以對資訊資源共享模式進行細分。
2.2 有中心模式的細分模式
按照資訊資源聚集過程的不同,資訊資源共享的有中心模式又可細分為兩種:基於雲的資訊資源共享模式和基於Web的資訊資源共享模式,分別如圖6、圖7所示:
 
圖6 基於雲的資訊資源共享模式

 
圖7 基於Web的資訊資源共享模式

基於雲的資訊資源共享模式常用於資訊、情報和知識的共享,資訊聚集一般由雲平臺自動收集完成,且以雲使用者的行為資料、互動資料、資訊和知識為主。基於Web的資訊資源共享模式常用於數字內容的共享,資訊聚集通常由生產者創作並新增到平臺完成。Web1.0、Web2.0均遵循該資源聚集模式。只不過Web2.0通過去掉Web1.0的集中稽核釋出機制,向用戶放開了寫入和釋出許可權,使使用者也成為內容生產者,從而實現了去特權、去精英和以使用者為中心、以人為本[15]。
2.3 無中心模式的細分模式
依據資訊資源組織方式的不同,資訊資源共享的無中心模式又可細分為三種:無中心非結構化P2P模式(純P2P模式)、無中心結構化P2P模式(混合P2P模式)、有中心非結構化P2P模式(集中式P2P模式) [16-18]。無中心非結構化P2P模式,如圖4所示,其中參與者基於洪泛(Flooding)技術以廣播方式查詢或查詢對等網路中共享的資訊資源,特點是資訊無序且分散,內容亦分散。Gnutella網路為該模式的代表。資訊資源共享無中心模式的另兩種細分模式,分別如圖8、圖9所示:

 
圖8 無中心結構化P2P模式

 
圖9 有中心非結構化P2P模式

資訊資源共享的無中心結構化P2P模式中,基於DHT技術建立Chord環、二叉樹等覆蓋網路(Overlay Network),用於查詢或查詢對等網路中共享的資訊資源,參與者之間資訊資源的交換或傳播則不經過覆蓋網路,特點是資訊有序且分散,內容亦分散。Chord網路、Kad網路為該模式的代表。資訊資源共享的有中心非結構化P2P模式中,參與者依賴索引中心查詢或查詢對等網路中共享的資訊資源,參與者之間資訊資源的交換或傳播則不經過索引中心,特點是資訊有序且集中,而內容分散。Napster網路為該模式的代表。
無中心模式的這三種細分模式多用於檔案形式的數字內容共享場合。
3 基於區塊鏈的資訊資源共享模式
區塊鏈被設計運行於無中心非結構化對等網路之上,通常利用檔案來共享資料、資訊和知識等。在區塊鏈基礎上開展資訊資源共享,也須符合底層對等網路上的資訊資源共享模式。基於區塊鏈的資訊資源共享模式是無中心非結構化P2P模式的細分模式、新模式。
3.1 區塊用作資訊資源儲存的方式
 在區塊鏈上實現資訊資源共享所需的資訊資源聚集,首先要解決資訊資源儲存問題。依據資訊資源是否直接儲存於區塊中,可有兩種資訊儲存和聚集方式。資訊資源直接儲存在區塊裡,資訊資源聚集於區塊鏈中,即資訊資源鏈方式,如圖10所示:

 圖10資訊資源鏈方式

該方式與無中心非結構化P2P模式中的儲存方式類似,其中的區塊鏈既用作對等網路中資訊資源的查詢或查詢,同時也用作資訊資源的儲存。該方式的特點是資訊無序且集中,並以完整副本形式儲存在每個節點中。比特幣區塊鏈的區塊中,可用於儲存資訊的欄位極少,包括產量交易(Generation TX)中的輸出的coinbase欄位,以及通用地址交易(Pubkey Hash TX)中的交易輸出地址部分[19]。此二者容量較小,限制很多,且會增加記憶體中未花費交易輸出集(UTXO set)的大小[20]。
 區塊鏈中的區塊裡僅儲存資訊資源的元資料或索引,資訊資源本身儲存於本地、伺服器、雲端儲存或其它儲存中,資訊資源聚集於區塊及區塊鏈之外,即資訊資源索引鏈方式,如圖11所示:

 
圖11資訊資源索引鏈方式

該方式與有中心非結構化P2P模式的儲存方式類似,其中的區塊鏈用作對等網路中資訊資源查詢或查詢,而不參與資訊資源的實際交換和傳播,資訊資源的交換和傳播由底層對等網路的傳輸機制實現,並且可能用到智慧合約來保證資訊共享行為得到可靠執行。該方式的特點是資訊無序且集中,而內容分散儲存在區塊鏈外。區塊鏈的區塊中,利用OP_RETURN元資料,可在比特幣普通交易包含一個OP_RETURN輸出,並在其中存放多達80位元組左右的索引資訊,這些資料雖儲存在區塊中,但並不增加記憶體中未花費交易輸出集的大小[21,22]。
3.2 區塊鏈上的資訊資源共享模式
3.2.1 規模擴張模式
 對等網路基礎上的區塊鏈以區塊的連結串列方式實現了資訊資源聚集,而以區塊鏈的同步副本方式實現了資訊資源共享,其本身兼具資訊資源聚集和共享功能。因此,區塊鏈上資訊資源共享的常見方式是通過區塊鏈網路規模擴張來實現更大範圍的共享,即通過更多的人加入區塊鏈網路成為該網路中的節點和參與者,從而依規則共享區塊鏈上的資訊資源。規模擴張模式如圖12所示:
 
圖12 規模擴張模式

公有鏈、私有鏈和聯盟鏈均可採用該模式進行資訊資源共享,但是對公有鏈上的資訊資源共享更有意義。實際中公有鏈只能通過此模式才能成為有廣泛影響力的公有鏈,且規模越大,影響力和社會價值越高。對於私有鏈和聯盟鏈,此模式使私有鏈和聯盟鏈共享規模擴大,同時也使私有鏈和聯盟鏈分層,逐步形成處於內層的擁有全部功能的核心圈層,以及處於外層的只擁有部分功能的邊緣圈層。
3.2.2 跨鏈模式
 公有鏈、聯盟鏈和私有鏈具有不同程度的封閉性,通常需加入區塊鏈網路才能共享區塊鏈中的資訊資源,另外由於採用不同的共識機制、虛擬貨幣等,不同區塊鏈之間一般互不相容,不能直接聯通。通過雙向楔入(Two-way Peg)等側鏈(Sidechain)技術,使得主鏈與側鏈之間可以相互信任、自動互轉,能將不同區塊鏈聯結起來,從而在不同區塊鏈及其節點之間共享資訊[23]。一條區塊鏈主鏈上可有若干側鏈,而每條側鏈均可對應不同應用。跨鏈模式如圖13所示:

 
圖13 跨鏈模式

 跨鏈模式是公有鏈等擴充套件功能和應用範圍,開展非金融領域應用的主要方式,可極大地促進區塊鏈上的資訊資源共享。實際中該模式已經在區塊鏈擴充套件應用領域中獲得到了廣泛運用,比如基於區塊鏈的存證應用就採用該模式,並且通常選擇比特幣區塊鏈、以太幣區塊鏈等公認的、有廣泛影響力的公有鏈充當主鏈。
3.2.3 混合模式
顯然,還可以將無中心的區塊鏈與有中心的Web相互結合,分別利用區塊鏈的資訊資源集聚功能和Web的資訊資源共享功能,形成資訊資源共享的混合模式。混合模式如圖14所示:

 
圖14 混合模式

混合模式可以對資訊資源的對外共享進行有效控制,將內外很好地隔離開,因而對於私有鏈、聯盟鏈上的資訊資源對外共享意義重大,對於傳統資訊系統的改造也極具現實意義。實際中此模式也常為眾多虛擬貨幣交易網站所採用。
4 區塊鏈資訊資源共享的優缺點
4.1 優點
 從模式的角度來看,基於區塊鏈的資訊資源共享與基於雲和基於Web的資訊資源共享相比,有以下優點:①與基於Web的資訊資源共享不同,基於規模擴張模式和跨鏈模式的區塊鏈資訊資源共享系統無中心,系統中不存在固定的服務中心,每個參與者都平等地分享資訊,平等地獲取資訊,實現了基於資訊分享的資訊共享方式,也為電子商務C2C模式的實現開闢了途徑。②基於規模擴張模式和跨鏈模式的區塊鏈資訊資源共享系統中,資訊分享過程即為資訊聚集過程,資訊分享過程和資訊共享過程完整記錄在交易中,儲存在區塊中的交易公開透明且可信、可追溯,並得益於區塊鏈的匿名特性而不會洩露參與者的私密資訊。相比之下,基於雲的資訊資源共享系統中,聚集所得的大資料是雲使用者的互動資料、行為資料,總涉及使用者私密資訊,因而在相關法律法規約束下,通常大資料只能為雲機構自身內部使用,可公開共享的資料僅為少量統計資料,而在基於Web的資訊資源共享系統中,完整的交易資訊記錄在服務方的伺服器中,使用者和服務方雙方資訊完全不對等,給使用者側的資訊共享管理、統計、核算等造成很大障礙。③基於規模擴張模式和跨鏈模式的區塊鏈資訊資源共享系統無中介,資訊共享無須中介參與,藉助虛擬貨幣和端到端直接交換實現資訊分享和共享過程中的直接價值傳遞,通過利益來驅動和激勵資訊分享行為的發生,而且資訊資源被自動配置到每個完全節點(Full Node)而非特定的固定服務中心,特別有益於資訊資源共建共享系統的建設。④基於規模擴張模式和跨鏈模式的區塊鏈資訊資源共享系統,可以有效抵禦病毒和各種網路攻擊,只要尚有一個完全節點,整個系統的全部資訊就能恢復並重新正常運轉,系統安全性和可靠性極高,明顯優於基於雲或基於Web的資訊資源共享系統,能夠保證資訊資源共享的持久、穩定開展。⑤混合模式的資訊資源共享系統,在資訊聚集和儲存方面不同於傳統資料庫,而是一個分散式的超級賬本或分散式的資料庫,具有基於區塊鏈的典型資訊資源共享系統的優點,而在資訊共享方面則仍保持了基於Web的資訊資源共享系統的優點,新系統兼具這兩類系統的優點。
 基於區塊鏈的資訊資源共享模式及相應系統的這些突出優點,主要源於區塊鏈網路、區塊鏈及其技術的鮮明特徵和優點。
4.2 缺點
 從模式的角度來看,基於區塊鏈的資訊資源共享與基於雲和基於Web的資訊資源共享相比,也有以下缺點:①對於資訊資源鏈方式的區塊鏈資訊資源共享系統,受制於區塊1MB大小限制,區塊中可用的儲存空間有限,不能滿足大粒度資訊的儲存要求,也難以滿足資訊資源共享對儲存空間的多變要求,同時也限制了區塊中可容納的交易數量,對區塊鏈正常執行帶來一定影響。②對於資訊索引鏈方式的區塊鏈資訊資源共享系統,要保證對應的資訊資源能被隨時可靠訪問到,通常需要將資訊資源儲存在雲端儲存或者儲存叢集等安全可靠且持久線上的地方,從而產生對雲端儲存等不同程度的依賴,削弱了整個系統去中心化的實際效果。③由於區塊鏈網路本身執行機制的制約,區塊鏈資訊資源共享系統支援的交易速度相對較低,特別是公有鏈的實際交易速度遠低於當前主流的有中心繫統的實際交易速度,也低於聯盟鏈和私有鏈的實際交易速度,適用於低頻次交易場合。這在大規模的資訊資源共享環境中易形成瓶頸。④由於區塊鏈的不可更改特性,記錄在區塊鏈區塊中的資料、資訊可以檢視,但無法更改,不能刪除,也難以遮蔽,即便資訊被證明是錯誤的和非法的。這給資訊資源的監督和管理帶來了巨大挑戰。
 此外從實現的角度來看,由於與區塊鏈伴生的虛擬貨幣的總數量是有限的,比如比特幣的總量約為2100萬枚,因此利用區塊中的coinbase欄位來儲存資訊時,所能儲存的資訊的總條目數也是有限的,這對面向海量資訊的資訊資源共享系統十分不利。若以某種方式利用交易的輸出部分儲存資訊,所能儲存的資訊的總條目數不受限制,但虛擬貨幣的支付方向和資訊資源的傳遞方向相同,不能很好地支撐資訊資源交易和交換,且該行為還會導致相應資訊的控制權轉移,這也是一大缺陷。
 基於區塊鏈的資訊資源共享模式及相應系統的這些缺點主要源於當前區塊鏈網路、區塊鏈及其技術的制約和不足。要克服這些缺點需對現有的區塊、區塊鏈及其共識機制、執行機制,甚至區塊鏈網路做較大改進。
5 結 語
 區塊鏈不是比特幣。目前區塊鏈主要應用於金融領域,正逐漸向金融領域之外的供應鏈、能源、教育等其它領域迅速擴充套件[24-26],而在資訊資源服務領域中的應用尚處於早期嘗試階段。典型的區塊、區塊鏈、區塊鏈網路是面向虛擬貨幣及金融領域的,在應用到資訊資源服務領域時,則存在一些不適應的地方。要使區塊鏈用於資訊資源儲存和共享,滿足資訊資源儲存和共享的需求,還須對區塊的結構和容量、區塊鏈及其共識機制和執行機制,甚至區塊鏈網路底層傳播機制進行必要改進。同時,區塊鏈及其技術本身仍存在一些關鍵問題需要解決,比如區塊鏈的軟硬分叉問題[27,28]、“不可能三角”問題[29],智慧合約的法律效力問題[30],且未來發展方向還存在某種程度的不確定性[31]。區塊鏈在資訊資源服務領域中的規模化應用尚需時日。在儲存和共享使用者互動資訊方面,基於區塊鏈的資訊資源共享系統將與基於雲的資訊資源共享系統形成競爭,而在儲存和共享內容資源方面,將與基於Web的資訊資源共享系統形成競爭。區塊鏈是實現大資料的另一種途徑。基於區塊鏈的資訊資源共享系統實現了基於分享的共享和對共享共用行為的完整、可信、公開記錄,參與者可隨時檢視、統計、核對互動資訊,解決了資訊資源共享中的資訊不對稱問題。區塊鏈將促使電子商務C2C模式在資訊資源服務領域中興起,對普遍採用B2B或B2G電子商務模式的數字圖書館、商業資料庫的運營會造成一定衝擊。基於區塊鏈的資訊資源共享,在共享內容資源時需藉助雲端儲存等集中儲存方式和設施,因而不能實現徹底去中心化,但仍能達到去中介的目的。區塊鏈將對當前作為中心或中介的文獻和資訊服務機構形成嚴峻挑戰。儘管區塊鏈及其技術還存在一些問題,儘管實現各種模式的區塊鏈資訊資源共享系統仍需克服諸多困難,但是文獻和資訊服務機構應當對區塊鏈及其發展給予足夠重視,持續跟蹤區塊鏈及其技術、產業、應用等的發展動態,並積極行動起來,利用區塊鏈促進自身轉型發展,為資訊資源服務領域可能到來的顛覆性變革做好準備。