1. 程式人生 > >深入瞭解區塊鏈之五:比特幣網路

深入瞭解區塊鏈之五:比特幣網路

 P2P網路架構

比特幣採用了基於國際網際網路(Internet)的P2P(peer-to-peer)網路架構。P2P是指位於同一網路中的每臺計算機都彼此對等,各個節點共同提供網路服務,不存在任何“特殊”節點。每個網路節點以“扁平(flat)”的拓撲結構相互連通。在P2P網路中不存在任何服務端(server)、中央化的服務、以及層級結構。P2P網路的節點之間互動運作、協同處理:每個節點在對外提供服務的同時也使用網路中其他節點所提供的服務。

    P2P網路也因此具有可靠性、去中心化,以及開放性。

    早期的國際網際網路就是P2P網路架構的一個典型用例:IP網路中的各個節點完全平等。當今的網際網路架構具有分層架構,但是IP協議仍然保留了扁平拓撲的結構。在比特幣之外,規模最大也最成功的P2P技術應用是在檔案分享領域:Napster是該領域的先鋒,BitTorrent是其架構的最新演變。

    比特幣所採用的P2P網路架構不僅僅是選擇拓撲結構這樣簡單。比特幣被設計為一種點對點的數字現金系統,它的網路架構既是這種核心特性的反映,也是該特性的基石。去中心化控制是設計時的核心原則,它只能通過維持一種扁平化、去中心化的P2P共識網路來實現。

    “比特幣網路”是按照比特幣P2P協議執行的一系列節點的集合。除了比特幣P2P協議之外,比特幣網路中也包含其他協議。例如Stratum協議就被應用於挖礦、以及輕量級或移動端比特幣錢包之中。閘道器(gateway)路由伺服器提供這些協議,使用比特幣P2P協議接入比特幣網路,並把網路拓展到執行其他協議的各個節點。例如,Stratum伺服器通過Stratum協議將所有的Stratum挖礦節點連線至比特幣主網路、並將Stratum協議橋接(bridge)至比特幣P2P協議之上。我們使用“擴充套件比特幣網路(extended bitcoin network)”指代所有包含比特幣P2P協議、礦池挖礦協議、Stratum協議以及其他連線比特幣系統元件相關協議的整體網路結構。

6.2 節點型別及分工

儘管比特幣P2P網路中的各個節點相互對等,但是根據所提供的功能不同,各節點可能具有不同的分工。每個比特幣節點都是路由區塊鏈資料庫挖礦錢包服務的功能集合。一個全節點(full node)包括如圖6-1所示的四個功能:

0?wx_fmt=png
圖6-1 一個包含四個完整功能的比特幣網路節點:錢包、礦工、完整區塊鏈、網路路由節點 

        每個節點都參與全網路的路由功能,同時也可能包含其他功能。每個節點都參與驗證並傳播交易及區塊資訊,發現並維持與對等節點的連線。在圖6-1所示的全節點用例中,名為“網路路由節點”的橙色圓圈即表示該路由功能。

    一些節點保有一份完整的、最新的區塊鏈拷貝,這樣的節點被稱為“全節點”

。全節點能夠獨立自主地校驗所有交易,而不需藉由任何外部參照。另外還有一些節點只保留了區塊鏈的一部分,它們通過一種名為“簡易支付驗證(SPV)”的方式來完成交易驗證。這樣的節點被稱為“SPV節點”,又叫“輕量級節點”。在如上圖所示的全節點用例中,名為完整區塊鏈的藍色圓圈即表示了全節點區塊鏈資料庫功能。在圖6-3中,SPV節點沒有此藍色圓圈,以示它們沒有區塊鏈的完整拷貝。

    挖礦節點通過執行在特殊硬體裝置上的工作量證明(proof-of-work)演算法,以相互競爭的方式建立新的區塊。一些挖礦節點同時也是全節點,保有區塊鏈的完整拷貝;還有一些參與礦池挖礦的節點是輕量級節點,它們必須依賴礦池伺服器維護的全節點進行工作。在全節點用例中,挖礦功能如圖中名為“礦工”的黑色圓圈所示。

    使用者錢包也可以作為全節點的一部分,這在桌面比特幣客戶端中比較常見。當前,越來越多的使用者錢包都是SPV節點,尤其是運行於諸如智慧手機等資源受限裝置上的比特幣錢包應用;而這正變得越來越普遍。在圖6-1中,名為“錢包”的綠色圓圈代表錢包功能。

在比特幣P2P協議中,除了這些主要的節點型別之外,還有一些伺服器及節點也在執行著其他協議,例如特殊礦池挖礦協議、輕量級客戶端訪問協議等。

圖6-2描述了擴充套件比特幣網路中最為常見的節點型別。

0?wx_fmt=png
圖6-2 擴充套件比特幣網路的不同節點型別

6.3 擴充套件比特幣網路

        執行比特幣P2P協議的比特幣主網路由大約7000-10000個執行著不同版本比特幣核心客戶端(Bitcoin Core)的監聽節點、以及幾百個執行著各類比特幣P2P協議的應用(例如BitcoinJ、Libbitcoin、btcd等)的節點組成。比特幣P2P網路中的一小部分節點也是挖礦節點,它們競爭挖礦、驗證交易、並建立新的區塊。許多連線到比特幣網路的大型公司執行著基於Bitcoin核心客戶端的全節點客戶端,它們具有區塊鏈的完整拷貝及網路節點,但不具備挖礦及錢包功能。這些節點是網路中的邊緣路由器(edge routers),通過它們可以搭建其他服務,例如交易所、錢包、區塊瀏覽器、商家支付處理(merchant payment processing)等。

        如前文所述,擴充套件比特幣網路既包括了執行比特幣P2P協議的網路,又包含執行特殊協議的網路節點。比特幣P2P主網路上連線著許多礦池伺服器以及協議閘道器,它們把執行其他協議的節點連線起來。這些節點通常都是礦池挖礦節點(參見第8章)以及輕量級錢包客戶端,它們通常不具備區塊鏈的完整備份。

圖6-3描述了擴充套件比特幣網路,它包括了多種型別的節點、閘道器伺服器、邊緣路由器、錢包客戶端以及它們相互連線所需的各類協議。

0?wx_fmt=png
圖6-3 具有多種節點型別、閘道器及協議的擴充套件比特幣網路

6.4 網路發現

    當新的網路節點啟動後,為了能夠參與協同運作,它必須發現網路中的其他比特幣節點。新的網路節點必須發現至少一個網路中存在的節點並建立連線。由於比特幣網路的拓撲結構並不基於節點間的地理位置,因此各個節點之間的地理資訊完全無關。在新節點連線時,可以隨機選擇網路中存在的比特幣節點與之相連。

    節點通常採用TCP協議、使用8333埠(該埠號通常是比特幣所使用的,除8333埠外也可以指定使用其他埠)與已知的對等節點建立連線。在建立連線時,該節點會通過傳送一條包含基本認證內容的version訊息開始“握手”通訊過程(見圖6-4)。這一過程包括如下內容:

    網路中的對等節點通過對verack訊息的響應進行確認並建立連線;有時候,如果接收節點需要互換連線並連回起始節點,也會傳回該對等節點的version訊息。

    新節點是如何發現網路中的對等節點的呢?雖然比特幣網路中沒有特殊節點,但是客戶端會維持一個列表,那裡列出了那些長期穩定執行的節點。這樣的節點被稱為“種子節點(seed nodes)”。新節點並不一定需要與種子節點建立連線,但連線到種子節點的好處是可以通過種子節點來快速發現網路中的其他節點。在比特幣核心客戶端中,是否使用種子節點是通過“-dnsseed”控制的。

0?wx_fmt=png
圖6-4 對等節點之間的初始“握手”通訊

    當建立一個或多個連線後,新節點將一條包含自身IP地址的addr訊息傳送給其相鄰節點。相鄰節點再將此條addr訊息依次轉發給它們各自的相鄰節點,從而保證新節點資訊被多個節點所接收、保證連線更穩定。另外,新接入的節點可以向它的相鄰節點發送getaddr訊息,要求它們返回其已知對等節點的IP地址列表。通過這種方式,節點可以找到需連線到的對等節點,並向網路釋出它的訊息以便其他節點查詢。圖6-5描述了這種地址發現協議。

0?wx_fmt=png
圖6-5 地址廣播及發現

        節點必須連線到若干不同的對等節點才能在比特幣網路中建立通向比特幣網路的種類各異的路徑(path)。由於節點可以隨時加入和離開,通訊路徑是不可靠的。因此,節點必須持續進行兩項工作:在失去已有連線時發現新節點,並在其他節點啟動時為其提供幫助。節點啟動時只需要一個連線,因為第一個節點可以將它引薦給它的對等節點,而這些節點又會進一步提供引薦。一個節點,如果連線到大量的其他對等節點,這既沒必要,也是對網路資源的浪費。在啟動完成後,節點會記住它最近成功連線的對等節點;因此,當重新啟動後它可以迅速與先前的對等節點網路重新建立連線。如果先前的網路的對等節點對連線請求無應答,該節點可以使用種子節點進行重啟動。

        如果已建立的連線沒有資料通訊,所在的節點會定期傳送資訊以維持連線。如果節點持續某個連線長達90分鐘沒有任何通訊,它會被認為已經從網路中斷開,網路將開始查詢一個新的對等節點。因此,比特幣網路會隨時根據變化的節點及網路問題進行動態調整,不需經過中心化的控制即可進行規模增、減的有機調整。

6.5 全節點

        全節點是指維持包含全部交易資訊的完整區塊鏈的節點。更加準確地說,這樣的節點應當被稱為完整區塊鏈節點”。在比特幣發展的早期,所有節點都是全節點;當前的比特幣核心客戶端也是完整區塊鏈節點。但在過去的兩年中出現了許多新型客戶端,它們不需要維持完整的區塊鏈,而是作為輕量級客戶端執行。在下面的章節裡我們會對這些輕量級客戶端進行詳細介紹。

        完整區塊鏈節點保有完整的、最新的包含全部交易資訊的比特幣區塊鏈拷貝,這樣的節點可以獨立地進行建立並校驗區塊鏈,從第一區塊(創世區塊)一直建立到網路中最新的區塊。完整區塊鏈節點可以獨立自主地校驗任何交易資訊,而不需要藉助任何其他節點或其他資訊來源。完整區塊節點通過比特幣網路獲取包含交易資訊的新區塊更新,在驗證無誤後將此更新合併至本地的區塊鏈拷貝之中。

        執行完整區塊鏈節點可以給您一種純粹的比特幣體驗:不需藉助或信任其他系統即可獨立地對所有交易資訊進行驗證。辨別您是否在執行全節點是十分容易的:只需要檢視您的永久性儲存裝置(如硬碟)是否有超過20GB的空間被用來儲存完整區塊鏈即可。如果您需要很大的磁碟空間、並且同步比特幣網路耗時2至3天,那麼您使用的正是全節點。這就是擺脫中心化管理、獲得完全的獨立自由所要付出的代價。

        儘管目前還有一些使用不同程式語言及軟體架構的其他的完整區塊鏈客戶端存在,但是最常用的仍然是比特幣核心客戶端,它也被稱為“Satoshi客戶端”。比特幣網路中超過90%的節點執行著各個版本的比特幣核心客戶端。如前文所述,它可以通過節點間傳送的version訊息或通過getpeerinfo命令所得到的子版本字串“Satoshi”加以辨識,例如 /Satoshi: 0.8.6/。

6.6 交換“庫存清單”

一個全節點連線到對等節點之後,第一件要做的事情就是構建完整的區塊鏈。如果該節點是一個全新節點,那麼它就不包含任何區塊鏈資訊,它只知道一個區塊——靜態植入在客戶端軟體中的創世區塊。新節點需要下載從0號區塊(創世區塊)開始的數十萬區塊的全部內容,才能跟網路同步、並重建全區塊鏈。

同步區塊鏈的過程從傳送version訊息開始,這是因為該訊息中含有的BestHeight欄位標示了一個節點當前的區塊鏈高度(區塊數量)。節點可以從它的對等節點中得到版本訊息,瞭解雙方各自有多少區塊,從而可以與其自身區塊鏈所擁有的區塊數量進行比較。對等節點們會交換一個getblocks訊息,其中包含他們本地區塊鏈的頂端區塊雜湊值。如果某個對等節點識別出它接收到的雜湊值並不屬於頂端區塊,而是屬於一個非頂端區塊的舊區塊,那麼它就能推斷出:其自身的本地區塊鏈比其他對等節點的區塊鏈更長。

擁有更長區塊鏈的對等節點比其他節點有更多的區塊,可以識別出哪些區塊們是其他節點需要“補充”的。它會識別出第一批可供分享的500個區塊,通過使用inv(inventory)訊息把這些區塊的雜湊值傳播出去。缺少這些區塊的節點便可以通過各自發送的getdata訊息來請求得到全區塊資訊,用包含在inv訊息中的雜湊值來確認是否為正確的被請求的區塊,從而讀取這些缺失的區塊。

        每當一個節點離線,不管離線時間有多長,這個與對等節點比較本地區塊鏈並恢復缺失區塊的過程就會被觸發。如果一個節點只離線幾分鐘,可能只會缺失幾個區塊;當它離線長達一個月,可能會缺失上千個區塊。但無論哪種情況,它都會從傳送getblocks訊息開始,收到一個inv響應,接著開始下載缺失的區塊庫存清單和區塊廣播協議如圖6-6所示。

0?wx_fmt=png
圖6-6 節點通過從對等節點讀取區塊來同步區塊鏈

6.7 簡易支付驗證 (SPV)節點

        並非所有的節點都有能力儲存完整的區塊鏈。許多比特幣客戶端被設計成執行在空間和功率受限的裝置上,如智慧電話、平板電腦、嵌入式系統等。對於這樣的裝置,通過簡化的支付驗證(SPV)的方式可以使它們在不必儲存完整區塊鏈的情況下進行工作。這種型別的客端被稱為SPV客戶端或輕量級客戶端。隨著比特幣的使用熱潮,SPV節點逐漸變成比特幣節點(尤其是比特幣錢包)所採用的最常見的形式。

SPV節點只需下載區塊頭,而不用下載包含在每個區塊中的交易資訊。由此產生的不含交易資訊的區塊鏈,大小隻有完整區塊鏈的1/1000。SPV節點不能構建所有可用於消費的UTXO的全貌,這是由於它們並不知道網路上所有交易的完整資訊。SPV節點驗證交易時所使用的方法略有不同,這個方法需依賴對等節點“按需”提供區塊鏈相關部分的區域性檢視。

打個比方來說,每個全節點就像是一個在陌生城市裡的遊客,他帶著一張包含每條街道、每個地址的詳細地圖。相比之下,SPV節點就像是這名陌生城市裡的遊客只知道一條主幹道的名字,通過隨機詢問該城市的陌生人來獲取分段道路指示。雖然兩種遊客都可以通過實地考察來驗證一條街是否存在,但沒有地圖的遊客不知道每個小巷中有哪些街道,也不知道附近還有什麼其他街道。沒有地圖的遊客在“教堂街23號”的前面,並不知道這個城市裡是否還有其他若干條“教堂街23號”,也不知道面前的這個是否是要找的那個。對他來說,最好的方式就是向足夠多的人問路,並且希望其中一部分人不是要試圖搶劫他。

簡易支付驗證是通過參考交易在區塊鏈中的深度,而不是高度,來驗證它們。一個擁有完整區塊鏈的節點會構造一條驗證鏈,這條鏈是由沿著區塊鏈按時間倒序一直追溯到創世區塊的數千區塊及交易組成。而一個SPV節點會驗證所有區塊的鏈(但不是所有的交易),並且把區塊鏈和有關交易連結起來。

在絕大多數的實際情況中,具有良好連線的SPV節點是足夠安全的,它在資源需求、實用性和安全性之間維持恰當的平衡。當然,如果要保證萬無一失的安全性,最可靠的方法還是執行完整區塊鏈的節點。

0?wx_fmt=png
完整的區塊鏈節點是通過檢查整個鏈中在它之下的數千個區塊來保證這個UTXO沒有被支付,從而驗證交易。而SPV節點是通過檢查在其上面的區塊將它壓在下面的深度來驗證交易。

        SPV節點使用的是一條getheaders訊息,而不是getblocks訊息來獲得區塊頭。發出響應的對等節點將用一條headers訊息傳送多達2000個區塊頭。這一過程和全節點獲取所有區塊的過程沒什麼區別。SPV節點還在與對等節點的連線上設定了過濾器,用以過濾從對等節點發來的未來區塊和交易資料流。任何目標交易都是通過一條getdata的請求來讀取的。對等節點生成一條包含交易資訊的tx訊息作為響應。區塊頭的同步過程如圖6-7所示。

0?wx_fmt=png
圖6-7 SPV節點同步區塊頭

由於SPV節點需要讀取特定交易從而選擇性地驗證交易,這樣就又產生了隱私風險。與全區塊鏈節點收集每一個區塊內的全部交易所不同的是,SPV節點對特定資料的請求可能無意中透露了錢包裡的地址資訊。例如,監控網路的第三方可以跟蹤某個SPV節點上的錢包所請求的全部交易資訊,並且利用這些交易資訊把比特幣地址和錢包的使用者關聯起來,從而損害了使用者的隱私。

在引入SPV節點/輕量級節點後不久,比特幣開發人員就添加了一個新功能:Bloom過濾器,用以解決SPV節點的隱私風險問題。Bloom過濾器通過一個採用概率而不是固定模式的過濾機制,允許SPV節點只接收交易資訊的子集,同時不會精確洩露哪些是它們感興趣的地址。

6.8 Bloom過濾器

        Bloom過濾器是一個允許使用者描述特定的關鍵詞組合而不必精確表述的基於概率的過濾方法。它能讓使用者在有效搜尋關鍵詞的同時保護他們的隱私。在SPV節點裡,這一方法被用來向對等節點發送交易資訊查詢請求,同時交易地址不會被暴露。

        用我們之前的例子,一位手中沒有地圖的遊客需要詢問去特定地方的路線。如果他向陌生人詢問“教堂街23號在哪裡”,不經意之間,他就暴露了自己的目的地。Bloom過濾器則會這樣問,附近有帶‘堂’字的街道嗎?”這樣的問法包含了比之前略少的關鍵詞。這位遊客可以自己選擇包含資訊的多少,比如“以‘堂街’結尾”或者“‘教’字開頭的街道”。如果他問得越少,得到了更多可能的地址,隱私得到了保護,但這些地址裡面不乏無關的結果;如果他問得非常具體,他在得到較準確的結果的同時也暴露了自己的隱私。

Bloom過濾器可以讓SPV節點指定交易的搜尋模式,該搜尋模式可以基於準確性或私密性的考慮被調節。一個非常具體的Bloom過濾器會生成更準確的結果,但也會顯示該使用者錢包裡的使用的地址;反之,如果過濾器只包含簡單的關鍵詞,更多相應的交易會被搜尋出來,在包含若干無關交易的同時有著更高的私密性。

6.9 Bloom過濾器和存貨更新

Bloom過濾器被用來過濾SPV節點從對等節點裡收到的交易資訊。SPV會建立一個只能和SPV節點錢包裡的地址匹配的過濾器。隨後,SPV節點會向對等節點發送一條包含需在該連線中使用的過濾器的filterload訊息。當過濾器建好之後,對等節點將每個交易的輸出值代入過濾器中驗證。那些匹配的交易會被傳送回SPV節點。

為迴應來自SPV節點的getdata資訊,對等節點會發出一條只含有和過濾器匹配的區塊的區塊頭資訊,以及與之相匹配的交易的merkle樹。這一對等節點還會發出一條相匹配的交易的tx訊息。

這個節點能夠通過傳送一條filteradd資訊來向它的Bloom過濾器增加關鍵詞,也能夠傳送filterclear資訊來清除整個過濾器。因為不能直接從過濾器裡刪除關鍵詞,所以如果某關鍵詞不再需要,節點必須通過清除和增加來替換原有的過濾器。

6.10 交易池

比特幣網路中幾乎每個節點都會維護一份確認交易的臨時列表,被稱為記憶體池或交易池。節點們利用這個池來追蹤記錄那些被網路所知曉、但還未被區塊鏈所包含的交易。例如,儲存使用者錢包的節點會利用這個交易池來記錄那些網路已經接收但還未被確認的、屬於該使用者錢包的預支付資訊。

隨著交易被接收和驗證,它們被新增到交易池並通知到相鄰節點處,從而傳播到網路中。

有些節點的實現還維護一個單獨的孤立交易池。如果一個交易的輸入與某未知的交易有關,如與缺失的父交易相關,該孤立交易就會被暫時儲存在孤立交易池中直到父交易的資訊到達。

當一個交易被新增到交易池中,會同時檢查孤立交易池,看是否有某個孤立交易引用了此交易的輸出(子交易)。任何匹配的孤立交易會被進行驗證。如果驗證有效,它們會從孤立交易池中刪除,並新增到交易池中,使以其父交易開始的鏈變得完整。

交易池和孤立交易池(如有實施)都是儲存在本地記憶體中,並不是儲存在永久性儲存裝置(如硬碟)裡。更準確的說,它們是隨網路傳入的訊息動態填充的。節點啟動時,兩個池都是空閒的;隨著網路中新交易不斷被接收,兩個池逐漸被填充。

有些比特幣客戶端的實現還維護一個UTXO資料庫,也稱UTXO池,是區塊鏈中所有未支付交易輸出的集合。“UTXO池”的名字聽上去與交易池相似,但它代表了不同的資料集。UTXO池不同於交易池和孤立交易池的地方在於,它在初始化時不為空,而是包含了數以百萬計的未支付交易輸出條目,有些條目的歷史甚至可以追溯至2009年。UTXO池可能會被安置在本地記憶體,或者作為一個包含索引的資料庫表安置在永久性儲存裝置中。

交易池和孤立交易池代表的是單個節點的本地視角。取決於節點的啟動時間或重啟時間,不同節點的兩池內容可能有很大差別。相反地,UTXO池代表的是網路的突顯共識,因此,不同節點間UTXO池的內容差別不大。此外,交易池和孤立交易池只包含未確認交易,而UTXO池之只包含已確認交易。

6.11 警告訊息

警告訊息並不經常使用,但在大多數節點上都有此功能。警告訊息是比特幣的“緊急廣播系統”,比特幣核心開發人員可以藉此功能給所有比特幣節點發送緊急文字訊息。這一功能是為了讓核心開發團隊將比特幣網路的嚴重問題通知所有的比特幣使用者,例如一個需要使用者採取措施的的嚴重bug。警告系統迄今為止只被用過幾次,最嚴重的一次是在2013年,一個關鍵的資料庫缺陷導致比特幣區塊鏈中出現了一個多區塊分叉。

警告訊息是通過alert訊息來傳播的。

每天五分鐘, 玩轉區塊鏈:

0?wx_fmt=jpeg