用 Go 構建一個區塊鏈 -- Part 2: 工作量證明

阿新 • • 發佈：2019-01-26

翻譯的系列文章我已經放到了 GitHub 上：blockchain-tutorial，後續如有更新都會在 GitHub 上，可能就不在這裡同步了。如果想直接執行程式碼，也可以 clone GitHub 上的教程倉庫，進入 src 目錄執行 make 即可。

在前面一文中，我們構造了一個非常簡單的資料結構，這個資料結構也是整個區塊鏈資料庫的核心。目前所完成的區塊鏈原型，已經可以通過鏈式關係把區塊相互關聯起來：每個塊都被連線到前一個塊。

但是，我們實現的區塊鏈有一個巨大的缺點：向鏈中加入區塊太容易和廉價了。而區塊鏈和比特幣的其中一個核心就是，要想加入新的區塊，必須先完成一些非常困難的工作。在本文，我們將會解決這個缺點。

工作量證明

區塊鏈的一個關鍵點就是，一個人必須經過一系列困難的工作，才能將資料放入到區塊鏈中。正是這種困難的工作，才使得區塊鏈是安全和一致的。此外，完成這個工作的人也會獲得獎勵（這也就是通過挖礦獲得幣）。

這個機制與生活的一個現象非常類似：一個人必須通過努力工作，才能夠獲得回報或者獎勵，用以支撐他們的生活。在區塊鏈中，是通過網路中的參與者（礦工）不斷的工作來支撐整個網路，也就是礦工不斷地向區塊鏈中加入新塊，然後獲得相應的獎勵。作為他們努力工作的結果，新生成的區塊就能夠被安全地被加入到區塊鏈中，這種機制維護了整個區塊鏈資料庫的穩定性。值得注意的是，完成了這個工作的人必須要證明這一點，他必須要證明確實是他完成了這些工作。

整個 “努力工作並進行證明” 的機制，就叫做工作量證明（proof-of-work）。要想完成工作非常地不容易，因為這需要大量的計算能力：即便是高效能運算機，也無法在短時間內快速完成。此外，這個工作的困難度會隨著時間不斷增長，以保持每個小時大概出 6 個新塊的速度。在比特幣中，這個工作的目的是為了找到一個塊的雜湊，同時這個雜湊滿足了一些必要條件。這個雜湊，也就充當了證明的角色。因此，尋求證明（尋找有效雜湊），就是實際要做的事情。

雜湊計算

在本節中，我們會討論雜湊計算。如果你已經熟悉了這個概念，可以跳過這一節。

獲得指定資料的一個雜湊值的過程，就叫做雜湊計算。一個雜湊，就是對所計算資料的一個唯一的表示。一個雜湊函式輸入任意大小的資料，輸出一個固定大小的雜湊值。下面是雜湊的幾個關鍵特性：

無法從一個雜湊值恢復原始資料。也就是說，雜湊並不是加密。
對於特定的資料，只能有一個雜湊，並且這個雜湊是唯一的。
即使是僅僅改變輸入資料中的一個位元組，也會導致輸出一個完全不同的雜湊。

hashing

雜湊函式被廣泛用於檢測資料的一致性。一些軟體提供者除了提供軟體包以外，還會發布校驗和。當下載完一個檔案以後，你可以用雜湊函式對下載好的檔案計算一個雜湊，並與作者提供的雜湊進行比較，以此來保證檔案下載的完整性。

在區塊鏈中，雜湊被用於保證一個塊的一致性。雜湊演算法的輸入資料包含了前一個塊的雜湊，因此使得不太可能（或者，至少很困難）去修改鏈中的一個塊：因為如果一個人想要修改前面一個塊的雜湊，那麼他必須要重新計算這個塊以及後面所有塊的雜湊。

Hashcash

比特幣使用 Hashcash ，一個最初用來防止垃圾郵件的工作量證明演算法。它可以被分解為以下步驟：

取一些公開的資料（比如，如果是 email 的話，它可以是接收者的郵件地址；在比特幣中，它是區塊頭）
給這個公開資料新增一個計數器。計數器預設從 0 開始
將 data(資料) 和 counter(計數器) 組合到一起，獲得一個雜湊
檢查雜湊是否符合一定的條件：
1. 如果符合條件，結束
2. 如果不符合，增加計數器，重複步驟 3-4

因此，這是一個暴力演算法：改變計數器，計算一個新的雜湊，檢查，增加計數器，計算一個雜湊，檢查，如此反覆。這也是為什麼說它是在計算上是非常昂貴的，因為這一步需要如此反覆不斷地計算和檢查。

現在，讓我們來仔細看一下一個雜湊要滿足的必要條件。在原始的 Hashcash 實現中，它的要求是 “一個雜湊的前 20 位必須是 0”。在比特幣中，這個要求會隨著時間而不斷變化。因為按照設計，必須保證每 10 分鐘生成一個塊，而不論計算能力會隨著時間增長，或者是會有越來越多的礦工進入網路，所以需要動態調整這個必要條件。

為了闡釋這一演算法，我從前一個例子（“I like donuts”）中取得資料，並且找到了一個前 3 個位元組是全是 0 的雜湊。

a hash that starts with 3 zero-bytes

ca07ca 是計數器的 16 進位制值，十進位制的話是 13240266.

實現

好了，完成了理論層面，來開始寫程式碼吧！首先，定義挖礦的難度值：

const targetBits = 24

在比特幣中，當一個塊被挖出來以後，“target bits” 代表了區塊頭裡儲存的難度。這裡的 24 指的是算出來的雜湊前 24 位必須是 0，用 16 進製表示化的話，就是前 6 位必須是 0，這一點可以在最後的輸出可以看出來。目前不會實現一個動態調整目標的演算法，所以將難度定義為一個全域性的常量即可。

24 其實是一個可以任意取的數字，目的是要有一個目標（target）而已，這個目標占據不到 256 位的記憶體空間。同時，我們想要有足夠的差異性，但是又不至於大的過分，因為差異性越大，就越難找到一個合適的雜湊。

type ProofOfWork struct {
    block  *Block
    target *big.Int
}

func NewProofOfWork(b *Block) *ProofOfWork {
    target := big.NewInt(1)
    target.Lsh(target, uint(256-targetBits))

    pow := &ProofOfWork{b, target}

    return pow
}

這裡，我們構造了 ProofOfWork 結構，裡面儲存了指向一個塊和一個目標的指標。“目標” ，也就是前一節中所描述的必要條件。這裡使用了一個大整數，我們將雜湊與目標進行比較：先把一個雜湊轉換成一個大整數，然後檢測它是否小於目標。

在 NewProofOfWork 函式中，我們將 big.Int 初始化為 1，然後左移 256 - targetBits 位。256 是一個 SHA-256 雜湊的位數，我們將要使用的是 SHA-256 雜湊演算法。target（目標） 的 16 進位制形式為：

0x10000000000000000000000000000000000000000000000000000000000

它在記憶體上佔據了 29 個位元組。下面是與前面例子雜湊的形式化比較：

0fac49161af82ed938add1d8725835cc123a1a87b1b196488360e58d4bfb51e3
0000010000000000000000000000000000000000000000000000000000000000
0000008b0f41ec78bab747864db66bcb9fb89920ee75f43fdaaeb5544f7f76ca

第一個雜湊（基於 “I like donuts” 計算）比目標要大，因此它並不是一個有效的工作量證明。第二個雜湊（基於 “I like donutsca07ca” 計算）比目標要小，所以是一個有效的證明。

譯者注：評論有人提出上面的形式化比較有些“言不符實”，其實它應該並非由 “I like donuts” 而來，但是原文作者表達的意思是沒問題的，可能是疏忽而已。下面是我做的一個小實驗：

package main

import (
    "crypto/sha256"
    "fmt"
    "math/big"
)

func main() {

    data1 := []byte("I like donuts")
    data2 := []byte("I like donutsca07ca")
    targetBits := 24
    target := big.NewInt(1)
    target.Lsh(target, uint(256-targetBits))
    fmt.Printf("%x\n", sha256.Sum256(data1))
    fmt.Printf("%64x\n", target)
    fmt.Printf("%x\n", sha256.Sum256(data2))

}

輸出：

experiment

你可以把目標想象為一個範圍的上界：如果一個數（由雜湊轉換而來）比上界要小，那麼這是有效的，反之無效。因為要求比上界要小，所以會導致更少的有效數字。因此，也就需要通過困難的工作（一系列反覆的計算），才能找到一個有效的數字。

現在，我們需要有資料來進行雜湊，準備資料：

func (pow *ProofOfWork) prepareData(nonce int) []byte {
    data := bytes.Join(
        [][]byte{
            pow.block.PrevBlockHash,
            pow.block.Data,
            IntToHex(pow.block.Timestamp),
            IntToHex(int64(targetBits)),
            IntToHex(int64(nonce)),
        },
        []byte{},
    )

    return data
}

這個部分比較直觀：只需要將 target ，nonce 與 Block 進行合併。這裡的 nonce ，就是上面 Hashcash 所提到的計數器，它是一個密碼學術語。

很好，到這裡，所有的準備工作就完成了，下面來實現 PoW 演算法的核心：

func (pow *ProofOfWork) Run() (int, []byte) {
    var hashInt big.Int
    var hash [32]byte
    nonce := 0

    fmt.Printf("Mining the block containing \"%s\"\n", pow.block.Data)
    for nonce < maxNonce {
        data := pow.prepareData(nonce)
        hash = sha256.Sum256(data)
        hashInt.SetBytes(hash[:])

        if hashInt.Cmp(pow.target) == -1 {
            fmt.Printf("\r%x", hash)
            break
        } else {
            nonce++
        }
    }
    fmt.Print("\n\n")

    return nonce, hash[:]
}

首先我們對變數進行初始化：

HashInt 是 hash 的整形表示；
nonce 是計數器。

然後開始一個 “無限” 迴圈：maxNonce 對這個迴圈進行了限制, 它等於 math.MaxInt64。這是為了避免 nonce 可能出現的溢位。儘管我們的 PoW 實現的難度太小了，以至於計數器其實不太可能會溢位，但最好還是以防萬一檢查一下。

在這個迴圈中，我們做的事情有：

準備資料
用 SHA-256 對資料進行雜湊
將雜湊轉換成一個大整數
將這個大整數與目標進行比較

跟之前所講的一樣簡單。現在我們可以移除 Block 的 SetHash 方法，然後修改 NewBlock 函式：

func NewBlock(data string, prevBlockHash []byte) *Block {
    block := &Block{time.Now().Unix(), []byte(data), prevBlockHash, []byte{}, 0}
    pow := NewProofOfWork(block)
    nonce, hash := pow.Run()

    block.Hash = hash[:]
    block.Nonce = nonce

    return block
}

在這裡，你可以看到 nonce 被儲存為 Block 的一個屬性。這是十分有必要的，因為待會兒我們需要用 nonce 來對這個工作量進行證明。Block 結構現在看起來像是這樣：

type Block struct {
    Timestamp     int64
    Data          []byte
    PrevBlockHash []byte
    Hash          []byte
    Nonce         int
}

好了！現在讓我們來執行一下是否正常工作：

Mining the block containing "Genesis Block"
00000041662c5fc2883535dc19ba8a33ac993b535da9899e593ff98e1eda56a1

Mining the block containing "Send 1 BTC to Ivan"
00000077a856e697c69833d9effb6bdad54c730a98d674f73c0b30020cc82804

Mining the block containing "Send 2 more BTC to Ivan"
000000b33185e927c9a989cc7d5aaaed739c56dad9fd9361dea558b9bfaf5fbe

Prev. hash:
Data: Genesis Block
Hash: 00000041662c5fc2883535dc19ba8a33ac993b535da9899e593ff98e1eda56a1

Prev. hash: 00000041662c5fc2883535dc19ba8a33ac993b535da9899e593ff98e1eda56a1
Data: Send 1 BTC to Ivan
Hash: 00000077a856e697c69833d9effb6bdad54c730a98d674f73c0b30020cc82804

Prev. hash: 00000077a856e697c69833d9effb6bdad54c730a98d674f73c0b30020cc82804
Data: Send 2 more BTC to Ivan
Hash: 000000b33185e927c9a989cc7d5aaaed739c56dad9fd9361dea558b9bfaf5fbe

成功了！你可以看到每個雜湊都是 3 個位元組的 0 開始，並且獲得這些雜湊需要花費一些時間。

還剩下一件事情需要做，對工作量證明進行驗證：

func (pow *ProofOfWork) Validate() bool {
    var hashInt big.Int

    data := pow.prepareData(pow.block.Nonce)
    hash := sha256.Sum256(data)
    hashInt.SetBytes(hash[:])

    isValid := hashInt.Cmp(pow.target) == -1

    return isValid
}

這裡，就是我們就用到了上面儲存的 nonce。

再來檢測一次是否正常工作：

func main() {
    ...

    for _, block := range bc.blocks {
        ...
        pow := NewProofOfWork(block)
        fmt.Printf("PoW: %s\n", strconv.FormatBool(pow.Validate()))
        fmt.Println()
    }
}

輸出：

...

Prev. hash:
Data: Genesis Block
Hash: 00000093253acb814afb942e652a84a8f245069a67b5eaa709df8ac612075038
PoW: true

Prev. hash: 00000093253acb814afb942e652a84a8f245069a67b5eaa709df8ac612075038
Data: Send 1 BTC to Ivan
Hash: 0000003eeb3743ee42020e4a15262fd110a72823d804ce8e49643b5fd9d1062b
PoW: true

Prev. hash: 0000003eeb3743ee42020e4a15262fd110a72823d804ce8e49643b5fd9d1062b
Data: Send 2 more BTC to Ivan
Hash: 000000e42afddf57a3daa11b43b2e0923f23e894f96d1f24bfd9b8d2d494c57a
PoW: true

從下圖可以看出，這次我們產生三個塊花費了一分多鐘，比沒有工作量證明之前慢了很多（也就是成本高了很多）：

output

總結

我們的區塊鏈離真正的區塊鏈又進了一步：現在需要經過一些困難的工作才能加入新的塊，因此挖礦就有可能了。但是，它還缺少一些至關重要的特性：區塊鏈資料庫並不是持久化的，沒有錢包，地址，交易，也沒有共識機制。不過，所有的這些，我們都會在接下來的文章中實現，現在，愉快地挖礦吧！

連結：

原文：

用 Go 構建一個區塊鏈 -- Part 2: 工作量證明

工作量證明

雜湊計算

Hashcash

實現

總結

用 Go 構建一個區塊鏈 -- Part 2: 工作量證明

[區塊鏈BTC原理]用 Go 構建一個區塊鏈原型

用 Python 擼一個區塊鏈

【譯】用JavaScript寫一個區塊鏈

怎麼用JavaScript寫一個區塊鏈？

怎麽用JavaScript寫一個區塊鏈？

用Go語言打造區塊鏈[1]

go語言實現最小區塊鏈教程2-工作證明機制

如何用Go開發一個區塊鏈專案：ABTC

用 golang 實現區塊鏈系列二 | 工作量證明

區塊鏈：PoW工作量證明演算法

用 Python 構建一個極小的區塊鏈

Go語言實現區塊鏈與加密貨幣(用3臺計算機通過區域網模擬3個節點通訊)

200行go語言程式碼自建一個區塊鏈體驗挖礦樂趣

Go語言實現區塊鏈與加密貨幣(用3臺計算機通過區域網模擬3節點通訊)

200行Go程式碼實現一個區塊鏈之二——區塊生成與網路通訊

教你僅用15分鐘在以太坊編寫一個區塊鏈Web應用

區塊鏈入門(2):搭建以太坊私有鏈(private network of ethereum),以及挖礦的操作..

如何使用GitLab和Rancher構建CI/CD流水線 – Part 2

用python寫一個九九乘法表-2月19日/2018

用 Go 構建一個區塊鏈 -- Part 2: 工作量證明

工作量證明

雜湊計算

Hashcash

實現

總結

相關推薦