1. 程式人生 > >Git內部原理之Git引用

Git內部原理之Git引用

本篇的主題是Git引用的原理。

首先來搞清楚什麼是Git引用,前文講了Git提交物件的雜湊、儲存原理,理論上我們只要知道該物件的hash值,就能往前推出整個提交歷史,例如:

$ git log --pretty=oneline 3ac728ac62f0a7b5ac201fd3ed1f69165df8be31
3ac728ac62f0a7b5ac201fd3ed1f69165df8be31 third commit
d4d2c6cffb408d978cb6f1eb6cfc70e977378a5c second commit
db1d6f137952f2b24e3c85724ebd7528587a067a first commit

現在問題來了,提交物件的這40位hash值不好記憶,Git引用相當於給40位hash值取一個別名,便於識別和讀取。Git引用物件都儲存在.git/refs目錄下,該目錄下有3個子資料夾heads、tags和remotes,分別對應於HEAD引用、標籤引用和遠端引用,下面分別講一講每種引用的原理。

HEAD引用
HEAD引用是用來指向每個分支的最後一次提交物件,這樣切換到一個分支之後,才能知道分支的“尾巴”在哪裡。HEAD引用儲存在.git/refs/heads目錄下,有多少個分支,就有相應的同名HEAD引用物件。例如程式碼庫裡面有master和test兩個分支,那麼.git/refs/heads目錄下就存在master和test兩個檔案,分別記錄了分支的最後一次提交。

HEAD引用的內容就是提交物件的hash值,理論上我們可以手動地構造一個HEAD引用:

$ echo "3ac728ac62f0a7b5ac201fd3ed1f69165df8be31" > .git/refs/heads/master
Git提供了一個專有命令update-ref,用來檢視和修改Git引用物件,當然也包括HEAD引用:


$ git update-ref refs/heads/master 3ac728ac62f0a7b5ac201fd3ed1f69165df8be31
$ git update-ref refs/heads/master
c728ac62f0a7b5ac201fd3ed1f69165df8be31

上面的命令我們將master分支的HEAD指向了3ac728ac62f0a7b5ac201fd3ed1f69165df8be31,現在用git log檢視下master的提交歷史,可以發現最後一次提交就是所更新的hash值:

$ git log --pretty=oneline master
3ac728ac62f0a7b5ac201fd3ed1f69165df8be31 (HEAD -> master) third commit
d4d2c6cffb408d978cb6f1eb6cfc70e977378a5c second commit
db1d6f137952f2b24e3c85724ebd7528587a067a first commit

同理,可以使用同樣的方法更新test分支的HEAD:

$ git update-ref refs/heads/test d4d2c6cffb408d978cb6f1eb6cfc70e977378a5c
$ git log --pretty=oneline test
d4d2c6cffb408d978cb6f1eb6cfc70e977378a5c (test) second commit
db1d6f137952f2b24e3c85724ebd7528587a067a first commit

.git/refs/heads目錄下儲存了每個分支的HEAD,那怎麼知道程式碼庫當前處於哪個分支呢?這就需要一個程式碼庫級別的HEAD引用。.git/HEAD這個檔案就是整個程式碼庫級別的HEAD引用。我們先檢視一下.git/HEAD檔案的內容:

$ cat .git/HEAD
ref: refs/heads/master

我們發現.git/HEAD檔案的內容不是40位hash值,而像是指向.git/refs/heads/master。嘗試切換到test:

$ git checkout test
$ cat .git/HEAD
ref: refs/heads/test

切換分支後,.git/HEAD檔案的內容也跟著指向.git/refs/heads/test。.git/HEAD也是HEAD引用物件,與一般引用不同的是,它是“符號引用”。符號引用類似於檔案的快捷方式,連結到要引用的物件上。

Git提供專門的命令git symbolic-ref,用來檢視和更新符號引用:

$ git symbolic-ref HEAD refs/heads/master
$ git symbolic-ref HEAD refs/heads/test

至此,我們分析了兩種HEAD引用,一種是分支級別的HEAD引用,用來記錄各分支的最後一次提交,儲存在.git/refs/heads目錄下,使用git update-ref來維護;一種是程式碼庫級別的HEAD引用,用來記錄程式碼庫所處的分支,儲存在.git/HEAD檔案,使用git symbolic-ref來維護。

標籤引用
標籤引用,顧名思義就是給Git物件打標籤,便於記憶。例如,我們可以將某個提交物件打v1.0標籤,表示是1.0版本。標籤引用都儲存在.git/refs/tags裡面。

標籤引用和HEAD引用本質是Git引用物件,同樣使用git update-ref來檢視和修改:


$ git update-ref refs/tags/v1.0 d4d2c6cffb408d978cb6f1eb6cfc70e977378a5c
$ cat .git/refs/tags/v1.0
d4d2c6cffb408d978cb6f1eb6cfc70e977378a5c

還有一種標籤引用稱為“附註引用”,可以為標籤新增說明資訊。上面的標籤引用打了一個v1.0的標籤表示釋出1.0版本,有時候釋出軟體的時候除了版本號資訊,還要寫更新說明。附註引用就是用來實現打標籤的同時,也可以附帶說明資訊。

附註引用是怎麼實現的呢?與常規標籤引用不同的是,它不直接指向提交物件,而是新建一個Git物件儲存到.git/objects中,用來記錄附註資訊,然後附註標籤指向這個Git物件。

使用git tag建立一個附註標籤:

$ git tag -a v1.1 3ac728ac62f0a7b5ac201fd3ed1f69165df8be31 -m "test tag"
$ cat .git/refs/tags/v1.1
8be4d8e4e8e80711dd7bae304ccfa63b35a6eb8c

使用git cat-file來檢視附註標籤所指向的Git物件:

$ git cat-file -p 8be4d8e4e8e80711dd7bae304ccfa63b35a6eb8c
object 3ac728ac62f0a7b5ac201fd3ed1f69165df8be31
type commit
tag v1.1
tagger jingsam <[email protected]> 1529481368 +0800

test tag

可以看到,上面的Git物件儲存了我們填寫的附註資訊。

總之,普通的標籤引用和附註引用同樣都是儲存的是40位hash值,指向一個Git物件,所不同的是普通的標籤引用是直接指向提交物件,而附註標籤是指向一個附註物件,附註物件再指向具體的提交物件。

另外,本質上標籤引用並不是只可以指向提交物件,實際上可以指向任何Git物件,即可以給任何Git物件打標籤。

遠端引用
遠端引用,類似於.git/refs/heads中儲存的本地倉庫各分支的最後一次提交,在.git/refs/remotes是用來記錄多個遠端倉庫各分支的最後一次提交。

我們可以使用git remote來管理遠端分支:

$ git remote add origin [email protected]:jingsam/git-test.git
上面添加了一個origin遠端分支,接下來我們把本地倉庫的master推送到遠端倉庫上:

$ git push origin master
Counting objects: 9, done.
Delta compression using up to 4 threads.
Compressing objects: 100% (5/5), done.
Writing objects: 100% (9/9), 720 bytes | 360.00 KiB/s, done.
Total 9 (delta 0), reused 0 (delta 0)
To github.com:jingsam/git-test.git

  • [new branch] master -> master
    這時候在.git/refs/remotes中的遠端引用就會更新:
$ cat .git/refs/remotes/origin/master
3ac728ac62f0a7b5ac201fd3ed1f69165df8be31

和本地倉庫的master比較一下,發現是一模一樣的,表示遠端分支和本地分支是同步的:

$ cat .git/refs/heads/master
3ac728ac62f0a7b5ac201fd3ed1f69165df8be31

由於遠端引用也是Git引用物件,所以理論上也可以使用git update-ref來手動維護。但是,我們需要先把程式碼與遠端倉庫進行同步,在遠端倉庫中找到對應分支的HEAD,然後使用git update-ref進行更新,過程比較麻煩。而我們在執行git pull或git push這樣的高層命令的時候,遠端引用會自動更新。

總結
到這裡,三種Git引用都已分析完畢。總的來說,三種Git引用都統一儲存到.git/refs目錄下,Git引用中的內容都是40位的hash值,指向某個Git物件,這個物件可以是任意的Git物件,可以是資料物件、樹物件、提交物件。三種Git引用都可以使用git update-ref來手動維護。

三種Git引用物件所不同的是,分別儲存於.git/refs/heads、.git/refs/tags、.git/refs/remotes,儲存的資料夾不同,賦予了引用物件不同的功能。HEAD引用用來記錄本地分支的最後一次提交,標籤引用用來給任意Git物件打標籤,遠端引用正式用來記錄遠端分支的最後一次提交。