LLVM Essentials-Packt 2016（讀書筆記）：TableGen講解並不透徹，另外我還想知道後端優化步演算法到底怎麼編寫？

阿新 • • 發佈：2019-02-20

Playing with LLVM[編輯]

暫存器變數（%var）、棧變數（alloca，%1 ...）、
.c-->.bc：$ clang -emit-llvm -c main.c
.bc-->.s：$ llc output.bc –o output.s
.ll-->.bc：$ llvm-as add.ll –o add.bc
opt
-analyze選項：basicaa、da、instcount、loops、scalar evolution

Building LLVM IR[編輯]

static LLVMContext &Context = getGlobalContext();
static Module *ModuleOb = new Module("my compiler", Context);

FunctionType *funcType = llvm::FunctionType::get(Builder.getInt32Ty(), false); //注意這裡type被簡寫為Ty了
Function *fooFunc = llvm::Function::Create(funcType, llvm::Function::ExternalLinkage, Name, ModuleOb);

這裡的‘外部連結’實際上是指匯出符號；

BasicBlock* bb = BasicBlock::Create(Context, Name, fooFunc);

全域性變數：

ModuleOb->getOrInsertGlobal(Name, Builder.getInt32Ty());
GlobalVariable *gVar = ModuleOb->getNamedGlobal(Name); ...
//得到：
@x = common global i32, align 4

插入返回值語句：

Builder.SetInsertPoint(entry); //注意，SetInsertPoint API顯然是有狀態的；
Builder.CreateRet(Builder.getInt32(0));

設定函式引數：略

分支語句：需要phi merge節點

PHINode *Phi = Builder.CreatePHI(Type::getInt32Ty(getGlobalContext()), PhiBBSize, "iftmp");
Phi->addIncoming(ThenVal, ThenBB);
Phi->addIncoming(ElseVal, ElseBB); //注意這裡由於SSA，bb本身就是value；

迴圈：略

...
Builder.CreateCondBr(EndCond, LoopBB, AfterBB);
...

高階IR[編輯]

getelementptr：offset支援負值嗎？
load
store
insertelement（其實不就是給陣列元素賦值嗎？）
extractelement
%0 = extractelement <4 x i32> %a, i32 0 //注意這裡陣列型別的寫法，型別寫在變數的前面

基本IR變換[編輯]

runOn{Passtype}: Module、Function、BasicBlock、Loop
getAnalysisUsage：指定pass之間的依賴關係
1. AU.addRequired<AliasAnalysis>(); //注意這裡使用了成員函式模板
2. addRequiredTransitive
3. addPreserved
指令簡化
1. if (match(Op0, m_Not(m_Specific(Op1))) || match(Op1, m_Not(m_Specific(Op0)))) //注意這裡的匹配模板寫法
2. instcombine：化簡成等價且更少的指令

高階IR塊變換[編輯]

Loop processing
1. CFG：dominate關係
2. 迴圈規範化：增加preheader、exit block，只允許一個backedge等等
3. LoopPass基類、LPPassManager（llvm的類方法命名總是喜歡突然來個縮寫，fuck）
4. LICM（迴圈不變式外提）
5. 更多的迴圈優化：lib/Transforms/Scalar
Scalar evolution（更高階的“抽象解釋”？）
1. $ opt -analyze -scalar-evolution scalevl.ll
LLVM intrinsics（編譯器內建函式）
1. call void @llvm.memset.p0i8.i64(i8* %a2, i8 0, i64 20, i32 16, i1 false) //這讓人感覺所謂的LLVM編譯器其實只是直譯器？（runtime函式）
2. %1 = getelementptr inbounds [5 x i32], [5 x i32]* %a, i64 0, i64 0
Vectorization（不是特別的清楚，“Loop-Aware SLP in GCC”by Ira Rosen, etc？）
1. 2種類型：SLP、Loop vectorization
2. SIMD
3. $ opt -S -basicaa -slp-vectorizer -mtriple=aarch64-unknown-linuxgnu -mcpu=cortex-a57 addsub.ll –debug

IR到Selection DAG階段[編輯]

SelectionDAGBuilder：以%add = add nsw i32 %a, %b為例
1. SelectionDAGBuilder::visit
2. visitAdd
  visitBinary SDValue?
Legalizing SelectionDAG（合法化，目標平臺適配）
1. 例：X86上sdiv擴充套件到sdivrem
Optimizing SelectionDAG
1. DAGCombiner
2. AArch64DAGToDAGISel::Select
Instruction Selection（注意，指令型別平臺已經支援了，但是暫存器什麼的還沒分配呢）
1. X86DAGToDAGISel::SelectCode() TableGen自動生成（llvm很難理解的地方就是TableGen的語法）
Scheduling and emitting machine instructions
1. InstrEmitter::EmitMachineNode：SDNode ==> MachineInstr（MachineBasicBlock）
2. MachineInstrBuilder
  1. CreateVirtualRegisters（這裡還是‘虛擬暫存器’？）
  2. virtual AdjustInstrPostInstrSelection
Register allocation
1. spilling
2. SSA form deconstruction（phi到reg copy）
3. 對映虛擬暫存器到物理暫存器：2種方法
  1. 直接對映：TargetRegisterInfo/MachineOperand（程式設計師自己實現？）
  2. 間接：VirtRegMap::assignVirt2Phys（llvm內建的？）
4. llvm 4種分配技術：
  1. Basic
  2. Fast
  3. PBQP
  4. Greedy
Code Emission：LLVM JIT和MC（生成obj格式的檔案）
1. AsmPrinter：使用平臺特定的MCInstLowering介面如X86MCInstLower
2. MCInst指令傳遞給MCStreamer物件
3. 注意，the MC Layer is one of the big difference between LLVM and GCC.（GCC生成彙編格式的程式碼，依賴於平臺外部彙編？）
$ llc test.ll -show-mc-encoding -o -

見鬼，我還是沒有明白SDAG的作用（LLVM IR裡不是有迴圈嗎？為什麼SDAG就變成DAG了呢？）

為目標架構生成程式碼[編輯]

沒有tablegen，llvm本身只具有學術意義，有了tablegen，llvm才變成了可工業使用的牛逼庫
pipeline：SelectionDAG --> MachineDAG --> MachineInstr --> MCInst
定義一個玩具後端：r0-3, sp, pc, cpsr（pc？）

Defining registers and register sets
每個暫存器都有一個唯一編號，這要求平臺指令中的暫存器位表示是一致的（當然，有些是隱含的比如push/pop）
Defining the calling convention（ABI）
def CC_TOY : CallingConv<[
CCIfType<[i8, i16], CCPromoteToType<i32>>, //8位、16位的提升到32位
CCIfType<[i32], CCAssignToReg<[R0, R1]>>,
CCIfType<[i32], CCAssignToStack<4, 4>> //開始2個引數R0，R1暫存器傳遞，剩餘的通過棧傳遞
def CC_Save : CalleeSavedRegs<(add R2, R3)>;
Defining the instruction set
def ADDrr : InstTOY<(outs GRRegs:$dst), (ins GRRegs:$src1, GRRegs:$src2), "add $dst, $src1,z$src2", [(set i32:$dst, (add i32:$src1, i32:$src2))]>;
Implementing frame lowering
- Frame lowering involves emitting function prologue and epilogue.（llvm ir是直接定義函式的，包括ret指令）
- void TOYFrameLowering::emitPrologue(MachineFunction &MF) const {
  const TargetInstrInfo &TII = *MF.getSubtarget().getInstrInfo();
  MachineBasicBlock &MBB = MF.front();
  MachineBasicBlock::iterator MBBI = MBB.begin();
  uint64_t StackSize = computeStackSize(MF);
  unsigned StackReg = TOY::SP;
  unsigned OffsetReg = materializeOffset(MF, MBB, MBBI, (unsigned)StackSize);
  ... //略
Lowering instructions
程式碼略
Printing an instruction
Registering a target（略）

LLVM Essentials-Packt 2016（讀書筆記）：TableGen講解並不透徹，另外我還想知道後端優化步演算法到底怎麼編寫？

Playing with LLVM[編輯] 暫存器變數（%var）、棧變數（alloca，%1 ...）、.c-->.bc：$ clang -emit-llvm -c main.c.bc-->.s：$ llc output.bc –o output.s.ll-->.bc：$ llvm-

JavaScript高階程式設計（讀書筆記）之函式表示式

定義函式的方式有兩種：一種是函式宣告，另一種就是函式表示式。函式宣告的一個重要特徵就是函式宣告提升（function declaration hoisting)，意思是在執行程式碼前會先讀取函式宣告。這個例子不會報錯，因為程式碼在執行前會先讀取函式宣告。理解函式提升的關鍵就是區別函式宣告和函式表示式之

JavaScript高階程式設計（讀書筆記）之BOM

BOM（Browser Object Model）提供了很多物件用於訪問瀏覽器的功能，這些功能與任何網頁內容無關。 8.1 window物件 BOM的核心物件是window，它表示一個瀏覽器例項。在瀏覽器中，window物件有雙重角色，window物件既是JavaScript訪問瀏覽器視窗的一個介面，又是E

深入理解Java虛擬機器——垃圾收集器與記憶體分配策略（讀書筆記）

判斷物件是否存活 1、引用計數法給物件新增一個引用計數器，每當有一個地方引用它時，計數器值加1，當引用失效時，計數器值減1，任何時刻計數器為0的物件就是不可能再被使用的。缺點：不能解決物件之間迴圈引用的問題 2、根搜尋演算法（GC Roots Tracing）

看板系統的首要目標與次要目標（讀書筆記）

看板系統的首要目標-----以最小的阻力匯入變革。引入視覺化和限制在製品來促進變革，進而優化現有流程。由於現有的角色與職責都沒有改變，所以來自員工的抵觸與阻力也是最小的。看板系統還有其他

oracle層次查詢connect by （讀書筆記）

--oracle層次查詢connect by --首先給scott使用者授查詢許可權：GRANT SELECT ON employees TO scott;GRANT SELECT ON jobs TO scott;CREATE TABLE employee AS SEL

JavaScript高階程式設計（讀書筆記）（七）

本筆記彙總了作者認為“JavaScript高階程式設計”這本書的前七章知識重點，僅供參考。第七章函式表示式小結：在JavaScript程式設計中，函式表示式是一種非常有用的技術。使用函式表示式可以無須對函式命名，從而實現動態程式設計。

（讀書筆記）網頁UI與使用者體驗設計5要素---1.1感官體驗要素之設計風格

網站進行設計前，必須明確該網站所針對的目標客戶群體，並對目標客戶群體的審美喜好進行分析，從而確定網站的總體設計風格。超清晰風格：清晰實用極簡風格：易於建立和維護，但細節上煞費苦心照片：運用恰當的話生動有衝擊力意義豐富，不恰當的話會很糟糕如果

智慧社群----網際網路時代的未來家園（讀書筆記）

新加坡智慧社群服務點系統主要包括電子商務、電子政務、社群醫療及社群文娛四個系統。系統的各項職能主要通過政府開辦的政務類網站及民間組織開辦的互助類網站、論壇和社群資訊查詢網站來實現日本社群服務系統主要包括以便利店及生活協同組合為主要形式的電子商務資訊系統，以宣傳和諮詢服務為主的電子政務資訊系統，以

Java記憶體回收知識（讀書筆記）--深入理解Java虛擬機器——JVM高階特性與最佳實踐(第2版)2.2~2.3

1.哪些地方的記憶體要回收？ Java程式運時的記憶體包括以下幾部分：程式計數器，Java虛擬機器棧，本地方法棧，Java堆，方法區（執行時常量池是方法區的一部分）。程式計數器，Java虛擬機器棧，本地方法棧是隨執行緒而生，隨執行緒而亡，它們的分配的記憶體大小已知，因此不

（讀書筆記）各深度學習框架簡要介紹

1.TensorflowTensorflow是由Google Brain開發並開源的相對高階的機器學習庫，使用者可以方便地用它設計神經網路結構，而不必為了追求高效率的實現親自寫C++或CUDA程式碼。Tensorflow支援自動求導。Tensorflow核心程式碼由C++編寫

指尖上行--移動前端開發進階之路（讀書筆記）----1.1頁面佈局

chapter 1 移動頁面開發頁面佈局頁面除錯常用庫和框架 1.1 頁面佈局 1.1.1 Vieport（視口，檢視視窗）裝置畫素物理畫素：螢幕解析度；裝置獨立畫素：CSS畫素（eg:IPhone5 CSS畫素是320*568p

RBD儲存的接收以及相關概念（讀書筆記）

RDB進行持久化 RDB持久化可以手動執行，也可以根據伺服器配置選項定期執行。該功能可以將某個時間點上的資料庫狀態儲存到一個RDB儲存到一個檔案中。 RDB持久化功能所生產的RDB檔案是一個經過壓縮的二進位制檔案，通過該檔案可以還原生成RDB檔案資料庫狀態

搜尋引擎之路（一）--- 《搜尋引擎---資訊檢索實踐》（讀書筆記）

搜尋引擎是指根據一定的策略，運用特定的計算機程式從網際網路上收集，在對資訊進行組織和處理後，為使用者提供檢索服務，並將檢索相關的資訊提供給使用者的系統。搜尋引擎的研究方向包含架構方向（索引、檢索），策略方向（排序、查詢與結果處理）。本文簡要總結了搜尋引擎---資訊

響應式Web設計：HTML5和CSS3實戰（讀書筆記）

視口：瀏覽器視窗內的內容區域，不包含工具欄，標籤欄。網頁實際顯示. 螢幕尺寸：裝置物理顯示區域各種寬度和高度 a、可視區的真實寬度和高度 document.documentElement.clientWid

軟考-架構師-第二章-作業系統第五節檔案管理（讀書筆記）

主要針對希賽出版的架構師考試教程《系統架構設計師教程（第4版）》，作者“希賽教育軟考學院”。完成相關的讀書筆記以便後期自查，僅供個人學習使用，不得用於任何商業用途。第五節檔案管理每一種軟體資源本身都是具有一定邏輯意義的相關資訊的集合，在

Java 執行緒安全問題及執行緒鎖（讀書筆記）

多執行緒安全問題：首先整理多執行緒同步的知識點，開頭肯定是要先探討探討多執行緒安全的問題。那麼嘛叫執行緒安全問題呢？答：我們知道Jvm虛擬機器的設計中執行緒的執行是搶佔式的，執行緒的執行時間是由底層系統決定的。所以就會有多個執行緒修改同一個資料時不同

指尖上行--移動前端開發進階之路（讀書筆記）----2.1動畫形式

chapter 2 技術創意形式動畫形式移動裝置 Web API 詳解 WebVR 創意點 2.1 動畫形式 2.1.1 CSS3 CSS3 Cascading Style Sheets 層疊樣式表。 CSS3是CSS技術的一個升級版本，

計算機網路（讀書筆記）

基本概念三網：電信網路、有線電視網路、計算機網路。 ISP(因特網服務提供者)：主幹ISP、地區ISP、本地ISP IXP( Internet eXchange Point)英特網交換點計算機之間的通訊：主機A的某個程序和主機B上的另一個程序進行通訊

HBase資料結構（讀書筆記）

背景：最近在做一些跟大資料相關的東西，涉及到資料的儲存和分析，考慮各個方面，選擇使用HBase進行儲存，使用原生Java API進行資料分析，之後會陸續寫一系列來說明最近做的東西，給像我這樣未

LLVM Essentials-Packt 2016（讀書筆記）：TableGen講解並不透徹，另外我還想知道後端優化步演算法到底怎麼編寫？

Playing with LLVM[編輯]

Building LLVM IR[編輯]

高階IR[編輯]

基本IR變換[編輯]

高階IR塊變換[編輯]

IR到Selection DAG階段[編輯]

為目標架構生成程式碼[編輯]

相關推薦