1. 程式人生 > >軟體設計模式學習(十九)直譯器模式

軟體設計模式學習(十九)直譯器模式


> 直譯器是一種不常使用的設計模式,它用於描述如何構成一個簡單的語言直譯器,主要應用於使用面嚮物件語言開發的編譯器和直譯器設計。當我們需要開發一個新的語言時,可以考慮使用直譯器模式
## 模式動機 如果在系統中某一特定型別的問題發生的頻率很高,此時可以考慮將這些問題的例項表述為一個語言中的句子。再構建一個直譯器,直譯器通過解釋這些句子來解決對應的問題。 舉個例子,我們希望系統提供一個功能來支援一種新的加減法表示式語言,當輸入表示式為 "1 + 2 + 3 - 4 + 1" 時,輸出計算結果為 3。為了實現上述功能,需要對輸入表示式進行解釋,如果不作解釋,直接把 "1 + 2 + 3 - 4 + 1" 丟過去,現有的如 Java、C 之類的程式語言只會把它當作普通的字串,不可能實現我們想要的計算效果。我們必須自己定義一套規則來實現該語句的解釋,即實現一個簡單語言來解釋這些句子,這就是直譯器模式的模式動機。
## 模式定義 定義語言的文法,並且建立一個直譯器來解釋該語言中的句子,這裡的 “語言” 意思是使用規定格式和語法的程式碼,它是一種類行為型模式。
## 模式結構 ![](https://img2020.cnblogs.com/blog/1759254/202005/1759254-20200523202747369-797544315.png) 1. AbstractExpression(抽象表示式) 聲明瞭抽象的解釋操作,它是所有終結符表示式和非終結符表示式的公共父類 2. TerminalExpression(終結符表示式) 抽象表示式的子類,實現了文法中的終結符相關聯的解釋操作,在句子中每一個終結符都是該類的一個例項。 3. NonterminalExpression(非終結符表示式) 也是抽象表示式的子類,實現了文法中的非終結符相關聯的解釋操作,非終結符表示式中可以包含終結符表示式,也可以繼續包含非終結符表示式,因此其解釋操作一般通過遞迴方式來完成。 4. Context(環境類) 環境類又稱上下文類,它用於儲存直譯器之外的一些全域性資訊,通常它臨時儲存了需要解釋的語句。 5. Client(客戶類) 客戶類中構造了表示以規定文法定義的一個特定句子的抽象語法樹,該抽象語法樹由非終結符表示式和終結符表示式例項組合而成。在客戶類中還將呼叫解釋操作,實現對句子的解釋,有時候為了簡化客戶類程式碼,也可以將抽象語法樹的構造工作封裝到專門的類中完成,客戶端只需提供待解釋的句子並呼叫該類的解釋操作即可,該類可以稱為直譯器封裝類
## 模式分析 還是以之前提到的加減法表示式語言來舉例,我們要為這門語言定義語法規則,可以使用如下文法來定義 ``` expression ::= value | symbol symbol ::= expression '+' expression | expression '-' expression value ::= an integer // 一個整數值 ``` 該文法規則包含三條定義語句,第一句是表示式的組成方式,expression 是我們最終要得到的句子,假設是 "1 + 2 + 3 - 4 + 1",那麼該句的組成元素無非就是兩種,數字(value)和運算子號(symbol),如果用專業術語來描述的話,symbol 和 value 稱為語法構造成分或語法單位。根據句子定義,expression 要麼是一個 value,要麼是一個 symbol。 value 是一個終結符表示式,因為它的組成元素就是一個整數值,不能再進行分解。與之對應的 symbol 則是非終結符表示式,它的組成元素仍舊可以是表示式 expression,expression 又可以是 value 或者 symbol,即可以進一步分解。 按照上述的文法規則,我們可以通過一種稱之為抽象語法樹(Abstract Syntax Tree)的圖形方式來直觀地表示語言的構成,每一顆抽象語法樹對應一個語言例項,如 "1 + 2 + 3 - 4 + 1" 可以通過如圖的抽象語法樹來表示。 ![](https://img2020.cnblogs.com/blog/1759254/202005/1759254-20200523202808687-1477323585.png) 每一個具體的語句都可以用類似的抽象語法樹來表示,終結符表示式類的例項作為樹的葉子節點,而非終結符表示式類的例項作為非葉子節點。抽象語法樹描述瞭如何構成一個複雜的句子,通過對抽象語法樹的分析,可以識別出語言中的終結符和非終結符類。 在直譯器模式中,每一個終結符和非終結符都有一個具體類與之對應,正因為使用類來表示每一個語法規則,使得系統具有較好的擴充套件性和靈活性。對於所有的終結符和非終結符,首先要抽象出一個公共父類 ```java public abstract class AbstractExpression { public abstract void interpret(Context ctx); } ``` 對於終結符表示式,其程式碼主要是對終結符元素的處理 ```java public class TerminalExpression extends AbstractExpression { public void interpret(Context ctx) { // 對於終結符表示式的解釋操作 } } ``` 對於終結符表示式,其程式碼比較複雜,因為通過非終結符表示式可以將表示式組合成更復雜的結構。表示式可以通過非終結符連線在一起,對於兩個操作元素的非終結符表示式,其典型程式碼如下 ```java public class NonterminalExpression extends AbstractExpression { private AbstractExpression left; private AbstractExpression right; public NonterminalExpression(AbstractExpression left, AbstractExpression right) { this.left = left; this.right = right; } public void interpret(Context ctx) { // 遞迴呼叫每一個組成部分的 interpret() 方法 // 在遞迴呼叫時指定組成部分的連線方式,即非終結符的功能 } } ``` 通常在直譯器模式中還提供了一個環境類 Context,用於儲存一些全域性資訊,用於在進行具體的解釋操作時從中獲取相關資訊。當系統無須提供全域性公共資訊時,可以省略環境類 ```java public class Context { private HashMap map = new HashMap(); public void assign(String key, String value) { // 往環境類中設值 } public void lookup(String key) { // 獲取儲存在環境類中的值 } } ```
## 模式例項 現需構造一個語言直譯器,使系統可以執行整數間的乘、除和求模運算。當用戶輸入表示式 "3 * 4 / 2 % 4",輸出結果為 2 1. 抽象表示式類 Node(抽象節點) ```java public interface Node { public int interpret(); } ``` 2. 終結符表示式類 ValueNode(值節點類) ```java public class ValueNode implements Node { private int value; public ValueNode(int value) { this.value = value; } @Override public int interpret() { return this.value; } } ``` 3. 抽象非終結符表示式類 SymbolNode(符號節點類) ```java public abstract class SymbolNode implements Node { protected Node left; protected Node right; public SymbolNode(Node left, Node right) { this.left = left; this.right = right; } } ``` 4. 非終結符表示式類 MulNode(乘法節點類) ```java public class MulNode extends SymbolNode { public MulNode(Node left, Node right) { super(left, right); } @Override public int interpret() { return super.left.interpret() * super.right.interpret(); } } ``` 5. 非終結符表示式類 DivNode(除法節點類) ```java public class DivNode extends SymbolNode { public DivNode(Node left, Node right) { super(left, right); } @Override public int interpret() { return super.left.interpret() / super.right.interpret(); } } ``` 6. 非終結符表示式類 ModNode(求模節點類) ```java public class ModNode extends SymbolNode { public ModNode(Node left, Node right) { super(left, right); } @Override public int interpret() { return super.left.interpret() % super.right.interpret(); } } ``` 7. 直譯器封裝類 Calculator(計算器類) Calculator 類是本例項的核心類之一,Calculator 類中定義瞭如何構造一棵抽象語法樹,在構造過程中使用了棧結構 Stack。通過一連串判斷語句判斷字元,如果是數字,例項化終結符表示式類 ValueNode 並壓棧;如果判斷為運算子號,則取出棧頂內容作為其左表示式,而將之後輸入的數字封裝在 ValueNode 型別的物件作為其右表示式,建立非終結符表示式 MulNode 型別的物件,最後將該表示式壓棧。 ```java public class Calculator { private String statement; private Node node; public void build(String statement) { Node left = null, right = null; Stack stack = new Stack(); String[] statementArr = statement.split(" "); for (int i = 0; i < statementArr.length; i++) { if (statementArr[i].equalsIgnoreCase(("*"))) { left = stack.pop(); int val = Integer.parseInt(statementArr[++i]); right = new ValueNode(val); stack.push(new MulNode(left, right)); } else if (statementArr[i].equalsIgnoreCase(("/"))) { left = stack.pop(); int val = Integer.parseInt(statementArr[++i]); right = new ValueNode(val); stack.push(new DivNode(left, right)); } else if (statementArr[i].equalsIgnoreCase(("%"))) { left = stack.pop(); int val = Integer.parseInt(statementArr[++i]); right = new ValueNode(val); stack.push(new ModNode(left, right)); } else { stack.push(new ValueNode(Integer.parseInt(statementArr[i]))); } } this.node = stack.pop(); } public int compute() { return node.interpret(); } } ``` 8. 客戶端測試類 Client 程式執行時將遞迴呼叫每一個表示式類的 interpret() 的解釋方法,最終完成對整棵抽象語法樹的解釋。 ```java public class Client { public static void main(String[] args) { String statement = "3 * 4 / 2 % 4"; Calculator calculator = new Calculator(); calculator.build(statement); int result = calculator.compute(); System.out.println(statement + " = " + result); } } ``` 9. 執行結果 ![](https://img2020.cnblogs.com/blog/1759254/202005/1759254-20200523202833024-1125782712.png)
## 模式優缺點 直譯器模式優點如下: 1. 易於改變和擴充套件文法。由於使用類來表示語言的文法規則,可以通過繼承機制來改變或擴充套件文法。 2. 易於實現文法。抽象語法樹中每一個節點類的實現方式都是相似的,編寫並不複雜。 3. 增加了新的解釋表示式的方式。增加新的表示式時無須對現有表示式類進行修改,符合開閉原則 直譯器模式缺點如下: 1. 對於複雜文法難以維護。 2. 執行效率低。直譯器模式使用了大量迴圈和遞迴呼叫。 3. 應用場景有限。
[軟體設計模式學習(十八)命令模式](https://www.cnblogs.com/Yee-Q/p/12911687.html