【編譯原理】Lex詞法分析器

阿新 • • 發佈：2019-01-01

一、實驗目的

設計並實現一個詞法分析器，深刻理解編譯原理中詞法分析器的原理。

二、實驗內容

通過使用自己熟悉的語言設計並實現一個詞法分析器，是此法分析器按要求的格式輸出經過分析的程式段。

要求分析一下程式片段：

const a=10;
var b,c;
procedure p;
begin
c:=b+a;
end;
begin
read(b);
while b#0do
begin
call p;writeln(2*c);read(b);
end
end.

該程式片段存放在example.txt中。

三、實驗步驟

1、對PL\0文法中各類單詞分類：

（1）保留字：const、var、procedure、begin、end、if、then、while、do、read、call、write、writeln

（2）常數：由0-----9這幾個數字組成

（3）識別符號：由字母打頭的字母和數字的字串

（4）運算子：+，-，*，/，:=，>=，<=，#

（5）分界符：，、.、(、)、；

2、將各類單詞對應到lex中：

（1）保留字：

reservedWord [cC][oO][nN][sS][tT]|[vV][aA][rR]|[pP][rR][oO][cC][eE][dD][uU][rR][eE]|

[bB][eE][gG][iI][nN]|[eE][nN][dD]|[iI][fF]|[tT][hH][eE][nN]|[wW][hH][iI]

[lL][eE]|[dD][oO]|[rR][eE][aA][dD]|[cC][aA][lL][lL]|[wW][rR][iI][tT][eE]

[wW][rR][iI][tT][eE][lL][nN]

（2）常數：

constant ([0-9])+ /*0---9這幾個數字可以重複*/

（3）識別符號：

identfier [A-Za-z]([A-Za-z][0-9])*

（4）運算子：

operator \+|-|\*|\/|:=|>=|<=|#|= /*在lex中，有特殊意義的運算子要加轉義字元\，如+、*及*、/

（5）分界符：

delimiter [,\.;\(\)]

3、PL/0的語言的詞法分析器要求跳過分隔符（如空格，回車，製表符），對應的lex定義為：

delim [""\n\t]

whitespace{delim}+

4、為lex制定一些規則：

{reservedWord}{count++;printf("\t%d\t(1,‘%s’)\n",count,yytext);} /*對保留字定規則，輸出設定*/

{operator} {count++;printf("\t%d\t(2,‘%s’)\n",count,yytext); }

{delimiter}{count++;printf("\t%d\t(3,‘%s’)\n",count,yytext);}

{constant}{count++;printf("\t%d\t(4,‘%s’)\n",count,yytext);}

{identfier}{count++;printf("\t%d\t(5,‘%s’)\n",count,yytext);}

{whitespace} {/* do nothing*/ } /*遇到空格，什麼都不做*/

5、寫子程式：

voidmain()

{

printf("詞法分析器輸出型別說明:\n");

printf("1：保留字\n");

printf("2：運算子\n");

printf("3：分界符\n");

printf("4：常數\n");

printf("5：識別符號\n");

printf("\n");

yyin=fopen("example.txt","r");

yylex(); /* start the analysis*/

fclose(yyin);

system("PAUSE");/*暫停*/

}

intyywrap()

{

return 1;

}

當lex 讀完輸入檔案之後就會呼叫函式 yywrap 。如果返回1 表示程式的工作已經完成了，否則，返回 0。

四、實現的原始碼

%{
#include <stdio.h>
#include <stdlib.h>
int count = 0;
%}
delim [" "\n\t]
whitespace {delim}+
operator \+|-|\*|\/|:=|>=|<=|#|=
reservedWord [cC][oO][nN][sS][tT]|[vV][aA][rR]|[pP][rR][oO][cC][eE][dD][uU][rR][eE]|[bB][eE][gG][iI][nN]|[eE][nN][dD]|[iI][fF]|[tT][hH][eE][nN]|[wW][hH][iI][lL][eE]|[dD][oO]|[rR][eE][aA][dD]|[cC][aA][lL][lL]|[wW][rR][iI][tT][eE]|[wW][rR][iI][tT][eE][lL][nN]
delimiter [,\.;\(\)]
constant ([0-9])+
identfier [A-Za-z]([A-Za-z][0-9])*
%%
{reservedWord} {count++;printf("%d\t(1,‘%s’)\n",count,yytext);}
{operator} { count++;printf("%d\t(2,‘%s’)\n",count,yytext); }
{delimiter} {count++;printf("%d\t(3,‘%s’)\n",count,yytext);}
{constant} {count++;printf("%d\t(4,‘%s’)\n",count,yytext);}
{identfier} {count++;printf("%d\t(5,‘%s’)\n",count,yytext);}
{whitespace} { /* do nothing*/ }
%%
void main()
{
printf("詞法分析器輸出型別說明:\n");
printf("1：保留字\n");
printf("2：運算子\n");
printf("3：分界符\n");
printf("4：常數\n");
printf("5：識別符號\n");
printf("\n");
yyin=fopen("example.txt","r");
yylex(); /* start the analysis*/
fclose(yyin);
system("PAUSE");/*暫停停, 使DOS視窗停住*/
}
int yywrap()
{
return 1;
}

五、實操作

將原始碼儲存為a.l，然後用flex（Lex）進行編譯，輸入flex a.l，編譯後生成lex.yy.c檔案，用c編譯器開啟（確保example.txt儲存在相同目錄下），編譯執行即可！

六、執行結果

Lex與yacc確實是很不錯的工具！如果單用程式語言，如C，C++，Java寫的話，程式碼就多了不少。

【編譯原理】Lex詞法分析器

一、實驗目的設計並實現一個詞法分析器，深刻理解編譯原理中詞法分析器的原理。二、實驗內容通過使用自己熟悉的語言設計並實現一個詞法分析器，是此法分析器按要求的格式輸出經過分析的程式段。要求分析一下程式片段： const a=10; var b,c

【編譯原理】利用Flex工具生成C語言詞法分析器

Flex構造C語言詞法分析器可以識別大部分的C語言關鍵字和識別符號，可以去除註釋（多行單行都可以），可以識別整數和浮點數，可以識別錯誤的浮點數。 lex檔案結構： [第一部分：定義段] /* *按照C語言語法，宣告檔案包含，巨集定義，常數定義，全域性

【編譯原理】類C語言詞法分析器的設計

1.實驗要求輸入為一個以類C語言編寫的源程式輸出為一組二元組序列構成的文字檔案，一行為一個二元組，二元組中間以逗號隔開實驗報告上要求附上DFA 2.語言說明：保留字：unsigned、break、return、void、case、float、char、for、while、co

【編譯原理】c++實現自下而上語法分析器

不可 acm times style size PC -i 表達式鏈接寫在前面：本博客為本人原創，嚴禁任何形式的轉載！本博客只允許放在博客園（.cnblogs.com），如果您在其他網站看到這篇博文，請通過下面這個唯一的合法鏈接轉到原文！本博客全網唯一合法URL：ht

【編譯原理】LL（1）語法分析器

1.專案要求文法要求：（1）從檔案讀入，每條產生式佔用一行（2）文法為LL(1)文法從檔案中讀入文法，從鍵盤上輸入待分析的符號串，採用 LL(1)分析演算法判斷該符號串是否為該文法的句子。2.實驗思路：首先實現集合FIRST(X)構造演算法和集合FOLLOW(A)構造演算法，

【編譯原理】深入淺出構造 First 集和 Follow 集的演算法流程

First集構造流程　　對於 X -> ... 這條產生式而言，　　　　【1】若右邊第一個符號是終結符或 ε ，則直接將其加入 First（X）　　　　【2】若右邊第一個符號是非終結符，則將其 First 集的的非 ε 元素加入

【編譯原理】作業二

151220129 計科吳政億厚書 3.7.1 (2)一個狀態 ϵ−closure(0)={0}=Aϵ−closure(0)={0}=A Dtran[A,a]=ϵ−closure(0,1

【編譯原理】作業八

編譯原理作業8 151220129 計科吳政億 [email protected] 6.4.3 中間程式碼: t1 = i * 16 t2 = j * 4 t3 = t1

【編譯原理】作業十四

編譯原理第14次作業 151220129 計科吳政億 [email protected] 第一題 9.2.1 gen kill B1B1 1,2

【編譯原理】作業十三

編譯原理第13次作業 151220129 計科吳政億 [email protected] 第一題 8.6.5 t1 = b * c LD R1,

【編譯原理】提取左部公因子演算法

下面是書中給出的演算法, 簡單的描述了兩句。但是實際上實現起來沒有那麼簡單。在百度搜索提取左部公因演算法時也只有理論上的知識，並沒有實際的演算法。 https://github.com/hixiaosan/dragon_algorithm.git

【編譯原理】Flex、Bison的安裝與測試

Linux下安裝： sudo apt-get install flex bison flex -h bison -h 下載選擇 Complete Package，except sources 安裝

【編譯原理】:NFA轉變為DFA的子集構造法

整體的步驟是三步：一，先把正規式轉換為NFA（非確定有窮自動機）, 二，在把NFA通過“子集構造法”轉化為DFA，三，在把DFA通過“分割法”進行最小化。一步很簡單，就是反覆運用下圖的規則，圖1 這樣就能轉換到NFA了。給出一個例題，來自Google

【編譯原理】把正規式轉化為DFA

整體的步驟是三步：一，先把正規式轉換為NFA（非確定有窮自動機）, 二，在把NFA通過“子集構造法”轉化為DFA，三，在把DFA通過“分割法”進行最小化。一步很簡單，就是反覆運用下圖的規則，圖1 這樣就能轉換到NFA了。&n

【編譯原理】自下而上的語法分析之LR分析法

LR分析器是一種由下而上（bottom-up）的上下文無關語法分析器。LR意指由左（Left）至右處理輸入字串，並以最右邊優先派生（Right derivation）的推導順序（相對於LL分析器）建構語法樹。能以此方式分析的語法稱為LR語法。而在LR(k)這樣的名稱中，

編譯原理c++簡單詞法分析器

簡單詞法分析程式編譯原理課程詞法分析程式，自己c++寫的比較簡單功能實現，需要的使用者可以在此基礎上進行自己思路的擴充修改。功能：讀取一個自己設定路徑下的txt檔案中程式碼，然後將分析結果儲存在另外一個自己設定路徑下txt檔案中，下附加程式碼： /*

【編譯原理】語法分析

#include<iostream> #include<string> using namespace std; #define RSB 0 //Right square bracket 右方括號 #define VT 1 //非終結符

【編譯原理】語法制導翻譯之屬性文法（一）

最近對程式語言如何從原始碼->位元組碼（or 機器碼）->執行產生了興趣，為此從今天開始，給自己制定了一個學習計劃，目的是能夠對Java原始碼如何到class檔案位元組碼，再如何在JVM上執行有比較深入的理解。學習的第一步，就從難啃的編譯原理開始。之前

【編譯原理】第二章一個簡單的語法制導翻譯器

一，語法定義 1）文法：對語言結構的定義與描述。即從形式上用於描述和規定語言結構的稱為“文法”（或稱為“語法”），而未涉及語義問題。例：有一句子：“我是大學生” 。這是一個在語法、語義上

【編譯原理】學習記錄1_程式編譯過程

前端：該階段的編譯工作主要依賴源程式，與目標機無關。【語法分析】在詞法分析基礎上，將單詞序列分解成各類語法短語（也稱語法單位，如：“程式”“語句”“表示式”）。可表示成語法樹（推導樹）。通過語法分析，確定一個輸入串是否構成一個語法上正確的程式。

【編譯原理】Lex詞法分析器

相關推薦