[Python程式設計]綜合性實驗: Java原始碼高亮實現將Java程式碼轉換為html

阿新 • • 發佈：2018-11-09

前言

這個是大三下學期的Java課程設計,目前重構完成了程式碼轉換並輸出的部分.暫時還沒有打算完成視覺化介面.
程式碼不長,加起來也就100行左右(再次感受到Python的精簡),實現了對註釋,關鍵字,字串,一些運算子的高亮.

程式碼實現

import re

class JavaSyntaxHighlighter:
    def __init__(self):
        self.x = 0
        self.line = ""  # 儲存當前處理的行
        self.keywords = \
            ["abstract" 
, "assert", "boolean", "break", "byte",
             "case", "catch", "char", "class", "const",
             "continue", "default", "do", "double", "else",
             "enum", "extends", "final", "finally", "float",
             "for", "goto", "if", "implements", "import",
             "instanceof" 
, "int", "interface", "long", "native",
             "new", "package", "private", "protected", "public",
             "return", "strictfp", "short", "static", "super",
             "switch", "synchronized", "this", "throw", "throws",
             "transient", "try", "void", "volatile", "while"]
        self. 
regexkeywords = [r"(?<=\s)" + w + r"(?=\s)" for w in self.keywords]

    def highlight_note(self, note):
        '高亮註釋行'
        if note != "":  # note為空,表示行尾無註釋
            self.line = self.line.replace(note, " [note] " + note + " [end] ")

    def highlight_string(self, pos):
        '高亮字串'
        codeline = self.line[:pos]  # 程式碼部分
        noteline = self.line[pos:]  # 不處理行尾註釋
        strlist = re.findall(r'\".*?\"|\'.*?\'', codeline)  # 搜尋所有字串
        if strlist is not None:
            for string in strlist:
                codeline = codeline.replace(string, " [str] " + string + " [end] ")
        self.line = codeline + noteline

    def highlight_keyword(self, pos):
        '高亮關鍵字'
        codeline = " " + self.line[:pos] + " "
        noteline = self.line[pos:]
        for r, w in zip(self.regexkeywords, self.keywords):
            codeline = re.sub(r, " [key] " + w + " [end] ", codeline)
        self.line = codeline + noteline

    def highlight_operator(self):
        '高亮運算子'
        line = self.line
        opr = ['=', '(', ')', '{', '}', '|', '+', '-', '*', '/', '<', '>']
        for o in opr:
            line = line.replace(o, " [opr] " + o + " [end] ")  # 未實現關於字串內的運算子處理
        self.line = line

    def translate(self, data=""):
        '轉換為html標籤'
        name = ["note", "key", "str", "opr"]
        for n in name:
            data = data.replace(" [" + n + "] ", "<span class='" + n + "'>")
        data = data.replace(" [end] ", "</span>")
        return data

    def highlight(self, line):
        '單行程式碼高亮'
        self.line = line
        if self.line.strip() == '': return line  # 空串不處理
        global note  # 註釋
        note = ""
        find_note = re.match(r'/(/|\*)(.*)|\*(.*)|(.*)\*/$', self.line.strip())  # 查詢單行註釋
        if find_note:  # 處理單行註釋
            note = find_note.group()
            self.highlight_note(note)
            return self.line
        pos = len(self.line)
        find_note = re.search(r'(?<=[){};])(.*)/(/|\*).*$', self.line.strip())  # 查詢行尾註釋
        if find_note:
            note = find_note.group()  # 標記行尾註釋
            pos = find_note.span()[0]  # 標記註釋位置
        self.highlight_note(note)  # 處理行尾註釋
        self.highlight_keyword(pos)  # 處理關鍵字
        self.highlight_string(pos)  # 處理字串
        self.highlight_operator()  # 處理運算子
        return self.line  # 返回處理好的行


if __name__ == '__main__':
    jsh = JavaSyntaxHighlighter()
    html_head = ['<!DOCTYPE html>',
                 '<html>', '<head>',
                 '<title>', 'generated by JavaSyntaxHighlighter', '</title>',
                 '<style type="text/css">',
                 'pre{font-family:\'Microsoft Yahei\';font-size:20;}',
                 '.key{color:#000080;font-weight:bold;}',
                 '.note{color:#808080;font-weight:bold;font-style:italic;}',
                 '.str{color:#008000;font-weight:bold;}',
                 '.opr{color:#DB380D;font-weight:bold;}',
                 '</style>', '</head>', '<body>', '<pre>']
    html_tail = ['</pre>', '</body>', '</html>']
    input_file = input("請輸入Java檔案路徑: ")
    with open(input_file) as f:
        codelist = f.read().replace("<", "&lt").split('\n')  # 替換java中的“<”為html的顯示符
    with open(input_file + ".html", 'w') as f:  # 儲存html到同目錄
        data = []
        f.write('\n'.join(html_head))
        for i in codelist:
            data.append(jsh.highlight(i))  # 每行加標籤後存如data
        f.write(jsh.translate('\n'.join(data)))  # 轉換為html的<>標籤
        f.write('\n'.join(html_tail))
    print("轉換成功!已儲存為:", input_file + ".html")

說明

1.流程:

讀取一個java檔案到列表->對列表每一行呼叫highlight()進行高亮(加標籤)->儲存到data中->
對data中的標籤轉換為html的標準標籤->將html的頭部(<html>,<head>…)+data+html尾部(<head></html>…)輸出為html格式檔案

2.html:

html中使用了<pre>格式化程式碼顯示,使用<span class=“xxx”>進行加標籤
在css中設定class=“xxx"的屬性,實現對不同的部分動態調整顏色,而且只需修改一次就可以了
(以前的版本中使用<font color=”#808080">這類標籤,非常的笨重,不能動態修改顏色,字型等)

3.高亮函式的流程

(1) 呼叫highlight(line),送一行進去
(2) 用self.line = line儲存當前處理的行
(2) self.line.strip()判斷串,空串返回不處理
(3) 用正則模式/(/|\*)(.*)|\*(.*)|(.*)\*/$檢查是否為單行註釋(//xxx /*xxx*/ *xxx xxx*/)
如果是,highlight_note(self.line)高亮註釋部分並返回
(4) 用正則模式(?<=[){};])(.*)/(/|\*).*$查詢行尾註釋,
如果有,返回註釋本身note,以及程式碼與註釋的分割位置pos
例如:int i = 0; //*Note*, note="//*Note*" pos=10
如果沒有,note="" pos=len(self.line)分割位置在行尾
也就是說:self.line[:pos]為程式碼,self.line[pos:]為行尾註釋
(5)highlight_note(note)處理行尾註釋
(6)highlight_keyword(pos)處理關鍵字
(7)highlight_string(pos)處理字串
(8)highlight_operator()處理運算子
(9)最後返回self.line

4.特殊部分處理

例如:
1.字串內含有註釋
string str = "abc//cde/*123*/"
2.註釋內含有字串
// something "i see.."
3.程式碼包含了關鍵字
public void importModule(){}中的import
4.字串\註釋內含運算子
str = "1+5/2*3"
1.含有註釋的字串屬於程式碼行,通過單行註釋的檢查,又通過了行尾註釋的檢查,所以只會被highlight_string()高亮
2.含有字串的註釋,沒通過單行註釋的檢查,被返回.如果通過行尾註釋的檢查,則被分割到註釋部分高亮,不參與highlight_string()的高亮
3.用正則表示式r"(?<=\s)" + w + r"(?=\s)",w為關鍵字即可.
相當於關鍵字w在前面和後面都有不可見字元時"[空白字元a]public[空白字元b]"
對於出現在開頭沒有空白字元的關鍵字要加上一個空格
public static xxx->[空白字元]public static xxx
4.還沒處理…

測試

這裡粘一下Hashmap.java的輸出效果和html原始檔
大概感覺就是這樣了,不過還是有一些問題,想想還有什麼方法好解決?
測試用例Util見百度網盤

寫在最後

複習了正則表示式的用法,re模組的使用等等,這是第一次重構,將來會有第二,第三次的改進…希望學習Python學得更好

[Python程式設計]綜合性實驗: Java原始碼高亮實現將Java程式碼轉換為html

前言這個是大三下學期的Java課程設計,目前重構完成了程式碼轉換並輸出的部分.暫時還沒有打算完成視覺化介面. 程式碼不長,加起來也就100行左右(再次感受到Python的精簡),實現了對註釋,關鍵字,字串,一些運算子的高亮. 程式碼實現 import re cl

Python解密網易雲音樂.ncm檔案，將.ncm檔案轉換為.mp3檔案，實現隨處播放（另附C++已編譯轉換器）

網易雲音樂把.mp3音樂檔案加密為.ncm檔案，導致不能將下載好的音樂複製到其它裝置或使用非網易雲音樂播放器播放，該程式可將.ncm檔案逆向解密為.mp3檔案並保留最高音質。另有C++已編譯.exe轉換器，將.ncm檔案拖到.exe上直接執行轉換，生成.mp3檔案在.ncm檔案相同路徑。點選下

Python進階(五十三)-Flask Web開發實現將表單渲染成HTML

也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！ Python進階(五十三)-Flask Web來發實現將表單渲染成HTML 在利用Flask進行Python Web開發時，頁面中的wt

selenium 3 java 元素高亮顯示

mport org.openqa.selenium.By; import org.openqa.selenium.JavascriptExecutor; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebEleme

vue程式設計式導航及路由高亮

1.在方法中實現 this.$router.push({path:"/hello"})//跳轉到hello頁面 2.replace方法是不向history中新增新紀錄 this.$router.replace({path:"router"}) 3.go的使用 this.$rout

[csdn markdown]使用摘記一原始碼高亮及圖片上傳和連結

本文主要內容是體驗csdn markdown的程式碼塊高亮顯示和圖片連結及上傳。圖片上傳上邊這是標題行，只需要使用一個#就可以表示，幾個表示是幾級標題如果想要自動根據標題生成目錄，那麼就使用[TOC] 標記來表示這裡是目錄，並且會自動生成。

MyEclipse設定JAVA選中高亮顯示

原文地址：http://trujun.blog.163.com/blog/static/181234097201171621323571/ 1.開啟顯示功能選擇Windows->Preferences->Java-> Editor-> Mar

Android程式設計心得-ListView的Item高亮顯示的辦法

在我們使用ListView的時候，經常會遇到某一項（Item）需要高亮顯示的情況，如下圖，有人說當我們點選子項的時候會變亮，但有時候業務邏輯需要讓ITEM根據條件自動變亮，下面我來介紹一下我自己的解決辦法 1.首先在layout資料夾對應的xml配置檔案定義一個l

Python學習記錄----一篇關於python程式設計中try catch的用法，個人覺得java也是通用的

關於異常處理的幾點意見 1.如果異常的數量少於20個，在哪裡處理沒有多大區別，如果有100個，就不一樣了 2.如果except什麼也不做，僅僅是pass，那為什麼還用try呢？return erron_code是C語言的處理方式，不應該用在面嚮物件的技術裡面，難道

【原創】smarty引擎下的導航按鈕高亮實現

array temp 是不是 emp AC php aar ann rom <?php$_nvaarr = array( array(‘name‘=>‘首頁‘,‘url‘=>‘company.php?id=‘), array(‘name‘=&g

ABAP Development Tools的語法高亮實現原理

ABAP Development Tools的前端是Java，根本識別不了ABAP。那麼在ADT裡的ABAP語法高亮是如何實現的？第一次開啟一個report時，顯示在ADT裡的程式碼是沒有任何語法高亮顯示的，此時有一個HTTP請求發到ABAP後臺： /sap/bc/adt/abapsource/

c++模板超程式設計：std::invoke原始碼分析及其實現

在實現invoke之前，我們先看一下標準庫種invoke的使用方式 template< class F, class... Args>std::invoke_result_t<F, Args...> invoke(F&& f, Args&&... ar

《Python程式設計從入門到實踐》記錄之將Python函式儲存在模組中（import、import*）

目錄 1、匯入整個模組 2、匯入特定的函式 3、使用as給函式指定別名 4、匯入模組中的所有函式 5、總結我們可以在編寫程式時將函式儲存在被稱為模組的獨立檔案中，再將模組匯入到主程式中（必須的步驟）。port語句允許在當前執行的程式檔案中使用模組中的程式碼。模組是

java原始碼閱讀介面篇之java.util.Collection

java.util.Collection是個介面，很容易和工具類java.util.Collections弄混淆。今天我就抽絲剝繭來研究一下這個介面。這裡我基於JDK1.7.0_80的Collections介面進行研究，以避免JDK1.8引入的StreamAPI和函數語言

樹形結構選單選中的選單高亮實現

Dtree.js 選中的選單高亮實現專案中選單樹使用Dtree.js實現，但是Dtree只能實現選單懸停高亮,具體是在Dtree.js中找到 useSelection: true, 手動處理獲取d

Python Requests post並將得到結果轉換為json

request blog req pre AS log details class ocs Python Requests post並將得到結果轉換為json 學習了：https://blog.csdn.net/sinat_28680819/article/details/

python實現將某程式碼檔案複製／移動到指定路徑下（檔案、資料夾的移動、複製、刪除、重新命名）

用python實現將某程式碼檔案複製／移動到指定路徑下。場景例如：mv ./xxx/git/project1/test.sh ./xxx/tmp/tmp/1/test.sh （相對路徑./xxx/tmp/tmp/1/不一定存在） # -

java將JSON字串轉換為實體類物件，基於net sf json實現

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

JAVA Enum指定值的應用(從資料轉換為Enum)

enum ACTION{ ac_Entry(10),ac_View(2),ac_Approve(5); private int _val; private static final Map<Integer,ACTION> keyMap=new HashMap<Int

使用者登入使用java的IO流實現將資料儲存到data目錄下

一、效果展示 1、最初可以看到data/data目錄下該專案只有一個cache資料夾和lib檔案第一次執行程式，使用者名稱和密碼皆為空。當我們輸入使用者名稱和密碼後，點選登入專案目錄下出現名為info.txt的文件，開啟它可以看到原先輸入的使用者名稱和密碼。第二次執行

[Python程式設計]綜合性實驗: Java原始碼高亮 實現將Java程式碼轉換為html

前言

程式碼實現

說明

1.流程:

2.html:

3.高亮函式的流程

4.特殊部分處理

測試

寫在最後

相關推薦

[Python程式設計]綜合性實驗: Java原始碼高亮實現將Java程式碼轉換為html