20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼

阿新 • • 發佈：2018-12-13

exce eat temp 基礎第一個最小 charat 轉換 except

20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼

哈夫曼樹簡介

定義：給定n個權值作為n個葉子結點，構造一棵二叉樹，若帶權路徑長度達到最小，稱這樣的二叉樹為最優二叉樹，也稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。
帶權路徑長度（Weighted Path Length of Tree,簡記為WPL）
- 結點的權：在一些應用中,賦予樹中結點的一個有某種意義的實數。
- 結點的帶權路徑長度：結點到樹根之間的路徑長度與該結點上權的乘積。
- 樹的帶權路徑長度(Weighted Path Length of Tree)：定義為樹中所有葉結點的帶權路徑長度之和。

哈夫曼樹代碼實現

代碼參考了java創建哈夫曼樹和實現哈夫曼編碼

HuffmanNode類

首先設置一個HuffmanNode類作為實現的基礎，每個結點都包含一個六項內容：權值、結點代表字母、字母的編碼、左孩子、右孩子和父結點，為了方便之後進行結點的比較，這裏還重新編寫了一下compareTo方法。

public int compareTo(HuffmanNode<T> o) {
    if (this.getWeight() > o.getWeight()){
        return -1;
    }
    else if (this.getWeight() < o.getWeight()){
        return 1;
    }
    return 0;
}

HuffmanTree類

在HuffmanTree類裏有兩個方法，第一個方法createTree方法用於構造樹，第二個方法BFS方法是使用廣度優先遍歷來給每一個葉子結點進行編碼。具體方法及步驟在代碼中都已寫明。

public static HuffmanNode createTree(List<HuffmanNode<String>> nodes) {
    while (nodes.size() > 1){
        // 對數組進行排序
        Collections.sort(nodes);
        // 當列表中還有兩個以上結點時，構造樹
        // 獲取權值最小的兩個結點
        HuffmanNode left = nodes.get(nodes.size() - 2);
        left.setCode(0 + "");
        HuffmanNode right = nodes.get(nodes.size() - 1);
        right.setCode(1 + "");
        // 生成新的結點，新結點的權值為兩個子節點的權值之和
        HuffmanNode parent = new HuffmanNode(left.getWeight() + right.getWeight(), null);
        // 使新結點成為父結點
        parent.setLeft(left);
        parent.setRight(right);
        // 刪除權值最小的兩個結點
        nodes.remove(left);
        nodes.remove(right);
        nodes.add(parent);
    }
    return nodes.get(0);
}

public static List<HuffmanNode> BFS(HuffmanNode root){
    Queue<HuffmanNode> queue = new ArrayDeque<HuffmanNode>();
    List<HuffmanNode> list = new java.util.ArrayList<HuffmanNode>();

    if (root != null){
        // 將根元素加入隊列
        queue.offer(root);
        root.getLeft().setCode(root.getCode() + "0");
        root.getRight().setCode(root.getCode() + "1");
    }

    while (!queue.isEmpty()){
        // 將隊列的隊尾元素加入列表中
        list.add(queue.peek());
        HuffmanNode node = queue.poll();
        // 如果左子樹不為空，將它加入隊列並編碼
        if (node.getLeft() != null){
            queue.offer(node.getLeft());
            node.getLeft().setCode(node.getCode() + "0");
        }
        // 如果右子樹不為空，將它加入隊列並編碼
        if (node.getRight() != null){
            queue.offer(node.getRight());
            node.getRight().setCode(node.getCode() + "1");
        }
    }
    return list;
}

HuffmanMakeCode類

HuffmanMakeCode類用於將文件中的內容提取，放入數組並進行計數，這裏將數組長度設置為27，因為還對空格進行了計數，以便於解碼。具體方法及步驟在代碼中都已寫明。

public class HuffmanMakeCode {
    public static char[] word = new char[]{'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s'
            ,'t','u','v','w','x','y','z',' '};
    public static int[] number = new int[]{0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0};

    public static String makecode(FileInputStream stream) throws IOException {
        //讀取文件(緩存字節流)
        BufferedInputStream in = new BufferedInputStream(stream);
        //一次性取多少字節
        byte[] bytes = new byte[2048];
        //接受讀取的內容(n就代表的相關數據，只不過是數字的形式)
        int n = -1;
        String a = null;
        //循環取出數據
        while ((n = in.read(bytes, 0, bytes.length)) != -1) {
            //轉換成字符串
            a = new String(bytes, 0, n, "GBK");
        }

        // 對文件內容進行計數
        count(a);

        return a;
    }

    // 實現對文件內容計數，內層循環依次比較字符串中的每個字符與對應字符是否相同，相同時計數；外層循環指定對應字符從a至空格
    public static void count(String str){
        for (int i = 0;i < 27;i++){
            int num = 0;
            for (int j = 0;j < str.length();j++){
                if (str.charAt(j) == word[i]){
                    num++;
                }
            }
            number[i] += num;
        }
    }

    public static char[] getWord() {
        return word;
    }

    public static int[] getNumber() {
        return number;
    }
}

HuffmanTest類

HuffmanTest類進行了文件的讀取，構造哈夫曼樹，編碼，解碼，文件的寫入五個步驟，其中前三個步驟使用之前三個類中的方法即可實現，這裏主要說一下後兩個步驟。
解碼：解碼部分使用一個列表list4將編碼結果的字符串轉化到列表中去，然後定義了兩個變量，第一個變量用於每次依次獲取的編碼值，然後與list3（存儲編碼的列表）進行比較找到對應索引，然後將list2（存儲字母的列表）中對應索引值位置的字母加入第二個變量中，每次循環後刪除列表list4的第一個元素，循環直至list4為空時結束，第二個變量temp1中存儲的即為解碼結果。
文件寫入：文件寫入就是很簡單的方法使用，這裏使用的是字符操作流（使用FileWriter類和FileReader類）的方法。

// 進行解碼
List<String> list4 = new ArrayList<>();
for (int i = 0;i < result.length();i++){
    list4.add(result.charAt(i) + "");
}
String temp = "";
String temp1 = "";
while (list4.size() > 0){
    temp += "" + list4.get(0);
    list4.remove(0);
    for (int i = 0;i < list3.size();i++){
        if (temp.equals(list3.get(i))){
            temp1 += "" + list2.get(i);
            temp = "";
        }
    }
}
System.out.println("文件解碼結果為： " + temp1);

// 寫入文件
File file = new File("C:\\Users\\45366\\IdeaProjects\\fwq20172303_Programming\\HuffmanTest2.txt");
Writer out = new FileWriter(file);
out.write(result);
out.close();

參考資料

20172303 2017-2018-2 《程序設計與數據結構》第9周學習總結
哈夫曼樹

20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼

20172305 2018-2019-1 藍墨雲班課實驗--哈夫曼樹的編碼

20172305 2018-2019-1 藍墨雲班課實驗--哈夫曼樹的編碼實驗要求設有字符集：S={a,b,c,d,e，f,g,h,i,j,k,l,m,n.o.p.q,r,s,t,u,v,w,x,y,z}。給定一個包含26個英文字母的檔案，統計每個字元出現的概率，根據計算的概率構造一顆哈夫曼樹

數據結構——哈夫曼樹

向上重點 ble reorder 子節點 please pre 哈夫曼 .html 轉自：http://www.cnblogs.com/skywang12345/p/3706833.html 哈夫曼樹的介紹 Huffman Tree，中文名是哈夫曼樹或霍夫曼樹，它是最

20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼

exce eat temp 基礎第一個最小 charat 轉換 except 20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼哈夫曼樹簡介定義：給定n個權值作為n個葉子結點，構造一棵二叉樹，若帶權路徑長度達到最小，稱這樣的二叉樹為最

20172303 2018-2019-1《程式設計與資料結構》哈夫曼樹編碼與解碼

20172303 2018-2019-1《程式設計與資料結構》哈夫曼樹編碼與解碼哈夫曼樹簡介定義：給定n個權值作為n個葉子結點，構造一棵二叉樹，若帶權路徑長度達到最小，稱這樣的二叉樹為最優二叉樹，也稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。

20172314 《程序設計與數據結構》實驗報告——樹

poll tex 差異 maximum 結構 ann getent ins com 課程：《程序設計與數據結構》班級： 1723 姓名：方藝雯學號：20172314 實驗教師：王誌強實驗日期：2018年11月8日必修/選修：必修 1、實驗內容及要求實驗二-1

資料結構與演算法 -- 哈夫曼樹思想與建立詳解1

PS:什麼是哈夫曼樹？　　給定n個權值作為n個葉子結點，構造一棵二叉樹，若該樹的帶權路徑長度達到最小，稱這樣的二叉樹為最優二叉樹，也稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。計算規則：　　假設一組權值，一個權值是一個結點，12 &

數據結構_二叉樹Ⅲ——堆與優先隊列

最大 info 否則但我 com urn med 小根堆父親堆（Heap）堆是一種完全二叉樹，只是是用數組的形式表示二叉樹而已它其實是利用完全二叉樹的結構來維護一組數據例如這樣一棵完全二叉樹：它用堆的形式表現就是這樣的：當然，一般的堆每個元

【資料結構與演算法】利用哈夫曼樹進行檔案壓縮（部分借鑑網上內容）

哈夫曼編碼(Huffman Coding)，又稱霍夫曼編碼，是一種編碼方式，哈夫曼編碼是可變字長編碼(VLC)的一種。Huffman於1952年提出一種編碼方法，該方法完全依據字元出現概率來構造異字頭的平均長度最短的碼字，有時稱之為最佳編碼，一般就叫做Huffman編碼（

哈夫曼樹建立與求最短帶權路徑長度

#include<stdio.h> #include<stdlib.h> #define n 7 //假設有七個節點元素 struct Element { int flag; int weig

20172303 2018-2019-1 《程序設計與數據結構》第一周學習總結

tps 算法分析加法增加練習題系列質量體系找到可移植性 20172303 2018-2019-1 《程序設計與數據結構》第一周學習總結教材學習內容總結第1章概述 1.軟件工程定義：一門關於高質量軟件開發的技術和理論的學科。目標：軟件工程的目標與其他

20172303 2018-2019-1 《程序設計與數據結構》第2周學習總結

min delet 個數特征 static ... 順序 from 輸出 20172303 2018-2019-1 《程序設計與數據結構》第2周學習總結教材學習內容總結第3章集合概述————棧一、集合定義：一種聚集、組織了其他對象的對象。集合的分類按保存

20172303 2018-2019-1 《程序設計與數據結構》第3周學習總結

aci 效率 link 數據移動數組 emp logs 雙端隊列 20172303 2018-2019-1 《程序設計與數據結構》第3周學習總結教材學習內容總結本周學習了課本第五章的內容，主要介紹了一種新的線性集合——隊列。講解了關於隊列的相關概念以及使用鏈表和數

20172303 2018-2019-1《程序設計與數據結構》第4周學習總結

net for循環記錄通過次數 number logs char cti 20172303 2018-2019-1《程序設計與數據結構》第4周學習總結教材學習內容總結一、隊列概述概念：列表是使事物以線性的方式進行組織的線性集合。特點：列表集合的容量可以隨著需

20172303 2018-2019-1 《程序設計與數據結構》第5周課堂實踐報告

查找算法有序排列大於繼續 ava src 存儲結構過程 20172303 2018-2019-1 《程序設計與數據結構》第5周課堂實踐報告課程：《程序設計與數據結構》班級： 1723 姓名：範雯琪學號：20172303 實驗教師：王誌強助教：張師瑜/

20172303 2018-2019-1《程序設計與數據結構》第7周學習總結

備註考試 roo strong findmi .get http 分享可能 20172303 2018-2019-1《程序設計與數據結構》第7周學習總結教材學習內容總結本周在上周學習了二叉樹的基礎上，學習了一種二叉樹的特殊形式——二叉查找樹，又叫有序二叉樹、排序二

20172303 2018-2019-1 《程序設計與數據結構》實驗二報告

課本 min() 源碼解析成員變量平衡完整情況下 vat access 20172303 2018-2019-1 《程序設計與數據結構》實驗二報告課程：《程序設計與數據結構》班級： 1723 姓名：範雯琪學號：20172303 實驗教師：王誌強助教：張

20172303 2018-2019-1《程序設計與數據結構》第9周學習總結

廣度優先遍歷排列第六周如果情況 ota 信息 head 安排 20172303 2018-2019-1《程序設計與數據結構》第9周學習總結教材學習內容總結常見的非線性結構有兩種——樹和圖，在經過了三周對樹的學習之後，本周我們接觸了另一種非線性結構圖的相關內容，

20172303 2018-2019-1 《程序設計與數據結構》實驗三報告

get end tree equals ner 後者 else if ide second 20172303 2018-2019-1 《程序設計與數據結構》實驗三報告課程：《程序設計與數據結構》班級： 1723 姓名：範雯琪學號：20172303 實驗教師：王誌

20172315 2018-2019-1 《程序設計與數據結構》第一周學習總結

之間 https 加法任務工程規則位置 href for 20172315 2018-2019-1 《程序設計與數據結構》第一周學習總結教材學習內容總結第一章正確性：軟件遵守其特定要求的程度。可靠性：軟件故障的頻率和重要性。健壯性：很好地處理錯誤情況的程

20172324 2018-2019-1 《程序設計與數據結構》第一周學習總結

htm baidu img 等於法規函數數據結構方式環境 20172324 2018-2019-1 《程序設計與數據結構》第一周學習總結教材學習內容總結概述軟件質量準確性：軟件提供的功能是否正確（用戶需要的）可靠性：產品在規定的條件下，在規定的時間內

20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼

20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼

哈夫曼樹簡介

哈夫曼樹代碼實現

HuffmanNode類

HuffmanTree類

HuffmanMakeCode類

HuffmanTest類

參考資料

相關推薦