樹：哈夫曼樹的建立與編碼解碼

阿新 • • 發佈：2018-11-26

哈夫曼樹

哈夫曼樹即最優二叉樹，演算法如下：
（1）在當前未使用結點中找出兩個權重最小的作為左右孩子，計算出新的根結點
（2）新的根結點繼續參與過程（1），直至所有結點連線為一棵樹

如下圖，symbol為具體字元，Frequency為出現頻率（權重）
頻率表

Huffman樹構建過程

特點：只有度數為0和2的結點

C語言靜態連結串列實現哈夫曼樹

實現功能：輸入一段英文文字，統計各字元出現次數作為權重，以當前字符集生成哈夫曼樹，給出所有字元及指定編碼與文字編碼，再將編碼後的文字解碼為原文

資料結構定義

下標	資料域	父結點下標	左子樹下標	右子樹下標

typedef char ElementType;
typedef struct {
	ElementTree data;	結點資料
	int weight;	結點權重
	int parent;		雙親下標
	int left, right;		左右子樹下標
}HuffmanTree;

統計字元及初始化靜態連結串列
用下標從32 ~ 126的陣列記錄ASCII碼32 ~ 126的字元，包含了英文文字的絕大多數字符

int num = 1;當前靜態連結串列有效長度 [1,num)
char text[2005];//文字源 


char *textAnalyze() {//返回字符集中字元個數的陣列
	char *chars = (char *)malloc(sizeof(char)*127);//32~126
	char c = 0;
	memset(chars, 0, sizeof(char)*127);
	scanf("%[^\n]", text);
	int i = 0;
	while (c = text[i++]) {
		chars[c]++;//計數
	}
	for (i = 32; i <= 126; i++) {
		if (chars[i]) {
			printf("字元%c 出現%d次\n", i, chars[ 
i]);
		}
	}
	return chars;
}

void initElement(HuffmanTree *nodes, char *chars) {
	memset(nodes, 0, sizeof(char) * sizeof(HuffmanTree) * 200);
	for (int i = 32; i <= 126; i++) {
		if (chars[i]) {
			nodes[num].data = i;
			nodes[num].weight = chars[i];
			nodes[num].parent = nodes[num].left = nodes[num].right = 0;
			num++;//全域性變數記錄當前結點總數
		}
	}
	free(chars);
}///////初始化靜態連結串列完畢

eg:
輸入為affgghhhjjj

此時靜態連結串列為

下標	資料域	權重
1	a	1
2	f	2
3	g	2
4	h	3
5	j	3

建立哈夫曼樹

void createHuffmanTree(HuffmanTree *nodes) {
	每次連線兩個結點，生成一個新結點，連線完成應該生成n-1個結點
	故	n個結點建立的哈夫曼樹應當有2n-1個結點
	int end = num + num - 3;//計算總結點數
	int *min = NULL;
	while (num != end+1) {
		min = searchOrder(nodes);
		//製作新結點
		nodes[num].weight = nodes[min[0]].weight + nodes[min[1]].weight;
		nodes[num].left = min[0];
		nodes[num].right = min[1];
		//填補原結點
		nodes[min[0]].parent = num;
		nodes[min[1]].parent = num;
		num++;
		free(min);
	}
}

其中searchOrder( )返回當前權重最小值與次小值的下標

int *searchOrder(HuffmanTree *nodes) {// num>=2
	int *nums = (int *)malloc(sizeof(int) * 2);
	int i = 1;
	for (; i < num&&nodes[i].parent != 0; i++);//nodes[i].parent == 0 可用
1*-	nums[0] = i;//        0  pre      1 later
	for (i++; i < num&&nodes[i].parent != 0; i++);
	nums[1] = i;//找到初始兩下標
	for (i++; i < num; i++) {
		if (nodes[i].parent == 0) {//未使用
			if (nodes[i].weight < nodes[nums[1]].weight) {//  <min
				nums[1] = i;
			}
			else if (nodes[i].weight < nodes[nums[0]].weight) {
				nums[0]=nums[1],nums[1] = i;
			}
		}//按出現順序生成最優二叉樹
	}
	return nums;
}

此時的哈夫曼樹為

下標	資料域	權重	父結點下標	左子樹下標	右子樹下標
1	a	1	6	0	0
2	f	2	6	0	0
3	g	2	7	0	0
4	h	3	7	0	0
5	j	3	8	0	0
6		3	8	1	2
7		5	9	3	4
8		6	9	5	6
9		11	0	7	8

可以看出葉子結點左右孩子均為0，根結點父結點域為0

哈夫曼編碼

字首編碼：每個字元的編碼都不為其餘編碼的字首
非字首編碼：存在某字元的編碼是其餘某編碼的字首
（沒錯就是這麼扭曲）

所有參與編碼的字元都在葉子結點上，因此保證編碼為字首編碼

哈夫曼編碼：走左子樹為0，走右子樹為1。從樹根走到葉子結點組成的01序列
哈夫曼編碼是字首編碼

遍歷哈夫曼樹得到每個葉子結點的編碼


typedef struct {
	ElementTree data;字元
	char hfCode[115];該字元對應的編碼序列
}HfCode;
HfCode codes[111];儲存每個字元的哈夫曼編碼
int charNum = 0;//字符集中的字元個數 [0,num)
char encodedText[4005];//編碼後的文字

void encodeAll(HuffmanTree *nodes, int index, char *order, int cnt) {
	if (nodes[index].left == nodes[index].right) {
		printf("%c : ", nodes[index].data);
		order[cnt] = 0;
		puts(order);
		codes[charNum].data = nodes[index].data;
		strcpy(codes[charNum++].hfCode,order);
	}
	if (nodes[index].left) {
		order[cnt] = '0';
		encodeAll(nodes, nodes[index].left, order, cnt+1);
		order[cnt] = '1';
		encodeAll(nodes, nodes[index].right, order, cnt+1);
	}
}

從葉子結點走到根得到該葉子的編碼

void getCodeByChar(HuffmanTree *nodes, char leaf) {//得到某個葉子節點的編碼
	int index;
	int end = num / 2;
	for (index = 0; index <= end; index++) {
		if (nodes[index].data == leaf)
			break;
	}
	if (index > end) {
		printf("輸入有誤！");
		return;
	}
	char order[115];
	int cnt = 0;
	while (nodes[index].parent) {不為根
		order[cnt++] = nodes[nodes[index].parent].left == index ? '0' : '1';
		index = nodes[index].parent;
	}
	printf("%c : ", leaf);
	for (cnt--; cnt >= 0; cnt--) {
		printf("%c", order[cnt]);
	}
	printf("\n");
}

在建立哈夫曼樹並得到各字元編碼的基礎上對整個文字進行編碼/解碼就十分容易了

void encodeText(HuffmanTree *nodes) {//編碼
	int i, j, len = strlen(text);
	printf("該資訊為：\n%s\n", text);
	printf("該資訊的哈夫曼編碼為：\n");
	for (i = 0; i < len; i++) {
		for (j = 0; j < charNum&&codes[j].data != text[i]; j++);
			strcat(encodedText, codes[j].hfCode);
	}
	printf("%s\n",encodedText);
}

void decodeText(HuffmanTree *nodes, char *unknown) {//解碼
	int len = strlen(unknown);
	int root = num - 1;
	int i, index;
	for (i = 0, index = root; i < len; i++) {
		index = unknown[i] == '0' ? nodes[index].left : nodes[index].right;
		if (nodes[index].left == 0) {
			printf("%c", nodes[index].data);
			index = root;
		}
	}
}

解碼的主要思路是從哈夫曼樹的根開始，遍歷整個01序列，按照編碼的方式，0向左走，1向右走，走到葉子結點輸出，即譯出一個字元，迴圈變數重新回到根結點繼續解譯下一個字元。因為字首編碼的前提保證，不會有歧義。

2019/11/19

樹：哈夫曼樹的建立與編碼解碼

哈夫曼樹哈夫曼樹即最優二叉樹，演算法如下：（1）在當前未使用結點中找出兩個權重最小的作為左右孩子，計算出新的根結點（2）新的根結點繼續參與過程（1），直至所有結點連線為一棵樹如下圖，symbol為具體字元，Frequency為出現頻率（權重）特點：只有度數為

資料結構圖文解析之：哈夫曼樹與哈夫曼編碼詳解及C++模板實現

0. 資料結構圖文解析系列 1. 哈夫曼編碼簡介哈夫曼編碼（Huffman Coding）是一種編碼方式，也稱為“赫夫曼編碼”，是David A. Huffman1952年發明的一種構建極小多餘編碼的方法。在計算機資料處理中，霍夫曼編碼使用變長編碼表對源符號進行編碼，出現頻率較高的源符號採用較短的編碼，

#資料結構與演算法學習筆記#PTA17：哈夫曼樹與哈夫曼編碼 Huffman Tree & Huffman Code（C/C++）

2018.5.16 最近一段時間忙於實驗室各種專案和輔導員的各種雜活，間隔了半周沒有耐下心學習。導師最近接了一個要PK京東方的專案讓我來做總負責，確實是很驚喜了。責任心告訴我不能把工作做水了，但是還是嘗試把實權移交給師兄們比較好。這道題可以說是樹這塊的壓軸題了，無論是程

資料結構與演算法：哈夫曼樹

哈夫曼樹給定N個權值作為N個葉子結點，構造一棵二叉樹，若該樹的帶權路徑長度達到最小，稱這樣的二叉樹為最優二叉樹，也稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。重要概念路徑：從一個節點到它往下可以達到的節點所經shu過的所有節點，稱為兩個節點之間的路徑

轉載：哈夫曼樹的構造和哈夫曼編碼（C++代碼實現）

作者 pos blank 字符 element start man null == 作者：qiqifanqi 原文：http://blog.csdn.net/qiqifanqi/article/details/6038822 #include<stdio.h>

Java資料結構和演算法：哈夫曼樹

本章介紹哈夫曼樹。和以往一樣，本文會先對哈夫曼樹的理論知識進行簡單介紹，然後給出C語言的實現。後續再分別給出C++和Java版本的實現；實現的語言雖不同，但是原理如出一轍，選擇其中之一進行了解即可。若文章有錯誤或不足的地方，請幫忙指出！哈夫曼樹的介紹

滿二叉樹、完全二叉樹、平衡二叉樹、哈夫曼樹

滿二叉樹：除了葉節點外每一個結點都有左右子女且葉節點都處在最底層的二叉樹。這個滿二叉樹應該很好想象，就是一顆非常完美的樹，除了葉節點其他節點都有兩個孩子。完全二叉樹：只有最下面的兩層結點度小於2，並且最下面一層的結點都集中在該層最左邊的若干位置的二叉樹。也

資料結構複習（十二）之平衡二叉樹及哈夫曼樹

平衡二叉樹需要保證在插入和刪除二叉樹結點時，任意結點的左、右子樹的高度差絕對值不超過1，所以平衡二叉樹或者為一棵空樹，或者為具有左子樹和右子樹都為平衡二叉樹的性質。插入和刪除時出現不滿足條件時可進行一定的調整，分為LL平衡旋轉、RR平衡旋轉、LR平衡旋轉、RL平衡杆旋轉。

樹之哈夫曼樹（最優二叉樹）

本文來介紹哈夫曼樹。哈夫曼樹又叫最優二叉樹，是一種特殊的二叉樹。這種二叉樹最重要的特徵就是：樹的帶權路徑長度(Weighted Path Length of Tree，簡記為WPL)最小。本文給出了哈弗曼演算法的實現過程，程式碼部分已經描述的比較詳細，這裡就

【哈夫曼樹】哈夫曼樹的實現以及哈弗曼編碼

基本概念 1、路徑和路徑長度在一棵樹中，從一個結點往下可以達到的孩子或孫子結點之間的通路，稱為路徑。通路中分支的數目稱為路徑長度。若規定根結點的層數為1，則從根結點到第L層結點的路徑長度為L-1。 2、結點的權及帶權路徑長度若將樹中結點賦給一個有著某

最優二叉樹（哈夫曼樹）知識點

路徑：在一棵樹中從一個結點往下到孩子或孫子結點之間的通路結點的路徑長度：從根節點到該節點的路徑上分支的數目樹的路徑長度：樹中每個結點的路徑長度之和結點的權：給樹中的結點賦予一個某種含義的值，則該

【SSLGZ 1408】（樹）哈夫曼樹(二)

問題描述從a開始的n個字母分別表示n個結點，分別代n個權值，以它們為葉子結點構造一棵哈夫曼樹（若兩節點權值相等，按照字典排序構造），最後求該哈夫曼樹路徑長。樣例輸入 7 a　b　c　d　e　

資料結構——第二章樹和森林：04哈夫曼樹與哈夫曼編碼

1.結點的路徑長度：從根結點到該結點的路徑上分支的數目。 2.樹的路徑長度：樹中每個結點的路徑長度之和。 3.樹的帶權路徑長度：樹中所有葉子結點的帶權路徑長度之和WPL(T) = ∑wklk（對所有葉子結點） 4.最優樹：在所有含n個結點，並帶相同權值的m叉樹中，必存在一棵其帶權路徑長度取最小值的樹，稱

數據結構——第二章樹和森林：04哈夫曼樹與哈夫曼編碼

一個例如 stat state 森林 ont 技術圖片 http 1.結點的路徑長度：從根結點到該結點的路徑上分支的數目。 2.樹的路徑長度：樹中每個結點的路徑長度之和。 3.樹的帶權路徑長度：樹中所有葉子結點的帶權路徑長度之和WPL(T) = ∑wklk（對所有葉子結

資料結構與演算法 -- 哈夫曼樹思想與建立詳解1

PS:什麼是哈夫曼樹？　　給定n個權值作為n個葉子結點，構造一棵二叉樹，若該樹的帶權路徑長度達到最小，稱這樣的二叉樹為最優二叉樹，也稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。計算規則：　　假設一組權值，一個權值是一個結點，12 &

建立哈夫曼樹並進行哈夫曼編碼與哈夫曼譯碼

圖例以上圖例解釋： c語言實現程式碼： #include<stdio.h> #include<malloc.h> #include<string.h> #define N 100 #define

哈夫曼樹建立與求最短帶權路徑長度

#include<stdio.h> #include<stdlib.h> #define n 7 //假設有七個節點元素 struct Element { int flag; int weig

非遞歸建立哈夫曼樹

push namespace i++ ren clas class ace %d 遞歸 #include<vector> #include<cstdio> #include<iostream> #include<algorithm

哈夫曼樹的建立

eof data scan 最小保存下標 all include urn 閑暇的夜晚，寫個哈夫曼樹練練筆。 #include<iostream>#include<cstring>#include<cstdlib>#inclu

5.2哈夫曼樹——哈夫曼樹與哈夫曼編碼

node i++ insert 編碼 urn all IV right style #include <stdio.h> #include <stdlib.h> struct TreeNode{ int Weight; Huffm

樹：哈夫曼樹的建立與編碼解碼

哈夫曼樹

C語言靜態連結串列實現哈夫曼樹

建立哈夫曼樹

哈夫曼編碼

相關推薦