資料結構之二叉樹應用（哈夫曼樹及哈夫曼編碼實現）（C++）

阿新 • • 發佈：2019-01-23

一、哈夫曼樹

1.書上用的是靜態連結串列實現，本文中的哈夫曼樹用排序連結串列實現；2.實現了從字元頻率統計、構建權值集合、建立哈夫曼樹、生成哈夫曼編碼，最後對給定字串的編碼、解碼功能。3.使用到的 “SortedList.h”標頭檔案，在上篇博文：資料結構之排序單鏈表。

二、構建過程

三、程式碼

//檔名："HfmTree.h"
#pragma once
#include "SortedList.h"		//"C1_Test.h" 排序列表
#include <string>
using namespace std;
/*
.	二叉樹應用：哈夫曼樹及哈夫曼編碼實現
.	儲存結構：三叉連結串列
*/

//哈夫曼樹結點
struct HTNode
{
	char c;					//字元域
	int weight;				//權重
	HTNode * parent;		//雙親結點
	HTNode * lchild;		//左指標域
	HTNode * rchild;		//右指標域
	friend ostream & operator <<(ostream& out, HTNode *p)
	{
		/*
		.	友元函式過載輸出操作符，實現物件輸出
		*/
		out << "(" << p->c << ":" << p->weight << ")";
		return out;
	}
};

class HfmTree
{
private:
	/*
	.	詞頻陣列
	.	目前支援：英文字元（含大小寫），共52個
	*/
	static const int _ARR_SIZE = 52;			//詞頻陣列大小
	static const char _START_C = 'a';			//詞頻陣列 0 下標對應的 字元 'a'
	static const int _MAGNIFICATION = 100;		//詞頻放大倍數
	int charFreqArr[_ARR_SIZE]{0};				//詞頻陣列（含大小寫），初始化為 0
	string charCodeArr[_ARR_SIZE]{ "" };		//字元編碼陣列

	void _Arr_StatisticCharFreq(string &s);		//統計字元頻率

	/*
	,	權值集合排序單鏈表
	*/
	SortedList<HTNode> * varySet;				//變化的權值集合 連結串列（用於構建哈夫曼樹根結點的生成）
	SortedList<HTNode> * originSet;				//初始的權重集合 連結串列（用於存放 葉節點指標）
	
	/*
	.	哈夫曼樹
	*/
	HTNode * root;								//哈夫曼樹根結點
	int leafNum;								//葉結點數
	void _CreateWeightSet();					//建立權值集合（排序單鏈表）
	void _CreateHfmTree();						//構建哈夫曼樹
	void _GenerateHfmCode();					//生成哈夫曼編碼

public:
	HfmTree();									//無參構造
	void Init(string &s);						//初始化字串
	void HfmCodeDisplay();						//顯示哈夫曼編碼
	string Encoding(string s);					//編碼
	string Decoding(string s);					//解碼
};

//檔名："HfmTree.cpp"
#include "stdafx.h"
#include <iostream>
#include <string>
#include "HfmTree.h"
using namespace std;

int _HTNode_Compare(HTNode * e1, HTNode *e2)
{
	/*
	.	實現 SortedList 類的 compare 介面
	*/
	if (e1->weight > e2->weight)
		return 1;
	else if (e1->weight == e2->weight)
		return 0;
	else
		return -1;
}

HfmTree::HfmTree()
{
	/*
	.	無參構造
	*/
	//初始化變化集合連結串列
	this->varySet = new SortedList<HTNode>();
	this->varySet->Init(_HTNode_Compare, this->varySet->_ASC);
	//初始化原始集合連結串列
	this->originSet = new SortedList<HTNode>();
	this->originSet->Init(_HTNode_Compare, this->originSet->_ASC);
	//初始化哈夫曼樹 及 葉節點數
	this->root = NULL;
	this->leafNum = 0;
}

void HfmTree::Init(string &s)
{
	/*
	.	初始化字串，並構建哈夫曼樹
	*/
	//1.字元頻率統計
	_Arr_StatisticCharFreq(s);
	//2.建立權值集合單鏈
	_CreateWeightSet();
	//3.建立哈夫曼樹
	_CreateHfmTree();
	//4.生成哈夫曼編碼
	_GenerateHfmCode();
}

void HfmTree::_Arr_StatisticCharFreq(string &s)
{
	/*
	.	統計字元頻率
	*/
	//指標 p 指向詞頻陣列
	int * p = this->charFreqArr;
	int sum = s.length();	//總字元數
	char c = '\0';
	//詞頻統計
	for (int i = 0; i < (int)s.length(); i++)
	{
		c = s[i];
		p[c - this->_START_C]++;	//52個字元（a-z|A-Z）陣列基底 0 為 'a'
	}
	//詞頻陣列 歸一化
	for (int i = 0; i < this->_ARR_SIZE; i++)
	{
		p[i] = (int)(p[i] * this->_MAGNIFICATION / sum);	//放大 100 倍（若某些字元權重太小，可擴大倍數）
	}
}

void HfmTree::_CreateWeightSet()
{
	/*
	.	構建哈夫曼樹
	*/
	//哈夫曼結點變數
	HTNode * node = NULL;
	//指標 p 指向詞頻陣列
	int * p = this->charFreqArr;
	//遍歷詞頻陣列
	for (int i = 0; i < this->_ARR_SIZE; i++)
	{
		if (p[i] == 0)
			continue;
		//初始化 樹結點
		node = new HTNode;
		node->c = (char)(i + this->_START_C);	//取字元
		node->weight = p[i];					//取權重
		node->parent = NULL;
		node->lchild = NULL;
		node->rchild = NULL;
		//順序插入 權重集合單鏈表
		this->varySet->Insert(node);
	}
	//顯示集合
	this->varySet->Display();
}

void HfmTree::_CreateHfmTree()
{
	/*
	.	建立哈夫曼樹
	*/
	//初始化 樹結點
	HTNode *first = NULL, *second = NULL, *newNode = NULL;
	//權值集合 元素結點數 只剩一個時，結束
	while (this->varySet->Length() > 1)
	{
		//獲取並刪除 權值集合前兩個元素 （集合升序排列，前兩個為權值最小）
		first = this->varySet->Delete(1);
		second = this->varySet->Delete(1);
		//構建 新權值 根結點，並初始化
		newNode = new HTNode;
		newNode->c = '\0';
		newNode->weight = first->weight + second->weight;	//權值相加
		newNode->parent = NULL;
		newNode->lchild = first;
		newNode->rchild = second;
		//賦值 兩個結點的 雙親
		first->parent = newNode;
		second->parent = newNode;
		//並將新結點 順序插入集合，並顯示集合
		this->varySet->Insert(newNode);
		this->varySet->Display();
		//將刪除的兩個元素結點（非後建的根結點），加入到 初始集合 中，並顯示
		if (first->c != '\0')
			this->originSet->Insert(first);
		if (second->c != '\0')
			this->originSet->Insert(second);
		this->originSet->Display();
	}
	//取權重集合鏈 第一個元素 作為 哈夫曼樹根
	this->root = this->varySet->Delete(1);
}

void HfmTree::_GenerateHfmCode()
{
	/*
	.	生成哈夫曼編碼
	*/
	HTNode * p = NULL, *q = NULL;
	char c = '\0';
	//遍歷葉子結點（初始權重集合）
	for (int i = 0; i < this->originSet->Length(); i++)
	{
		//獲取葉結點
		p = this->originSet->Get(i + 1);
		//獲取字元
		c = p->c;
		//從葉節點 到 根 的遍歷
		while (p->parent != NULL)
		{
			//q 取 p 的根結點
			q = p->parent;
			if (q->lchild == p)
				this->charCodeArr[c - this->_START_C] = "0" + this->charCodeArr[c - this->_START_C];
			else
				this->charCodeArr[c - this->_START_C] = "1" + this->charCodeArr[c - this->_START_C];
			//p 向根移動
			p = p->parent;
		}
		//置空 遊走指標
		p = NULL;
		q = NULL;
	}
}

void HfmTree::HfmCodeDisplay()
{
	/*
	.	顯示哈夫曼編碼
	*/
	HTNode *p = NULL;
	for (int i = 0; i < this->originSet->Length(); i++)
	{
		p = this->originSet->Get(i + 1);
		cout << "(" << p->c << ":" << p->weight << ":" <<  this->charCodeArr[p->c - this->_START_C] << ")" << endl;
	}
}

string HfmTree::Encoding(string s)
{
	/*
	.	編碼
	*/
	//初始化編碼字串
	string encodingStr = "";
	//遍歷字符集
	for (int i = 0; i < (int)s.length(); i++)
	{
		encodingStr = encodingStr + this->charCodeArr[s[i] - this->_START_C];
	}
	return encodingStr;
}

string HfmTree::Decoding(string s)
{
	/*
	.	解碼
	*/
	//初始化 解碼字串
	string decodingStr = "";
	//初始化結點指標：p 指向哈夫曼樹根結點
	HTNode *p = this->root;
	//初始化 編碼： 0 1
	int code = 0;
	//遍歷碼串
	for (int i = 0; i < (int)s.length(); i++)
	{
		//從根 遍歷，按碼串路徑 尋葉子結點
		while (p->lchild != NULL && p->rchild != NULL)
		{
			//取字元碼 0 或 1，轉換成 整型
			code = s[i] - '0';
			// 0|左子樹  1|右子樹
			if (code == 0)
				p = p->lchild;
			else
				p = p->rchild;
			//自增 i
			i++;
		}
		//抵消一次自增
		i--;
		//葉節點字元拼接
		decodingStr = decodingStr + p->c;
		//指標 p 置到 根結點
		p = this->root;
	}
	return decodingStr;
}

//檔名："HfmTree_Test.cpp"
#include "stdafx.h"
#include <iostream>
#include "HfmTree.h"
using namespace std;

int main()
{
	//利用 s 構建哈夫曼樹
	string s = "abcadefa";
	HfmTree * t = new HfmTree();
	t->Init(s);
	t->HfmCodeDisplay();

	//在構造的哈夫曼樹基礎上，測試 編碼 解碼
	string s1 = "aaacdeefccccee";	//編碼的字元範圍不可超過 構建哈夫曼樹時的葉節點字符集 範圍
	string s2 = t->Encoding(s1);
	cout << "原文：" << s1 << endl;
	cout << "碼文：" << s2 << endl;
	cout << "解碼文：" << t->Decoding(s2) << endl;

	return 0;
}

資料結構之二叉樹應用（哈夫曼樹及哈夫曼編碼實現）（C++）

一、哈夫曼樹1.書上用的是靜態連結串列實現，本文中的哈夫曼樹用排序連結串列實現；2.實現了從字元頻率統計、構建權值集合、建立哈夫曼樹、生成哈夫曼編碼，最後對給定字串的編碼、解碼功能。3.使用到的 “SortedList.h”標頭檔案，在上篇博文：資料結構之排序單鏈表。

資料結構之二叉搜尋樹（BST）

JavaScript實現二叉搜尋樹（BST）二叉搜尋樹定義二叉搜尋樹JavaScript程式碼實現 1. 二叉搜尋樹二叉查詢樹（英語：Binary Search Tree），也稱為二叉搜尋樹、有序二叉樹（ordered binary tree）或排序二

Ikaros的資料結構之二叉樹（基礎概念部分）

二叉樹（Binary Tree）在瞭解二叉樹之前你需要了解如下內容： 1.樹（Tree）：是一種非線性資料結構（非線性資料結構包含樹和圖） ①樹的資料結構：相關術語 a.根節點（root）：樹中沒有前驅的結點注：一棵樹中只有一個根節點 b.葉子結點（le

【資料結構之二叉樹】（一）B樹、B-樹、B+樹、B*樹介紹，和B+樹更適合做檔案索引的原因

今天看資料庫，書中提到：由於索引是採用 B 樹結構儲存的，所以對應的索引項並不會被刪除，經過一段時間的增刪改操作後，資料庫中就會出現大量的儲存碎片，這和磁碟碎片、記憶體碎片產生原理是類似的，這些儲存碎片不僅佔用了儲存空間，而且降低了資料庫執行的速度。如果發現索引

資料結構之二叉查詢樹（C語言實現）

資料結構之二叉查詢樹 1. 二叉查詢樹的定義二叉查詢樹（binary search tree）是一棵二叉樹，或稱為二叉搜尋樹，可能為空；一棵非空的二叉查詢樹滿足一下特徵：每個元素有一個關鍵字，並且任意兩個元素的關鍵字都不同；因此，所有的關鍵字都是唯

資料結構之二叉排序樹（C語言實現）

一、基本概念1.二叉排序樹二叉排序樹（Binary sort tree，BST），又稱為二叉查詢樹，或者是一棵空樹；或者是具有下列性質的二叉樹： (1)若它的左子樹不為空，則左子樹上所有節點的值均小於它的根節點的值； (2)若它的右

【資料結構之二叉樹】（二）B+樹比B樹更適合做檔案索引的原因

原因：相對於B樹，（1）B+樹空間利用率更高，可減少I/O次數，一般來說，索引本身也很大，不可能全部儲存在記憶體中，因此索引往往以索引檔案的形式儲存的磁碟上。這樣的話，索引查詢過程中就要產生磁碟I/O消耗。而因為B+樹的內部節點只是作為索引使用，而不像B-樹那樣每個節點都需要儲存硬碟指標。

Python資料結構之二叉樹（涵蓋了構建、刪除、查詢、字典轉換、非遞迴與遞迴遍歷等）

MyTree.py #coding=utf-8 import math class BinTree: def __init__(self): self.root=None def is_empty(self):

資料結構之二叉樹篇卷三 -- 二叉樹非遞迴遍歷（With Java)

Nonrecursive Traversal of Binary Tree First I wanna talk about why should we use <code>Stack</code> to implement this algorithm. I think it is

C Primer Plus--高階資料結構之二叉樹

目錄二叉搜尋樹 Binary Search Tree 用C構建二叉樹ADT 樹結構的定義 C Primer Plus--高階資料結構表示之二叉樹二叉搜尋樹 Binary Search Tree 二叉樹是一種高階資料結構。樹中的每個節點都包含一個專案和兩個指向其他

python資料結構之二叉樹

這裡用python 實現了二叉樹 # Definition for a binary tree node. class TreeNode: def __init__(self, x): self.val = x self.left =

java資料結構之二叉排序樹

binary sort tree / binary search tree 性質： 1.若左子樹不為空，則左子樹上所有節點的值均小於它的根節點的值。 2.若右子樹不為空，則右子樹上所有節點的值均大於它的根節點的值。 3.左右子樹也是二叉排序樹。 4.沒有值相同的節點

資料結構之二叉樹

二叉樹的性質在二叉樹的第iii層上至多有2i−12^{i-1}2i−1個結點(i≥1)(i \geq 1)(i≥1)。深度為kkk的二叉樹至多有2k−12^{k}-12k−1個結點(k≥1)(k\geq 1)(k≥1)。對任何一棵二叉樹TTT，如果其終端

資料結構之二叉查詢樹Java實現原始碼及註釋

二叉查詢樹（Binary Search Tree），（又：二叉搜尋樹，二叉排序樹）它或者是一棵空樹，或者是具有下列性質的二叉樹：若它的左子樹不空，則左子樹上所有結點的值均小於它的根結點的值；若它的右子樹不空，則右子樹上所有結點的值均大於它的根結點的值；它的左、右子樹也分別為二叉排序樹。以下是樓主用jav

Ted 帶你學習資料結構之二叉堆（Binary Heap）

二叉堆（Binary Heap）（1）structure property Heap（堆）是一個除了底層節點外的完全填滿的二叉樹，底層可以不完全，左到右填充節點。（a heap is a binar

Python3&資料結構之二叉樹

實現二叉樹以及遍歷在電腦科學中，二叉樹是每個結點最多有兩個子樹的樹結構。通常子樹被稱作“左子樹”（left subtree）和“右子樹”（right subtree）。二叉樹常被用於實現二叉查詢樹和二叉堆。二叉樹是遞迴定義的，其結點有左右子樹之分，邏輯上二叉樹有五種基本

資料結構之二叉樹基本功能的實現

二叉樹的各種性質在這裡不再重複，本文實現二叉樹的基本操作，包括建立、前序輸出、中序輸出、後序輸出、刪除二叉樹、葉子結點個數、葉子節點的值、交換左右子樹 1.首先建立結構體： typedef struct Tree_Node{ char ch; struct

資料結構之二叉排序樹

上一節我們介紹了二分（折半）查詢，也瞭解了它的優缺點。二分查詢的特點:二分查詢能夠提高有序表中資料元素的查詢速度；二分查詢的時間複雜度為O(log2n)；二分查詢是一種靜態查詢二分查詢的不足：當查詢表經常變化時，二分查詢的整體效能急劇下降。二分查詢的硬傷：二分查詢基於有序表。

Java版資料結構之二叉排序樹

簡介新增結點查詢結點刪除結點程式碼實現 public class MyBinarySortTree { int data;//結點權值 MyBinarySortTree leftTree;//左子樹 MyBinarySort

資料結構之"二叉樹的三種遍歷方法"

1、什麼是二叉樹定義：有且僅有一個根節點，每個節點只有一個父節點，最多含有兩個子節點，子節點有左右之分。 2、二叉樹的遍歷二叉樹是一種樹形結構，遍歷就是要讓樹中的節點被且僅被訪問一次，即按一定規律排列成一個線性佇列。二叉樹是一種遞迴定義的結構，包含三個部分：根節點（

資料結構之二叉樹應用（哈夫曼樹及哈夫曼編碼實現）（C++）

一、哈夫曼樹

二、構建過程

三、程式碼

相關推薦