哈夫曼樹的基本構建與操作

阿新 • • 發佈：2018-12-22

看到的講解huffman樹的一篇比較好懂的部落格

出處:http://blog.csdn.net/wtfmonking/article/details/17150499#

1、基本概念

a、路徑和路徑長度

若在一棵樹中存在著一個結點序列 k1，k2，……，kj，使得 ki是ki+1 的雙親（1<=i<j），則稱此結點序列是從 k1 到 kj 的路徑。

從 k1 到 kj 所經過的分支數稱為這兩點之間的路徑長度，它等於路徑上的結點數減1.

b、結點的權和帶權路徑長度

在許多應用中，常常將樹中的結點賦予一個有著某種意義的實數，我們稱此實數為該結點的權，(如下面一個樹中的藍色數字表示結點的權)

結點的帶權路徑長度規定為從樹根結點到該結點之間的路徑長度與該結點上權的乘積。

c、樹的帶權路徑長度

樹的帶權路徑長度定義為樹中所有葉子結點的帶權路徑長度之和，公式為：

其中，n表示葉子結點的數目，wi 和 li 分別表示葉子結點 ki 的權值和樹根結點到 ki 之間的路徑長度。

如下圖中樹的帶權路徑長度 WPL = 9 x 2 + 12 x 2 + 15 x 2 + 6 x 3 + 3 x 4 + 5 x 4 = 122

d、哈夫曼樹

哈夫曼樹又稱最優二叉樹。它是 n 個帶權葉子結點構成的所有二叉樹中，帶權路徑長度 WPL 最小的二叉樹。

如下圖為一哈夫曼樹示意圖。

2、構造哈夫曼樹

假設有n個權值，則構造出的哈夫曼樹有n個葉子結點。 n個權值分別設為 w1、w2、…、wn，則哈夫曼樹的構造規則為：

(1) 將w1、w2、…，wn看成是有n 棵樹的森林(每棵樹僅有一個結點)；

(2) 在森林中選出兩個根結點的權值最小的樹合併，作為一棵新樹的左、右子樹，且新樹的根結點權值為其左、右子樹根結點權值之和；

(3)從森林中刪除選取的兩棵樹，並將新樹加入森林；

(4)重複(2)、(3)步，直到森林中只剩一棵樹為止，該樹即為所求得的哈夫曼樹。

如：對下圖中的六個帶權葉子結點來構造一棵哈夫曼樹，步驟如下：

注意：為了使得到的哈夫曼樹的結構儘量唯一，通常規定生成的哈夫曼樹中每個結點的左子樹根結點的權小於等於右子樹根結點的權。

具體演算法如下：

//2、根據陣列 a 中 n 個權值建立一棵哈夫曼樹，返回樹根指標
struct BTreeNode* CreateHuffman(ElemType a[], int n)
{
int i, j;
struct BTreeNode **b, *q;
b = malloc(n*sizeof(struct BTreeNode));
for (i = 0; i < n; i++) //初始化b指標陣列，使每個指標元素指向a陣列中對應的元素結點
{
b[i] = malloc(sizeof(struct BTreeNode));
b[i]->data = a[i];
b[i]->left = b[i]->right = NULL;
}
for (i = 1; i < n; i++)//進行 n-1 次迴圈建立哈夫曼樹
{
//k1表示森林中具有最小權值的樹根結點的下標，k2為次最小的下標
int k1 = -1, k2;
for (j = 0; j < n; j++)//讓k1初始指向森林中第一棵樹，k2指向第二棵
{
if (b[j] != NULL && k1 == -1)
{
k1 = j;
continue;
}
if (b[j] != NULL)
{
k2 = j;
break;
}
}
for (j = k2; j < n; j++)//從當前森林中求出最小權值樹和次最小
{
if (b[j] != NULL)
{
if (b[j]->data < b[k1]->data)
{
k2 = k1;
k1 = j;
}
elseif (b[j]->data < b[k2]->data)
k2 = j;
}
}
//由最小權值樹和次最小權值樹建立一棵新樹，q指向樹根結點
q = malloc(sizeof(struct BTreeNode));
q->data = b[k1]->data + b[k2]->data;
q->left = b[k1];
q->right = b[k2];
b[k1] = q;//將指向新樹的指標賦給b指標陣列中k1位置
b[k2] = NULL;//k2位置為空
}
free(b); //刪除動態建立的陣列b
return q; //返回整個哈夫曼樹的樹根指標
}

3、哈夫曼編碼

在電報通訊中，電文是以二進位制的0、1序列傳送的，每個字元對應一個二進位制編碼，為了縮短電文的總長度，採用不等長編碼方式，構造哈夫曼樹，

將每個字元的出現頻率作為字元結點的權值賦予葉子結點，每個分支結點的左右分支分別用0和1編碼，從樹根結點到每個葉子結點的路徑上

所經分支的0、1編碼序列等於該葉子結點的二進位制編碼。如上文所示的哈夫曼編碼如下：

a 的編碼為：00

b 的編碼為：01

c 的編碼為：100

d 的編碼為：1010

e 的編碼為：1011

f 的編碼為：11

4、哈夫曼樹的操作運算

以上文的哈夫曼樹作為具體例項，用詳細的程式展示哈夫曼樹的操作運算

#include<stdio.h>
#include<stdlib.h>
typedefint ElemType;
struct BTreeNode
{
ElemType data;
struct BTreeNode* left;
struct BTreeNode* right;
};
//1、輸出二叉樹，可在前序遍歷的基礎上修改。採用廣義表格式，元素型別為int
void PrintBTree_int(struct BTreeNode* BT)
{
if (BT != NULL)
{
printf("%d", BT->data); //輸出根結點的值
if (BT->left != NULL || BT->right != NULL)
{
printf("(");
PrintBTree_int(BT->left); //輸出左子樹
if (BT->right != NULL)
printf(",");
PrintBTree_int(BT->right); //輸出右子樹
printf(")");
}
}
}
//2、根據陣列 a 中 n 個權值建立一棵哈夫曼樹，返回樹根指標
struct BTreeNode* CreateHuffman(ElemType a[], int n)
{
int i, j;
struct BTreeNode **b, *q;
b = malloc(n*sizeof(struct BTreeNode));
for (i = 0; i < n; i++) //初始化b指標陣列，使每個指標元素指向a陣列中對應的元素結點
{
b[i] = malloc(sizeof(struct BTreeNode));
b[i]->data = a[i];
b[i]->left = b[i]->right = NULL;
}
for (i = 1; i < n; i++)//進行 n-1 次迴圈建立哈夫曼樹
{
//k1表示森林中具有最小權值的樹根結點的下標，k2為次最小的下標
int k1 = -1, k2;
for (j = 0; j < n; j++)//讓k1初始指向森林中第一棵樹，k2指向第二棵
{
if (b[j] != NULL && k1 == -1)
{
k1 = j;
continue;
}
if (b[j] != NULL)
{
k2 = j;
break;
}
}
for (j = k2; j < n; j++)//從當前森林中求出最小權值樹和次最小
{
if (b[j] != NULL)
{
if (b[j]->data < b[k1]->data)
{
k2 = k1;
k1 = j;
}
elseif (b[j]->data < b[k2]->data)
k2 = j;
}
}
//由最小權值樹和次最小權值樹建立一棵新樹，q指向樹根結點
q = malloc(sizeof(struct BTreeNode));
q->data = b[k1]->data + b[k2]->data;
q->left = b[k1];
q->right = b[k2];
b[k1] = q;//將指向新樹的指標賦給b指標陣列中k1位置
b[k2] = NULL;//k2位置為空
}
free(b); //刪除動態建立的陣列b
return q; //返回整個哈夫曼樹的樹根指標
}
//3、求哈夫曼樹的帶權路徑長度
ElemType WeightPathLength(struct BTreeNode* FBT, int len)//len初始為0
{
if (FBT == NULL) //空樹返回0
return 0;
else
{
if (FBT->left == NULL && FBT->right == NULL)//訪問到葉子結點
return FBT->data * len;
else//訪問到非葉子結點，進行遞迴呼叫，返回左右子樹的帶權路徑長度之和，len遞增
return WeightPathLength(FBT->left,len+1)+WeightPathLength(FBT->right,len+1);
}
}
//4、哈夫曼編碼（可以根據哈夫曼樹帶權路徑長度的演算法基礎上進行修改）
void HuffManCoding(struct BTreeNode* FBT, int len)//len初始值為0
{
staticint a[10];//定義靜態陣列a，儲存每個葉子的編碼，陣列長度至少是樹深度減一
if (FBT != NULL)//訪問到葉子結點時輸出其儲存在陣列a中的0和1序列編碼
{
if (FBT->left == NULL && FBT->right == NULL)
{
int i;
printf("結點權值為%d的編碼：", FBT->data);
for (i = 0; i < len; i++)
printf("%d", a[i]);
printf("\n");
}
else//訪問到非葉子結點時分別向左右子樹遞迴呼叫，並把分支上的0、1編碼儲存到陣列a
{ //的對應元素中，向下深入一層時len值增1
a[len] = 0;
HuffManCoding(FBT->left, len + 1);
a[len] = 1;
HuffManCoding(FBT->right, len + 1);
}
}
}
//主函式
void main()
{
int n, i;
ElemType* a;
struct BTreeNode* fbt;
printf("從鍵盤輸入待構造的哈夫曼樹中帶權葉子結點數n：");
while(1)
{
scanf("%d", &n);
if (n > 1)
break;
else
printf("重輸n值：");
}
a = malloc(n*sizeof(ElemType));
printf("從鍵盤輸入%d個整數作為權值：", n);
for (i = 0; i < n; i++)
scanf(" %d", &a[i]);
fbt = CreateHuffman(a, n);
printf("廣義表形式的哈夫曼樹：");
PrintBTree_int(fbt);
printf("\n");
printf("哈夫曼樹的帶權路徑長度：");
printf("%d\n", WeightPathLength(fbt, 0));
printf("樹中每個葉子結點的哈夫曼編碼：\n");
HuffManCoding(fbt, 0);
}

執行結果：

資料結構樹筆記-8 哈夫曼樹的構建與儲存

講述哈夫曼樹的構建過程（按照程式碼的思路）：程式碼： #include <stdio.h> #include <malloc.h> typedef struct{ int weight; int parent

哈夫曼樹的構建、編碼以及帶權路徑長計算

給定n個權值作為n個葉子結點，構造一棵二叉樹，若該樹的帶權路徑長度達到最小，稱這樣的二叉樹為最優二叉樹，也稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。構造哈夫曼樹的演算法如下：

樹：哈夫曼樹的建立與編碼解碼

哈夫曼樹哈夫曼樹即最優二叉樹，演算法如下：（1）在當前未使用結點中找出兩個權重最小的作為左右孩子，計算出新的根結點（2）新的根結點繼續參與過程（1），直至所有結點連線為一棵樹如下圖，symbol為具體字元，Frequency為出現頻率（權重）特點：只有度數為

DS二叉樹--赫夫曼樹的構建與編碼

題目描述給定n個權值，根據這些權值構造huffman樹，並進行huffman編碼參考課本演算法，注意陣列訪問是從位置1開始要求：赫夫曼的構建中，預設左孩子權值不大於右孩子權值輸入第一行輸入t，表示有t個測試例項第二行先輸入n，表示第1個例項有n個權

哈夫曼樹的編碼與解碼

#include<stdio.h> #include<stdlib.h> #include<iostream> #include<string> using namespace std; #define MAXSIZE 30

哈夫曼樹的原理與實現

一、哈夫曼樹的介紹 Huffman Tree，中文名是哈夫曼樹或霍夫曼樹，它是最優二叉樹。定義：給定n個權值作為n個葉子結點，構造一棵二叉樹，若樹的帶權路徑長度達到最小，則這棵樹被稱為哈夫曼樹。這個定義裡面涉及到了幾個陌生的概念，下面就是一顆哈夫曼樹，我們來看圖解

哈夫曼樹的建立和操作

哈夫曼樹的引進是與帶有權重的二叉樹有關的首先定義帶權路徑長度（WPL）：設二叉樹有n個葉子結點，每個葉子結點帶有權值Wk，從根結點到每個葉子的長度為Ik，則每個葉子結點的帶權路徑長度之和就是：WPL=∑nk=1wklk。最優二叉樹或哈夫曼樹：WPL最小的

淺談哈夫曼樹的構建、遍歷、編碼

最近研究二叉樹，比較經典的樹就是哈夫曼樹了，所以研究一下它的構建以及哈夫曼編碼，惡補一下資料結構的知識。有一段密文：aabbccabcacb，解析為電碼傳輸，只能為0、1來表示例如 a 0 b 1 c 01 d 10 …

【資料結構】哈夫曼樹的編碼與譯碼

#include <stdio.h> #include <malloc.h> #include <string.h> typedef struct { char info; int weight; int parent, lchild, rchild;

哈夫曼樹的搭建與哈夫曼編碼

什麼是哈夫曼樹在介紹哈夫曼樹前，我們先介紹二叉樹的基本概念，以便大家更好地理解哈夫曼樹：路徑：兩個節點之間分支的連線即兩個節點之間的路徑。路徑長：兩個節點之間路徑所包含分支的和。深度：根節點的深度為0，其子節點的深度為1，往下逐一遞推。子節點數：和

哈夫曼樹的基本構建與操作

看到的講解huffman樹的一篇比較好懂的部落格出處:http://blog.csdn.net/wtfmonking/article/details/17150499# 1、基本概念 a、路徑和路徑長度若在一棵樹中存在著一個結點序列 k1，k2，……，kj，使得 k

5.2哈夫曼樹——哈夫曼樹與哈夫曼編碼

node i++ insert 編碼 urn all IV right style #include <stdio.h> #include <stdlib.h> struct TreeNode{ int Weight; Huffm

數據結構與算法 —— 哈夫曼樹

分享圖片 bubuko com 技術 alt bsp image ima 算法數據結構與算法 —— 哈夫曼樹

資料結構——第二章樹和森林：04哈夫曼樹與哈夫曼編碼

1.結點的路徑長度：從根結點到該結點的路徑上分支的數目。 2.樹的路徑長度：樹中每個結點的路徑長度之和。 3.樹的帶權路徑長度：樹中所有葉子結點的帶權路徑長度之和WPL(T) = ∑wklk（對所有葉子結點） 4.最優樹：在所有含n個結點，並帶相同權值的m叉樹中，必存在一棵其帶權路徑長度取最小值的樹，稱

數據結構——第二章樹和森林：04哈夫曼樹與哈夫曼編碼

一個例如 stat state 森林 ont 技術圖片 http 1.結點的路徑長度：從根結點到該結點的路徑上分支的數目。 2.樹的路徑長度：樹中每個結點的路徑長度之和。 3.樹的帶權路徑長度：樹中所有葉子結點的帶權路徑長度之和WPL(T) = ∑wklk（對所有葉子結

哈夫曼樹檔案操作

#include<bits/stdc++.h> using namespace std; int b[26]={0}; int bb[26]={0}; int kk; struct node{ int w; int p,l,r; }; set <node>

20172303 2018-2019-1《程式設計與資料結構》哈夫曼樹編碼與解碼

20172303 2018-2019-1《程式設計與資料結構》哈夫曼樹編碼與解碼哈夫曼樹簡介定義：給定n個權值作為n個葉子結點，構造一棵二叉樹，若帶權路徑長度達到最小，稱這樣的二叉樹為最優二叉樹，也稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。

20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼

exce eat temp 基礎第一個最小 charat 轉換 except 20172303 2018-2019-1《程序設計與數據結構》哈夫曼樹編碼與解碼哈夫曼樹簡介定義：給定n個權值作為n個葉子結點，構造一棵二叉樹，若帶權路徑長度達到最小，稱這樣的二叉樹為最

用連結串列的方式構建哈夫曼樹

#include<stdio.h> #include<stdlib.h> #include<iostream> using namespace std; #define MAXSIZE 30 typedef struct node {

C++中的位移操作以實現檔案的壓縮（實現哈夫曼對檔案壓縮與解壓時做的一個小測試）

因為以前基本上沒用過位移操作，所以這裡做了一個小測試，加深了一下對位移的理解相關概念：因為C++中對檔案的操作常用的就是按位元組來進行讀取。下面對檔案的讀寫進行舉例（這是我常用的方式，大家也可以用其它方法讀取）：　　首先包含相關標頭檔案：　　　　

哈夫曼樹的基本構建與操作

看到的講解huffman樹的一篇比較好懂的部落格

1、基本概念

2、構造哈夫曼樹

3、哈夫曼編碼

4、哈夫曼樹的操作運算

相關推薦