CCF 2016-12 04編碼（DP+哈夫曼樹）

阿新 • • 發佈：2019-01-28

題目：給定一段文字，已知單詞a₁, a₂, …, a_n出現的頻率分別t₁, t₂, …, t_n。可以用01串給這些單詞編碼，即將每個單詞與一個01串對應，使得任何一個單詞的編碼（對應的01串）不是另一個單詞編碼的字首，這種編碼稱為字首碼。
　　使用字首碼編碼一段文字是指將這段文字中的每個單詞依次對應到其編碼。一段文字經過字首編碼後的長度為：
　　L=a₁的編碼長度×t₁+a₂的編碼長度×t₂+…+ a_n的編碼長度×t_n。
　　定義一個字首編碼為字典序編碼，指對於1 ≤ i < n，a_i的編碼（對應的01串）的字典序在a_i₊₁編碼之前，即a₁, a₂, …, a_n的編碼是按字典序升序排列的。
　　例如，文字E A E C D E B C C E C B D B E中， 5個單詞A、B、C、D、E出現的頻率分別為1, 3, 4, 2, 5，則一種可行的編碼方案是A:000, B:001, C:01, D:10, E:11，對應的編碼後的01串為1100011011011001010111010011000111，對應的長度L

為3×1+3×3+2×4+2×2+2×5=34。
　　在這個例子中，如果使用哈夫曼(Huffman)編碼，對應的編碼方案是A:000, B:01, C:10, D:001, E:11，雖然最終文字編碼後的總長度只有33，但是這個編碼不滿足字典序編碼的性質，比如C的編碼的字典序不在D的編碼之前。
　　在這個例子中，有些人可能會想的另一個字典序編碼是A:000, B:001, C:010, D:011, E:1，編碼後的文字長度為35。
　　請找出一個字典序編碼，使得文字經過編碼後的長度L最小。在輸出時，你只需要輸出最小的長度L，而不需要輸出具體的方案。在上面的例子中，最小的長度L為34。

思路：這道題首先你要懂得哈夫曼樹的原理

，即編碼原理，然後找到區別，哈夫曼樹是每次找最小的兩個，和的價值為新的價值，然後再找到最小的兩個價值，組成新的價值，其實就是貪心的依次取最小兩個數；但是這裡因為要滿足字母序，所以只能和相鄰的值合併，聯想到DP中的石子合併的問題。

但是普通的石子合併演算法複雜度為O(n^3),不能滿足這道題的規模，因此要用四邊形規則優化。

設m[i,j]表示動態規劃的狀態量。 m[i,j]有類似如下的狀態轉移方程： m[i,j]=min{m[i,k]+m[k,j]}(i≤k≤j) m[i,j]=min{m[i,k]+m[k,j]}(s[i,j-1]≤k≤s[i+1,j]) 定義s(i,j)為函式m(i,j)對應的使得m(i,j)取得最小值的k值。(具體證明見另外一篇部落格)

#include<iostream>
#include<algorithm>
using namespace std;
#define maxn 1000+5
const int INF = (1 << 30);
int dp[maxn][maxn], a[maxn], sum[maxn];
int s[maxn][maxn];
int main()
{
	int n,i,j,start,mink,end,k;
	int temp;
	cin >> n;
	sum[0] = 0;
	for (i = 1; i <= n; i++)
	{
		cin >> a[i];
		sum[i] = sum[i - 1] + a[i];
		s[i][i] = i;
	}
	for (int len = 1; len < n; len++)
	{
		for (start = 1; start <= n - len; start++)
		{
			mink = start;
			temp = INF;
			end = start + len;
			for (k = s[start][end - 1]; k <= s[start + 1][end]; k++)//優化
			{
				if (temp > (dp[start][k] + dp[k+1][end] + sum[end] - sum[start-1]))
				{
					mink = k;//找到k值
					temp = (dp[start][k] + dp[k+1][end] + sum[end] - sum[start-1]);
				}
			}
			s[start][end] = mink;
			dp[start][end] = temp;
		}
	}
	cout << dp[1][n];
	system("pause");
	return 0;
}

CCF 2016-12 04編碼（DP+哈夫曼樹）

CCF 2016-12 04編碼（DP+哈夫曼樹）

哈夫曼編碼（基於哈夫曼樹-最優二叉樹，不唯一）、B樹(b-樹)、B+樹

bzoj 4198 [ Noi 2015 ] 荷馬史詩 —— 哈夫曼編碼(k叉哈夫曼樹)

小專案-檔案壓縮（哈夫曼樹）

ZOJ 1117 Entropy（哈夫曼樹）

最優二叉樹（哈夫曼樹）知識點

hdu1053 Entropy（哈夫曼樹）

Entropy （哈夫曼樹）

GZIP壓縮原理分析（32）——第五章 Deflate演算法詳解（五23）動態哈夫曼編碼分析（12）構建哈夫曼樹（04）

轉載：哈夫曼樹的構造和哈夫曼編碼（C++代碼實現）

文件壓縮——哈夫曼樹編碼（一）

資料結構——第二章樹和森林：04哈夫曼樹與哈夫曼編碼

數據結構——第二章樹和森林：04哈夫曼樹與哈夫曼編碼

資料結構————檔案壓縮（利用哈夫曼編碼實現）

資料結構——哈夫曼樹的實現以及編碼（C語言實現）

HuffmanTree哈夫曼樹（赫夫曼樹）及哈夫曼編碼

資料結構與演算法 (七) 哈夫曼樹（Huffman）與哈夫曼編碼

哈夫曼樹編碼-解碼（c++）

資料結構之二叉樹應用（哈夫曼樹及哈夫曼編碼實現）（C++）

GZIP壓縮原理分析（29）——第五章 Deflate演算法詳解（五20）動態哈夫曼編碼分析（09）構建哈夫曼樹（01）

CCF 2016-12 04編碼（DP+哈夫曼樹）

相關推薦