1. 程式人生 > >資料結構之點陣圖(bitmap)詳解 (轉)

資料結構之點陣圖(bitmap)詳解 (轉)

1.  概述

點陣圖(bitmap)是一種非常常用的結構,在索引,資料壓縮等方面有廣泛應用。本文介紹了點陣圖的實現方法及其應用場景。

2. 點陣圖實現

(1)自己實現
在點陣圖中,每個元素為“0”或“1”,表示其對應的元素不存在或者存在。

複製程式碼程式碼如下:
#define INT_BITS sizeof(int)
 
#define SHIFT 5 // 2^5=32
 
#define MASK 0x1f // 2^5=32
 
#define MAX 1024*1024*1024 //max number
 
int bitmap[MAX / INT_BITS];
 
/*
 
* 設定第i位
 
* i >> SHIFT 相當於 i / (2 ^ SHIFT),
 
* i&MASK相當於mod操作 m mod n 運算
 
*/
 
void set(int i) {
 
bitmap[i >> SHIFT] |= 1 << (i & MASK);
 
}
 
//獲取第i位
 
int test(int i) {
 
return bitmap[i >> SHIFT] & (1 << (i & MASK));
 
}
 
//清除第i位
 
int clear(int i) {
 
return bitmap[i >> SHIFT] & ~(1 << (i & MASK));
 
}

(2)函式庫實現

3.  點陣圖應用

3.1    列舉
(1)全組合
字串全組合列舉(對於長度為n的字串,組合方式有2^n種),如:abcdef,可以構造一個從字串到二進位制的對映關係,通過列舉二進位制來進行全排序。

複製程式碼程式碼如下:
null——> 000000
f——> 000001
e——> 000010
ef——> 000011
……
abcedf——> 111111

(2)哈米爾頓距離

列舉演算法,複雜度是O(N^2),怎樣降低複雜度呢?
如果是N 個二維的點,那麼我們可以怎麼用較快的方法求出

通過簡單的數學變形,我們可以得到這樣的數學公式:

通過觀察,我們發現每一對相同元的符號必定相反,如:x_i-y_i,於是我們有了一個二進位制思想的思路,那就是列舉這些二i維的點的x 軸y 軸前的正負號,這樣就可以用一個0~3 的數的二進位制形式來表示每個元素前面的正負號,1表示+號,0表示−號,如:2 表示的二進位制位形式為10表示x_i-y_i。這樣我們就可以通過2^2*N次記錄下這些二元組的不同的符號的數值,對於每個二進位制來表示的不同的式子只需記錄下他們的值,這樣我們只需求max_i 和min_i出這些相同的二進位制表示的式子max_i –min_i,最後我們就可以解出ans=max{max_i-min_i}。

通過點陣圖,演算法時間複雜度可將為O(N)。

3.2   搜尋

設計搜尋剪枝時,需要儲存已經搜尋過的歷史資訊,有些情況下,可以使用點陣圖減小歷史資訊資料所佔空間。

3.3 壓縮

(1)在2.5億個整數中找出不重複的整數,注,記憶體不足以容納這2.5億個整數?

(2)騰訊面試題:給40億個不重複的unsigned int的整數,沒排過序的,然後再給一個數,如何快速判斷這個數是否在那40億個數當中?

4. 總結

Bitmap是一種非常簡潔快速的資料結構,他能同使證儲存空間和速度最優化(而不必空間換時間)。