主席樹入門詳解一（學習筆記）（例題POJ-2104 求區間第k小）

阿新 • • 發佈：2019-01-20

學習主席樹，在網上搜了很多教程（都好簡短啊，直接就是幾行字就上程式碼，看不懂啊有木有~~），最後才很艱難的學會了最基礎的部分。下面就是我在學習的過程中的產生的疑惑和解決的辦法。

學習主席樹需要的前置技能：線段樹。

參考資料

1. B站上的視訊講解（話說B站真的啥都有啊）

2.參考部落格

主席樹是啥？？

話說主席樹這個名字的來歷還是挺好玩的，發明它的人叫黃嘉泰，名字的首字母呢就是（HJT），和我們的某位主席的名字簡寫是一樣的，所以就有了這個名字。

言歸正傳，那麼，主席樹到底是啥，主席樹就是可持久化的線段樹（也就是可以查詢歷史版本的線段樹），也叫函式式線段樹。具體點說就是你對某個線段樹進行更新，然後在後面的過程中，你還可以找到這個更新之前的版本的線段樹。說通俗點就是每一次更新，都會把舊的線段樹存起來，這樣以後用的時候就可以直接找啦。顯然直接建立一堆線段樹是顯然會爆記憶體的。但是呢我們發現，如果更新了一個點，那麼只有一條線上的節點會被更新

，也就是說，我們記錄下一個版本的線段樹的時候，可以共用前一個版本線段樹的大部分節點，這樣就可以節省記憶體啦。（巧妙啊）

如下圖，修改紅圈內的點，只會影響這一條線上的點。

對於一般的線段樹來說，如果父節點的編號是 i ,那麼他的兩個子節點的編號分別為 2 * i(左）, 2 * i + 1（右），但是主席樹在這一點則有別於一般的線段樹，每一個父節點，他的兩個兒子節點的編號不一定滿足這個關係（因為我們上面所說的節點共用0.0）。

附上一個大家都用了的牛人的理解：

所謂主席樹呢，就是對原來的數列[1..n]的每一個字首[1..i]（1≤i≤n）建立一棵線段樹，線段樹的每一個節點存某個字首[1..i]中屬於區間[L..R]的數一共有多少個（比如根節點是[1..n]，一共i個數，sum[root] = i；根節點的左兒子是[1..(L+R)/2]，若不大於(L+R)/2的數有x個，那麼sum[root.left] = x）。若要查詢[i..j]中第k大數時，設某結點x，那麼x.sum[j] - x.sum[i - 1]就是[i..j]中在結點x內的數字總數。而對每一個字首都建一棵樹，會MLE，觀察到每個[1..i]和[1..i-1]只有一條路是不一樣的，那麼其他的結點只要用回前一棵樹的結點即可，時空複雜度為O(nlogn)。

主席樹可以幹啥？？以及怎麼建立？？（以例題闡述）

上面講過主席樹是一堆線段樹的集合，那麼只要是需要用很多線段樹來解決的問題，我們都可以用主席樹來解決。這樣說是不是太籠統了？舉個例子，我們可以用它來求區間的第k小（大）的值，也可以求區間內有多少種數字。主席樹的題是可以非常靈活的，難點就在於靈活的建樹，和如何建立利用線段樹。

最經典的例題當然是求區間第k小的題了，題目連結：POJ-2104

題目大意：有n個數，m個詢問。先給你n個數字，然後每個詢問會告訴你一組（l,r,k），意思是詢問區間【l,r】之間第k小的值。

看到這兒，我們可以先去想如果只有一個區間的話，這個問題可以怎麼解決。這個時候我們的線段樹

就可以閃亮登場啦！（如果有負數的話，可以整體加上最大的負數的絕對值，轉化成正數，最後不要忘了轉化回來就行）區間【l,r】所維護的資訊就是此區間所包含的數的個數（即大於等於 l 小於等於 r 的數的個數）。（葉子節點【l,l】記錄的資訊就是數字l的出現次數）。按照這個規則，一顆線段樹就建立好了。那麼我們應該怎麼去查詢呢。查詢的時候，如果左子樹所代表的區間包含數的個數大於等於k，就說明所要查詢的第k小的數在左子樹中，否則就在右子樹中，最終到達葉子節點的時候，輸出葉子節點即可。

查詢的程式碼如下（很簡單）：

//l,r代表維護的區間，num代表當前區間所包含的數字的個數
int Query(int k,int cnt)
{
	if(tree[cnt].l==tree[cnt].r)
		return tree[cnt].l;
	if(tree[cnt<<1].num>=k)
		return Query(k,cnt<<1);
	else
		return Query(k-tree[cnt<<1].num,cnt<<1|1);
}

哈，那這樣的話，我們這一題的解法是不是就出來了呢？對每個區間建立一個線段樹，然後按照上面的方式求解。但這樣顯然是不行的，我們承受不了這麼大的時空複雜度。這個時候我們的主席樹就上場了，“線段樹，你退下吧，一切有我！”。（很多線段樹？想到了什麼，主席樹就是很多線段樹的集合啊。）

主席樹的各個節點都是同一結構的線段樹（相同的區間，相同的資訊）（因為是儲存了之前的歷史資訊0.0）。線段樹對一條線段，儲存的是這個數字區間的出現次數，所以是可以互相加減的。如果我們的主席樹是每次插入一個點來更新的，那麼第一個線段樹也就是第一個陣列成的線段樹，第 i 顆線段樹，就是前 i 個數組成的線段樹（按照上面講的線段樹的建樹方式，區間資訊是包含的數的個數）。那麼類比字首和的思想，我們怎麼表示區間【l,r】之間有多少個數呢？只要拿出 Tj 和 Ti-1，對每個節點相減就可以了。說的通俗一點，詢問 i~j 區間中，一個數字區間（a~b）的出現次數時，就是這些數字在 Tj 中出現的次數減去在 Ti-1 中出現的次數。（注意區分割槽間i~j 和 a~b哦）。

有的同學會說了，這樣也不行啊，你忽略了一個很重要的問題，就是數的範圍！題幹中給的數的範圍是 -1e9~1e9，線段樹怎麼可能開得下啊！（因為區間的大小是因為數的大小確定的）。對，這是一個很重要的問題，但是我們發現，數的個數是1e5個，是在我們能接受的範圍之內的。也就是說我們單單按照數字大小來建樹的話，會浪費掉非常多的空間。那該怎麼辦呢？？為了解決這個問題，我們要引入一個高大上的方法，叫離散化（為啥叫這個名字我也不知道）。

離散化是啥？怎麼離散化？下面我就說一點自己的理解。我的理解是離散化是一種對映關係（Hash）。就拿這個題來說，我們可以把這n個數排序，然後把最小的對映成1，次小的對映成2......（注意去重）以此類推形成一種對映關係，然後我們就可以按照這種對映關係來建樹，這樣時空複雜度就在我們可以承受的範圍內了~。

在B站上學到的一種離散化的方法如下：（個人覺得挺好的）

首先我們讀入資料的時候順便把資料壓入到一個vector中

for(int i=1;i<=n;i++)
{
    scanf("%d",&a[i]);
    v.push_back(a[i]);
}

然後把vector排序去重（利用unique函式）

sort(v.begin(),v.end());
v.erase(unique(v.begin(),v.end()),v.end());

然後利用二分我們就可以愉快的得到對映的值辣

int getid(int x)
{
    return lower_bound(v.begin(),v.end(),x)-v.begin()+1;
}

這樣我們的思路就講完了，下面是具體實現。

一.單點更新

上程式碼，解釋見註釋！

void Update(int l,int r,int &x,int y,int pos)
//l,r代表當前區間  x代表當前更新的空樹  y代表x這個數所需要共用節點的
//上一版本的樹  pos代表當前更新的數 
{
    T[++cnt]=T[y],T[cnt].sum++,x=cnt;
    //建立樹的節點 
    if(l==r)
        return;
    int mid=(l+r)>>1;
    //判斷當前的數大小，來選擇更新左子樹還是右子樹 
    if(mid>=pos)
        Updata(l,mid,T[x].l,T[y].l,pos);
    else
        Updata(mid+1,r,T[x].r,T[y].r,pos);
}

二.建樹

建樹的時候不斷的進行單點更新即可

for(int i=1;i<=n;i++)
    Updata(1,n,root[i],root[i-1],getid(a[i]));
    //每一棵樹依賴的都是他的前一棵樹（也就是他的歷史版本）
	//root[i]存的是第i顆樹的根節點的座標

三.查詢

上程式碼，解釋見註釋！

int Query(int l,int r,int x,int y,int k)
//l,r代表操作區間 x代表第l顆樹 y代表第r顆樹  k代表所求的第k小的數中的k 
{
    if(l==r)
        return l;
    //到達葉子節點  返回答案即可 
    int mid=(l+r)>>1;
    int sum=T[T[y].l].sum-T[T[x].l].sum;
    //判斷所求的數在左子樹還是右子樹 
    if(sum>=k)
        return Query(l,mid,T[x].l,T[y].l,k);
    else
        return Query(mid+1,r,T[x].r,T[y].r,k-sum);
        //注意理解從k到k-sum的變化 
}

四.完整程式碼

經過上面三步，大家應該已經能夠實現這個程式碼了


#include<iostream>
#include<cstdio>
#include<algorithm>
#include<vector>

using namespace std;
const int MAXN=1e5+10;
struct Tree{
    int l,r,sum;
}T[MAXN*40];
vector<int> v;
int cnt,root[MAXN],a[MAXN];

void Init()
{
    cnt=0;
    T[cnt].l=0;T[cnt].r=0;T[cnt].sum=0;
    root[cnt]=0;
    v.clear();
}

int getid(int x)
{
    return lower_bound(v.begin(),v.end(),x)-v.begin()+1;
}

void Update(int l,int r,int &x,int y,int pos)
{
    T[++cnt]=T[y],T[cnt].sum++,x=cnt;
    if(l==r)
        return;
    int mid=(l+r)>>1;
    if(mid>=pos)
        Updata(l,mid,T[x].l,T[y].l,pos);
    else
        Updata(mid+1,r,T[x].r,T[y].r,pos);
}

int Query(int l,int r,int x,int y,int k)
{
    if(l==r)
        return l;
    int mid=(l+r)>>1;
    int sum=T[T[y].l].sum-T[T[x].l].sum;
    if(sum>=k)
        return Query(l,mid,T[x].l,T[y].l,k);
    else
        return Query(mid+1,r,T[x].r,T[y].r,k-sum);
}

int main()
{
    Init();
    int n,m;
    scanf("%d%d",&n,&m);
    for(int i=1;i<=n;i++)
    {
        scanf("%d",&a[i]);
        v.push_back(a[i]);
    }
    sort(v.begin(),v.end());
    v.erase(unique(v.begin(),v.end()),v.end());
    for(int i=1;i<=n;i++)
        Updata(1,n,root[i],root[i-1],getid(a[i]));
    int l,r,k;
    for(int i=1;i<=m;i++)
    {
        scanf("%d%d%d",&l,&r,&k);
        printf("%d\n",v[Query(1,n,root[l-1],root[r],k)-1]);
    }
    return 0;
}

主席樹入門詳解二連結（講解基本用法區間數字種數）

總結

主席樹的本質就是一堆線段樹的集合（也就是包含歷史版本的線段樹），所以需要一堆線段樹來解決的問題，就可以用我們的主席樹來解決了，主席樹與線段樹最大的區別就是主席樹的左右兒子的節點編號是不固定的。那麼我們在編寫程式碼的時候，傳入根節點的座標，然後再記錄左右兒子的座標，這樣我們的查詢，更新函式，都和普通的線段樹差不了多少，關鍵就是節點的公用關係，和線段樹在題目中的意義和用法！

END~~

本篇學習筆記到此正式結束，以後學到了新的東西會繼續更新的（主席樹還有好多東西要學啊啊啊~~~~）

主席樹入門詳解一（學習筆記）（例題POJ-2104 求區間第k小）

參考資料

主席樹是啥？？

主席樹可以幹啥？？以及怎麼建立？？（以例題闡述）

一.單點更新

二.建樹

三.查詢

四.完整程式碼

主席樹入門詳解二連結（講解基本用法區間數字種數）

總結

END~~

主席樹入門詳解一（學習筆記）（例題POJ-2104 求區間第k小）

主席樹入門詳解二（學習筆記）（例題SPOJ

主席樹入門詳解+題目推薦

poj2104求區間第k小,靜態主席樹入門模板

落谷 P3834 可持久化線段樹 1（主席樹）（區間第k小）

求區間第k小（主席樹）

POJ2104（主席樹求區間第K大）

poj 2104主席樹求區間第k小

線段樹入門詳解

hdu 5919--Sequence II（主席樹--求區間不同數個數+區間第k大）

HDU 5919 - Sequence II (2016CCPC長春) 主席樹（區間第K小+區間不同值個數）

靜態區間第K小（整體二分、主席樹）

[機器學習入門] 李巨集毅機器學習筆記-1（Learning Map 課程導覽圖）

[機器學習入門] 李巨集毅機器學習筆記-5（Classification- Probabilistic Generative Model；分類：概率生成模型）

[機器學習入門] 李巨集毅機器學習筆記-15 （Unsupervised Learning: Word Embedding；無監督學習：詞嵌入）

[機器學習入門] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；邏輯迴歸）

hdu2665 求區間第k大（小？）【主席樹or可持久化線段樹or函式式線段樹】

[機器學習入門] 李巨集毅機器學習筆記-14 （Unsupervised Learning: Linear Dimension Reduction；無監督學習：線性降維）

動態區間第k小（主席樹+線段樹套樹狀陣列）

HDU 2665 Kth number（主席樹靜態區間第K大）題解

主席樹入門詳解一（學習筆記）（例題POJ-2104 求區間第k小）

參考資料

主席樹是啥？？

主席樹可以幹啥？？以及怎麼建立？？（以例題闡述）

一.單點更新

二.建樹

三.查詢

四.完整程式碼

主席樹入門詳解二連結（講解基本用法 區間數字種數）

總結

END~~

相關推薦

主席樹入門詳解二連結（講解基本用法區間數字種數）