1. 程式人生 > >不用引入第三變數交換兩個變數的值

不用引入第三變數交換兩個變數的值

前幾天發現了一個問題:有人告訴我,要進行變數交換,就必須引入第三變數!
假設我們要交換a和b變數的值,如果寫成
int a=5,b=10;
a=b;
b=a;
那麼結果就是兩個都是10,理由不言而喻。
所以就應該引入第三變數,在a的值被覆蓋之前就把a的值保留好。
int a=5,b=10,tmp;
tmp=a;
a=b;
b=tmp;
這樣,就要引入了第三個變數,然而,我們能不能不引入第三變數來實現變數交換呢?
答案自然是肯定的,首先我們可以這樣設想,如果a的值被覆蓋了,那麼就沒法知道b應該放什麼值了,
所以,我們要保留a的值,因此我們可以把a和b的值合起來,放在a裡,再把合起來的值分開,分別放到b和a中:
int a=5,b=10;
a=a+b;   //a=15,b=10
b=a-b;   //a=15,b=5
a=a-b;   //a=10,b=5
但是這樣做有一個缺陷,假設它執行在vc6環境中,那麼int的大小是4 Bytes,所以int變數所存放的最大值是2^31-1即2147483647,如果我們令a的值為2147483000,b的值為1000000000,那麼a和b相加就越界了。
事實上,從實際的執行統計上看,我們發現要交換的兩個變數,是同號的概率很大,而且,他們之間相減,越界的情況也很少,因此我們可以把上面的加減法互換,這樣使得程式出錯的概率減少:
int a=5,b=10;
a-=b;   //a=-5,b=10
b+=a;   //a=15,b=5
a+=b;   //a=10,b=5
通過以上運算,a和b中的值就進行了交換。表面上看起來很簡單,但是不容易想到,尤其是在習慣引入第三變數的演算法之後。
它的原理是:把a、b看做數軸上的點,圍繞兩點間的距離來進行計算。
具體過程:第一句“a-=b”求出ab兩點的距離,並且將其儲存在a中;第二句“b+=a”求出a到原點的距離(b到原點的距離與ab兩點距離之差),並且將其儲存在b中;第三句“a+=b”求出b到原點的距離(a到原點距離與ab兩點距離之和),並且將其儲存在a中。完成交換。
此演算法與引入第三變數的演算法相比,多了三個計算的過程,但是沒有藉助臨時變數,因此我們稱之為算術交換演算法。

因外上面的算術交換演算法有導致變數溢位的危險,所以我們再想辦法引入一個邏輯運算——位異或,也能得到交換效果,而且不會導致溢位。
位異或運算子是“^”,它的作用是按照每個位進行異或運算,異或運算有一個特點:
通過異或運算能夠使資料中的某些位翻轉,其他位不變。這就意味著任意一個數與任意一個給定的值連續異或兩次,值不變。 即:a^b^b=a。將a=a^b代入b=a^b則得b=a^b^b=a;同理可以得到a=b^a^a=b;
如存在c=a^b;這種關係後,任意給出兩個變數進行位異或運算,都能得到剩下的第三個變數:
a=b^c;
b=a^c;
c=a^b;
因此位異或也常用於密碼學中。
因為它是按位進行運算的,因此沒有溢位的情況,在這裡,我們運用位異或運算來交換變數的值。
int a=10,b=12; //a=1010^b=1100;
a=a^b; //a=0110^b=1100;
b=a^b; //a=0110^b=1010;
a=a^b; //a=1100=12;b=1010;
輕鬆完成交換。
理論上過載“^”運算子,也可以實現任意結構的交換

另外,如果變數較大,或者交換較複雜的類,這樣交換也是很慢的,因此可以使用指標交換,
因為對地址的操作實際上進行的是整數運算,比如:兩個地址相減得到一個整數,表示兩個變數在記憶體中的儲存位置隔了多少個位元組;地址和一個整數相加即“a+10”表示以a為基地址的在a後10個a類資料單元的地址。所以理論上可以通過和算術演算法類似的運算來完成地址的交換,從而達到交換變數的目的。即:
int *a,*b;
*a=new int(10);
*b=new int(20); //&a=0x00001000h,&b=0x00001200h
a=(int*)(b-a); //&a=0x00000200h,&b=0x00001200h
b=(int*)(b-a); //&a=0x00000200h,&b=0x00001000h
a=(int*)(b+int(a)); //&a=0x00001200h,&b=0x00001000h
通過以上運算a、b的地址真的已經完成了交換,且a指向了原先b指向的值,b指向原先a指向的值了嗎?上面的程式碼可以通過編譯,但是執行結果卻令人匪夷所思!原因何在?
首先必須瞭解,作業系統把記憶體分為幾個區域:系統程式碼/資料區、應用程式程式碼/資料區、堆疊區、全域性資料區等等。在編譯源程式時,常量、全域性變數等都放入全域性資料區,區域性變數、動態變數則放入堆疊區。這樣當演算法執行到“a=(int*)(b-a)”時,a的值並不是0x00000200h,而是要加上變數a所在記憶體區的基地址,實際的結果是:0x008f0200h,其中0x008f即為基地址,0200即為a在該記憶體區的位移。它是由編譯器自動新增的。因此導致以後的地址計算均不正確,使得a,b指向所在區的其他記憶體單元。再次,地址運算不能出現負數,即當a的地址大於b的地址時,b-a<0,系統自動採用補碼的形式表示負的位移,由此會產生錯誤,導致與前面同樣的結果。
有辦法解決嗎?當然有,以下是改進的演算法:
if(a<b)
{
a=(int*)(b-a);
b=(int*)(b-(int(a)&0x0000ffff));
a=(int*)(b+(int(a)&0x0000ffff));
}
else
{
b=(int*)(a-b);
a=(int*)(a-(int(b)&0x0000ffff));
b=(int*)(a+(int(b)&0x0000ffff));
}
演算法做的最大改進就是採用位運算中的與運算“int(a)&0x0000ffff”,因為地址中高16位為段地址,後16位為位移地址,將它和0x0000ffff進行與運算後,段地址被遮蔽,只保留位移地址。這樣就原始演算法吻合,從而得到正確的結果。
此演算法同樣沒有使用第三變數就完成了值的交換,與算術演算法比較它顯得不好理解,但是它有它的優點即在交換很大的資料型別時,它的執行速度比算術演算法快。因為它交換的時地址,而變數值在記憶體中是沒有移動過的。

以上四個演算法均實現了不借助其他變數來完成兩個變數值的交換,相比較而言算術演算法和位演算法計算量相當,地址演算法中計算較複雜,卻可以很輕鬆的實現大型別(比如自定義的類或結構)的交換,而算術演算法和位演算法只能進行整形資料的交換,而引用第三變數的演算法無疑是最好的,能夠解決任意型別的交換問題。