1. 程式人生 > >看完這個你還不理解右值引用和移動構造 你就可以來咬我(上)

看完這個你還不理解右值引用和移動構造 你就可以來咬我(上)

C++ 右值引用 & 新特性
C++ 11中引入的一個非常重要的概念就是右值引用。理解右值引用是學習“移動語義”(move semantics)的基礎。而要理解右值引用,就必須先區分左值與右值。

對左值和右值的一個最常見的誤解是:等號左邊的就是左值,等號右邊的就是右值。左值和右值都是針對表示式而言的,左值是指表示式結束後依然存在的持久物件,右值是指表示式結束時就不再存在的臨時物件。一個區分左值與右值的便捷方法是:看能不能對錶達式取地址,如果能,則為左值,否則為右值。下面給出一些例子來進行說明。

 int a = 10;
 int b = 20;
 int *pFlag = &a;
 vector<int> vctTemp;
 vctTemp.push_back(1);
 string str1 = "hello ";
 string str2 = "world";
 const int &m = 1;
請問,a,b, a+b, a++, ++a, pFlag, *pFlag, vctTemp[0], 100, string("hello"), str1, str1+str2, m分別是左值還是右值?
a和b都是持久物件(可以對其取地址),是左值;
a+b是臨時物件(不可以對其取地址),是右值;
a++是先取出持久物件a的一份拷貝,再使持久物件a的值加1,最後返回那份拷貝,而那份拷貝是臨時物件(不可以對其取地址),故其是右值;
++a則是使持久物件a的值加1,並返回那個持久物件a本身(可以對其取地址),故其是左值;
pFlag和*pFlag都是持久物件(可以對其取地址),是左值;
vctTemp[0]呼叫了過載的[]操作符,而[]操作符返回的是一個int &,為持久物件(可以對其取地址),是左值;
100和string("hello")是臨時物件(不可以對其取地址),是右值;
str1是持久物件(可以對其取地址),是左值;
str1+str2是呼叫了+操作符,而+操作符返回的是一個string(不可以對其取地址),故其為右值;
m是一個常量引用,引用到一個右值,但引用本身是一個持久物件(可以對其取地址),為左值。

區分清楚了左值與右值,我們再來看看左值引用。左值引用根據其修飾符的不同,可以分為非常量左值引用和常量左值引用。

非常量左值引用只能繫結到非常量左值,不能繫結到常量左值、非常量右值和常量右值。如果允許繫結到常量左值和常量右值,則非常量左值引用可以用於修改常量左值和常量右值,這明顯違反了其常量的含義。如果允許繫結到非常量右值,則會導致非常危險的情況出現,因為非常量右值是一個臨時物件,非常量左值引用可能會使用一個已經被銷燬了的臨時物件。

常量左值引用可以繫結到所有型別的值,包括非常量左值、常量左值、非常量右值和常量右值。

可以看出,使用左值引用時,我們無法區分出繫結的是否是非常量右值的情況。那麼,為什麼要對非常量右值進行區分呢,區分出來了又有什麼好處呢?這就牽涉到C++中一個著名的效能問題——拷貝臨時物件。考慮下面的程式碼:

vector<int> GetAllScores()
{
 vector<int> vctTemp;
 vctTemp.push_back(90);
 vctTemp.push_back(95);
 return vctTemp;
}
當使用vector<int> vctScore = GetAllScores()進行初始化時,實際上呼叫了三次建構函式(一次是vecTemp的構造,一次是return 臨時物件的構造,一次是vecScore的複製構造)。儘管有些編譯器可以採用RVO(Return Value Optimization)來進行優化,但優化工作只在某些特定條件下才能進行。可以看到,上面很普通的一個函式呼叫,由於存在臨時物件的拷貝,導致了額外的兩次拷貝建構函式和解構函式的開銷。當然,我們也可以修改函式的形式為void GetAllScores(vector<int> &vctScore),但這並不一定就是我們需要的形式。另外,考慮下面字串的連線操作:

 string s1("hello");
 string s = s1 + "a" + "b" + "c" + "d" + "e";
在對s進行初始化時,會產生大量的臨時物件,並涉及到大量字串的拷貝操作,這顯然會影響程式的效率和效能。怎麼解決這個問題呢?如果我們能確定某個值是一個非常量右值(或者是一個以後不會再使用的左值),則我們在進行臨時物件的拷貝時,可以不用拷貝實際的資料,而只是“竊取”指向實際資料的指標(類似於STL中的auto_ptr,會轉移所有權)。C++ 11中引入的右值引用正好可用於標識一個非常量右值。C++ 11中用&表示左值引用,用&&表示右值引用,如:

 int &&a = 10;
右值引用根據其修飾符的不同,也可以分為非常量右值引用和常量右值引用。

非常量右值引用只能繫結到非常量右值,不能繫結到非常量左值、常量左值和常量右值。如果允許繫結到非常量左值,則可能會錯誤地竊取一個持久物件的資料,而這是非常危險的;如果允許繫結到常量左值和常量右值,則非常量右值引用可以用於修改常量左值和常量右值,這明顯違反了其常量的含義。

常量右值引用可以繫結到非常量右值和常量右值,不能繫結到非常量左值和常量左值(理由同上)。

有了右值引用的概念,我們就可以用它來實現下面的CMyString類。

class CMyString
{
public:
    // 建構函式
 CMyString(const char *pszSrc = NULL)
 {
  cout << "CMyString(const char *pszSrc = NULL)" << endl;
  if (pszSrc == NULL)
  {
   m_pData = new char[1];
   *m_pData = '\0';
  }
  else
  {
   m_pData = new char[strlen(pszSrc)+1];
   strcpy(m_pData, pszSrc);
  }
 }
 
    // 拷貝建構函式
 CMyString(const CMyString &s)
 {
  cout << "CMyString(const CMyString &s)" << endl;
  m_pData = new char[strlen(s.m_pData)+1];
  strcpy(m_pData, s.m_pData);
 }
 
    // move建構函式     ----        實質上就是·竊取·臨時物件,注意引數的形式
 CMyString(CMyString &&s)
 {
  cout << "CMyString(CMyString &&s)" << endl;
  m_pData = s.m_pData;
  s.m_pData = NULL;
 }
 
    // 解構函式
 ~CMyString()
 {
  cout << "~CMyString()" << endl;
  delete [] m_pData;
  m_pData = NULL;
 }
 
    // 拷貝賦值函式
 CMyString &operator =(const CMyString &s)
 {
  cout << "CMyString &operator =(const CMyString &s)" << endl;
  if (this != &s)
  {
   delete [] m_pData;
   m_pData = new char[strlen(s.m_pData)+1];
   strcpy(m_pData, s.m_pData);
  }
  return *this;
 }
 
    // move賦值函式
 CMyString &operator =(CMyString &&s)
 {
  cout << "CMyString &operator =(CMyString &&s)" << endl;
  if (this != &s)
  {
   delete [] m_pData;
   m_pData = s.m_pData;
   s.m_pData = NULL;
  }
  return *this;
 }
 
private:
 char *m_pData;
};
可以看到,上面我們添加了move版本的建構函式和賦值函式。那麼,添加了move版本後,對類的自動生成規則有什麼影響呢?唯一的影響就是,如果提供了move版本的建構函式,則不會生成預設的建構函式。另外,編譯器永遠不會自動生成move版本的建構函式和賦值函式,它們需要你手動顯式地新增。

當添加了move版本的建構函式和賦值函式的過載形式後,某一個函式呼叫應當使用哪一個過載版本呢?下面是按照判決的優先順序列出的3條規則:
1、常量值只能繫結到常量引用上,不能繫結到非常量引用上。
2、左值優先繫結到左值引用上,右值優先繫結到右值引用上。
3、非常量值優先繫結到非常量引用上。

當給建構函式或賦值函式傳入一個非常量右值時,依據上面給出的判決規則,可以得出會呼叫move版本的建構函式或賦值函式。而在move版本的建構函式或賦值函式內部,都是直接“移動”了其內部資料的指標(因為它是非常量右值,是一個臨時物件,移動了其內部資料的指標不會導致任何問題,它馬上就要被銷燬了,我們只是重複利用了其記憶體),這樣就省去了拷貝資料的大量開銷。

一個需要注意的地方是,拷貝建構函式可以通過直接呼叫*this = s來實現,但move建構函式卻不能。這是因為在move建構函式中,s雖然是一個非常量右值引用,但其本身卻是一個左值(是持久物件,可以對其取地址),因此呼叫*this = s時,會使用拷貝賦值函式而不是move賦值函式,而這已與move建構函式的語義不相符。要使語義正確,我們需要將左值繫結到非常量右值引用上,C++ 11提供了move函式來實現這種轉換,因此我們可以修改為*this = move(s),這樣move建構函式就會呼