1. 程式人生 > >讀《深度探索C++物件模型》之物件成員的效率

讀《深度探索C++物件模型》之物件成員的效率

測試平臺:華碩N53S(五年前的老機子)

編譯環境:VS2010

接下來我將會有多個測試,在多個不同環境下的所消耗的時間比較:

五個測試分別為:個別的區域性變數、區域性陣列、struct之的Public、class 之中的inline Get函式、 class之中的inline Get & Set函式:

程式碼片段如下:

struct Point
{
	Point(float mx, float my, float mz)
	{
		x = mx; y = my; z = mz;
	}
	float x, y, z;
};

class Point3D
{
public:
	Point3D(float xx = 0.0f, float yy = 0.0f, float zz = 0.0f)
		:_x(xx), _y(yy), _z(zz)
	{

	}

	float &x () {return _x;}
	float &y () {return _y;}
	float &z () {return _z;}

	void x(float nx) {_x = nx;}
	void y(float ny) {_y = ny;}
	void z(float nz) {_z = nz;}

private:
	float _x, _y, _z;
};

int main()
{
	double dur;
	clock_t start, end;
	//local 
	float pA_x = 1.725f, pA_y = 0.875f, pA_z = 0.478f;
	float pB_x = 0.315f, PB_y = 0.317f, PB_z = 0.838f;
	start = clock();
	for (unsigned i = 0; i < 100000000; ++i)
	{
		pB_x = pA_x - PB_z;
		PB_y = pA_y - pB_x;
		PB_z = pA_z - PB_y;
	}
	end = clock();
	dur = double(end - start);
	printf("Use time 1 : %f\n", (dur/CLOCKS_PER_SEC));
	//
	enum fussy{x, y, z};
	float pA[3] = {1.725f, 0.875f, 0.478f};
	float pB[3] = {0.315f, 0.317f, 0.838f};
	start = clock();
	for (unsigned i = 0; i < 100000000; ++i)
	{
		pB[x] = pA[x] - pB[z];
		pB[y] = pA[y] + pB[x];
		pB[z] = pA[z] + pB[y];
	}
	end = clock();
	dur = double(end - start);
	printf("Use time 2 : %f\n", (dur/CLOCKS_PER_SEC));

	Point sPa(1.725f, 0.875f, 0.478f);
	Point sPb(0.315f, 0.317f, 0.838f);
	start = clock();
	for (unsigned i = 0; i < 100000000; ++i)
	{
		sPb.x = sPa.x - sPb.z;
		sPb.y = sPa.y + sPb.x;
		sPb.z = sPa.z + sPb.y;
	}
	end = clock();
	dur = double(end - start);
	printf("Use time 3 : %f\n", (dur/CLOCKS_PER_SEC));

	Point3D cpA(1.725f, 0.875f, 0.478f);
	Point3D cpB(0.315f, 0.317f, 0.838f);
	start = clock();
	for (unsigned i = 0; i < 100000000; ++i)
	{
		cpB.x() = cpA.x() - cpB.z();
		cpB.y() = cpA.y() + cpB.x();
		cpB.z() = cpA.z() + cpB.y();
	}
	end = clock();
	dur = double(end - start);
	printf("Use time 4 : %f\n", (dur/CLOCKS_PER_SEC));

	Point3D cpA1(1.725f, 0.875f, 0.478f);
	Point3D cpB1(0.315f, 0.317f, 0.838f);
	start = clock();
	for (unsigned i = 0; i < 100000000; ++i)
	{
		cpB1.x(cpA1.x() - cpB1.z());
		cpB1.y(cpA1.y() + cpB1.x());
		cpB1.z(cpA.z() + cpB.y());
	}
	end = clock();
	dur = double(end - start);
	printf("Use time 5 : %f\n", (dur/CLOCKS_PER_SEC));


	system("pause");
	return 0;
}

在不開啟如何優化的時間下,所用的時間如下:


可以看出,在不優化的情況下,前面三種幾乎時間是一樣的,因為可以說是C的用法,後面兩種是C++的用法,所消耗的時間幾乎是前兩種的2倍,應該是由於封裝所帶來的時間吧。下面在打卡vs2010的全部優化開關的情況下所用的時間:


可以看到,在優化全部開啟的情況下,五種情況下的時間,基本上都為1.165ms,類所帶來的封裝也就沒有帶來什麼執行期的效率成本了。

那如果加上繼承呢,那我們再次來驗證一下:

單一的繼承:

優化的情況下:


未優化的情況下:


虛擬繼承(單一)(指的是Point2d虛擬繼承於Point1d):

優化的情況下:


未優化的情況下:


在多層的虛擬繼承情況下呢:

優化的情況下:


未優化的情況下:


可以看到,對於虛擬繼承來說,所消耗的時間會比較多些,可能是因為我的測試比較簡單,不是很明顯。

所以能不用虛擬繼承,就不要用吧,除非沒辦法了。