1. 程式人生 > >程式設計小知識之效能優化

程式設計小知識之效能優化

本文簡述了一種效能優化中常見的思維誤區

程式開發總是離不開效能優化,雖然規避不成熟優化的箴言早已有之,但我們又往往會被自己翻湧的思維火花所牽絆,義無反顧的開啟自己的效能劣化之旅…

考慮下面的一個簡單問題(以 C# 為例):

  • 編寫一個字串修飾函式:給定一個字串,為其新增一個固定的字串字尾

這個函式在譬如檔案處理過程中很常用,程式碼也非常簡單:

const string SUFFIX = ".suffix";
public string Decorate(string str)
{
	return str + SUFFIX;
}

考慮到字串拼接操作比較耗費資源(一次記憶體分配操作和兩次字串拷貝操作),函式新增的字尾又是固定的(靜態),我們大可以將結果進行快取(假設記憶體是充足的),於是我們有了新的 Decorate 函式實現:

const string SUFFIX = ".suffix";
Dictionary<string, string> s_buffer = new Dictionary<string, string>();
public string DecorateCache(string str)
{
	if (!s_buffer.ContainsKey(str))
	{
		s_buffer.Add(str, str + SUFFIX);
	}
	
	return s_buffer[str];
}

至此,我們順利的完成了一次效能劣化

WTF?

簡單編寫一個測試程式(給定的字串引數較短):

int perfCount = 1000000;
string path = "path";
			
{
	var stopWatch = Stopwatch.StartNew();
	
	for (int i = 0; i < perfCount; ++i)
	{
		StringUtil.Decorate(path);
	}
	
	Console.WriteLine("perf1 time " + stopWatch.ElapsedMilliseconds);
}

{
	var stopWatch = Stopwatch.StartNew();
	
	for (int i = 0; i < perfCount; ++i)
	{
		StringUtil.DecorateCache(path);
	}
	
	Console.WriteLine("perf2 time " + stopWatch.ElapsedMilliseconds);
}

發現 DecorateCache 函式的執行時間是 Decorate 函式的 1.5 倍!實際上,只有當新增的字尾字串(SUFFIX) 較長時(給定的字串引數較短), Decorate 函式的執行時間才會高於 DecorateCache 函式,但進一步的測試表明,新增的字尾字串長度需要 >= 80 才會出現這種情況,這在實際中基本是不會出現的,相反,給定的字串引數卻往往很長(譬如檔案路徑),所以更加符合實際的測試程式碼應該是這樣的(給定的字串引數較長):

int perfCount = 1000000;
string path = "longlonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglonglongpath";
			
{
	var stopWatch = Stopwatch.StartNew();
	
	for (int i = 0; i < perfCount; ++i)
	{
		StringUtil.Decorate(path);
	}
	
	Console.WriteLine("perf1 time " + stopWatch.ElapsedMilliseconds);
}

{
	var stopWatch = Stopwatch.StartNew();
	
	for (int i = 0; i < perfCount; ++i)
	{
		StringUtil.DecorateCache(path);
	}
	
	Console.WriteLine("perf2 time " + stopWatch.ElapsedMilliseconds);
}

這種情況下, DecorateCache 函式的執行時間是 Decorate 函式的 2 倍!

造成這種情況的原因其實是個偏工程的問題: Dictionary 的 indexer 和 ContainsKey 都涉及的內部函式 FindEntry 的實現.

這裡我們不去深入細節,只要知道 FindEntry 其實是個時間複雜度為 O(n) 的操作即可(n為給定字串引數的長度),而之前的 Decorate 函式雖然時間複雜度也是 O(n),但由於工程實現問題,實際上的執行速度是要更快的.

這裡還有一個變數: Decorate 函式涉及的一次記憶體分配.這導致我們不能簡單的對 Decorate 函式和 DecorateCache 函式做效能比較.

但我們仍然可以認為,一般情況下, Decorate 函式是優於 DecorateCache 函式的!

於是我們又迴歸了最初的函式實現:

const string SUFFIX = ".suffix";
public string Decorate(string str)
{
	return str + SUFFIX;
}

小結 : 對於效能優化,大膽假設,小心求證,信自己,更要信 Profiling

參考資料

(CSDN的程式碼塊顯示格式縮排總有問題,不知是Bug還是自己使用不當,有知道的朋友麻煩告訴一聲~)