1. 程式人生 > >java 中的split效能分析

java 中的split效能分析

java中的split函式對於字串操作有時很有用,但由於效率問題,大家都是望而卻步。下面看看常用的split方法:

1)String.split函式

2)使用StringTokenizer進行

3)使用org.apache.commons.lang.StringUtils.split 函式

測試程式碼:

public class splitTest {

	private static final String SPLITSTR = " ";

	public static String generateStr(int words) {
		StringBuilder sb = new StringBuilder(words * (" String".length()) + 1);
		for (int i = 0; i < words; i++) {
			sb.append(" String");
		}
		return sb.toString();
	}

	public static long orginalsplitperformance(String str) {
		long begin = System.nanoTime();
		for (int i = 0; i < 100000; i++) {
			@SuppressWarnings("unused")
			List<String> list = Arrays.asList(str.split(SPLITSTR));
		}
		long end = System.nanoTime();
		return end - begin;
	}

	public static long strtokensplitperformance(String str) {
		long begin = System.nanoTime();
		for (int i = 0; i < 100000; i++) {
			StringTokenizer token = new StringTokenizer(str, SPLITSTR);
			List<String> list = new ArrayList<String>();
			while (token.hasMoreTokens())
				list.add(token.nextToken());
		}
		long end = System.nanoTime();
		return end - begin;
	}

	public static long apachesplitformance(String str) {
		long begin = System.nanoTime();
		for (int i = 0; i < 100000; i++) {
			@SuppressWarnings("unused")
			List<String> list = Arrays.asList(StringUtils.split(str, SPLITSTR));
		}
		long end = System.nanoTime();
		return end - begin;
	}

	public static void main(String[] args) {

		
		String str = " Swift集成了 現代程式語言思想,以及A pple工程文化的 智慧。編譯器是按照 效能優化的,而語言是為開發優化的,無需互相折中。(by gashero)可以從 開	始 學起並過渡到整個系統。所有這 些使得Swift成為Apple軟體開發者創新的源泉。";
      
		System.out.println(orginalsplitperformance(str));
		System.out.println(strtokensplitperformance(str));
		System.out.println(apachesplitformance(str));
		
	}

一次執行結果:

265431698
227020193
128523573

究其原因,String.split函式使用的事正則表示式,所以效率比較低。StringTokenizer方法在構造中進行了處理,減少了時間消耗。而apache的StringUtils.split(string,char)直接code,效率最高。我們還可以對中間結果進行快取進行效能改進,或者對於使用正則表示式的,可以對正則進行一次

編譯,多次使用。

當然我們測試時間可能受別的因素的影響不是十分的準確,如果要得到公正的結果可以採用jmh library。但是這些足以說明問題。