1. 程式人生 > >出現特殊分隔符無法分隔解決方案

出現特殊分隔符無法分隔解決方案

今天處理文字資料時候遇到這種文字用空格和tab正則匹配沒有作用,後來問了同事發現可以用“\\uf8f5”去匹配。

待處理文字:

A	abbr.安 
A-10IInone.美空軍主力近距離空中支援攻擊機,無愧為“坦克殺手”。
A-12none.夭折的美海軍第一種隱形艦載攻擊機。
A-4  none.54年服役的單座輕型艦載攻擊機,現仍被多國使用。
A-6none.雙座重型全天候艦載攻擊機,主要用於低空突防,可進行核打擊。
A-7IInone.離開沙場的單座亞音速攻擊機,曾是美海空軍主力。
A-OKnone.極好, 妙極, 完美的
A-Znone.無所不包的
A-boilern.原子反應器加熱用的鍋爐
A-bombn.原子彈
A-certificatenone.兒童不宜n.A級
A-controln.原子能管制
A-energyn.原子能
A-framen.金字塔形建築物
A-lovelnone.英語學校裡某一課程結束時舉行的高深考試, 高深級考試及格
A-oneadj.第一等的, 第一流的
A-roadnone.A級公路, 主車道
A-siden.A面
A-testn.原子爆炸試驗
A-weaponn.原子武器

分隔處理:

	public static void main(String[] args) throws Exception {
		String dic = util.Directory.GetAppPath("steamData") + "dic.txt.bak";
		BufferedReader br = util.MyFileTool.GetBufferReader(dic);
		while(br.ready()) {
			String line = br.readLine();
			String[] words = line.split("\\uf8f5");
			System.out.println("size: " + words.length);
			System.out.println(words[0]);
		}
		br.close();
	}