做一個詞頻統計程式,該程式具有以下功能 基本要求: (1)可匯入任意英文文字檔案 (2)統計該英文檔案中單詞數和各單詞出現的頻率(次數),並能將單詞按字典順序輸出。 (3)將單詞及頻率寫入檔案。
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.Map;
import java.util.Set;
import java.util.TreeMap;
public class Test44 {
public static void main(String[] args) throws IOException {
BufferedReader bufferedReader = new BufferedReader(new FileReader("E:/程式設計方法學/第二次上機任務/in.txt"));
BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter("E:/程式設計方法學/第二次上機任務/out.txt"));
String s;
while ((s = bufferedReader.readLine()) != null) {
Map<String, Integer> map = new TreeMap<String, Integer>();
//建立一個words陣列,分割字串,來統計單詞出現的次數
String[] words = s.split("[【】、.。,\"!--;:?\'\\] ]");
for (int i = 0; i < words.length; i++) {
String key = words[i].toLowerCase();
if (key.length() > 0) {
if (!map.containsKey(key)) {
map.put(key, 1);
} else {// 如果不是第一次出現,就把value值++,那麼value值是多少就是出現了幾次
int value = map.get(key);
value++;
map.put(key, value);
}
}
}
Set<Map.Entry<String, Integer>> entrySet = map.entrySet();
for (Map.Entry<String, Integer> entry : entrySet) {
//System.out.println(entry.getKey() + "---" + entry.getValue());
bufferedWriter.write(entry.getKey() +"---"+ entry.getValue()+"\r\n");
}
bufferedWriter.newLine();
}
// 關閉輸入輸出流
bufferedReader.close();
bufferedWriter.close();
}
}