TOP K演算法（微軟筆試題統計英文電子書中出現次數最多的k個單詞）

阿新 • • 發佈：2019-01-28

在v_JULY_v的文章中找到了這個問題的解法後用C++實現了一下，發現C++的程式碼非常的簡潔。

主要用到了標準庫中的hash_map，優先順序佇列priority_queue。

演算法的思路是：

從頭到尾遍歷檔案，從檔案中讀取遍歷到的每一個單詞。
把遍歷到的單詞放到hash_map中，並統計這個單詞出現的次數。
遍歷hash_map，將遍歷到的單詞的出現次數放到優先順序佇列中。
當優先順序佇列的元素個數超過k個時就把元素級別最低的那個元素從佇列中取出，這樣始終保持佇列的元素是k個。
遍歷完hash_map，則佇列中就剩下了出現次數最多的那k個元素。

具體實現和結果如下：

//出現次數最多的是個單詞

//出現次數最多的是個單詞
void top_k_words()
{
	timer t;
	ifstream fin;
	fin.open("modern c.txt");
	if (!fin)
	{
		cout<<"can nont open file"<<endl;
	}
	string s;
	hash_map<string,int> countwords;
	while (true)
	{
		fin>>s;
		if (fin.eof())
		{
			break;
		}
		countwords[s]++;
	}
	cout<<"單詞總數 （重複的不計數）:"<<countwords.size()<<endl;
	priority_queue<pair<int,string>,vector<pair<int,string>>,greater<pair<int,string>>> countmax;
	for(hash_map<string,int>::const_iterator i=countwords.begin();
		i!=countwords.end();i++)
	{
		countmax.push(make_pair(i->second,i->first));
		if (countmax.size()>10)
		{
			countmax.pop();
		}
	}
	while(!countmax.empty())
	{
		cout<<countmax.top().second<<" "<<countmax.top().first<<endl;
		countmax.pop();
	}
	cout<<"time elapsed "<<t.elapsed()<<endl;
}

TOP K演算法（微軟筆試題統計英文電子書中出現次數最多的k個單詞）

在v_JULY_v的文章中找到了這個問題的解法後用C++實現了一下，發現C++的程式碼非常的簡潔。主要用到了標準庫中的hash_map，優先順序佇列priority_queue。

統計一篇英文文章中出現次數最多的10個單詞

package se; import java.io.BufferedReader; import java.io.File; import java.io.FileReader; import java.io.IOException; import java.util.

演算法--統計文字中出現次數最多的單詞（字典樹）

統計一個文字中，出現次數最多的單詞：單詞全部小寫，單詞與單詞之間以空格間隔 1.利用字典 key為單詞 value為單詞出現的次數 def mostString(): dict = {} fr = open('preprocessing.txt')

返回（統計）一個列表中出現次數最多的元素

clas 列表元素 center enter ax1 叠代器 orm {} 首先定義一個函數函數內逐行依次解釋為： #定義一個函數def max1(lt):　　 dict1 = {} #建立一個空字典 s = set(lt)

linux中sort（統計檔案中出現次數最多的前10個單詞）

例項 cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100 使用linux命令或者shell實現：檔案words存放英文單詞，格式為每行一個英文單詞

Top K Frequent Elements 選出陣列中出現次數最多的k個元素

原題地址：https://leetcode.com/problems/top-k-frequent-elements/，這個題目要求時間複雜度不能超過O(nlgn)，也就是說常規的排序演算法不可行（排

華為上機試題（java）找出一個字串中出現次數最多的字元

Java求字串中出現次數最多的字元，如String Str = "aaabbcddddee";那麼輸出：d 4 ;若String Str = "aaabbcddddeexxxxxx";那麼輸出：x 6 import java.util.*; import java.uti

統計一篇文章中出現次數最多的前k個詞，文章中一行一詞

應該考慮檔案大小和詞的多少，有一個1G大小的一個檔案，裡面每一行是一個詞，詞的大小不超過16位元組，記憶體限制大小是1M。返回頻數最高的100

判斷一個字符串中出現次數最多的字符，統計這個次數

sdff BE 出現次數 div asd 遍歷轉換成 arr str var str = ‘abaasdffggghhjjkkgfddsssss3444343‘; // 1.將字符串轉換成數組 var newArr = str.spl

判斷一個字符串中出現次數最多的字符，並統計字數

spa bbbb aci light turn border java UNC ber \1 等於 (\w) var s = ‘aaabbbcccaaabbbaaabbbbbbbbbb‘; var a = s.split(‘‘); a.sort();

(ES6的“...“配合ES5‘’forEach‘’)前端面試之判斷一個字串中出現次數最多的字元，統計這個次數

// 判斷一個字串中出現次數最多的字元，統計這個次數 let str = 'aasdadddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddsdasjjhsghkafsagjkg

Problem A: 零起點學演算法91——找出一個數組中出現次數最多的那個元素

#include<stdio.h> int main() { int n,a[20],b[20]={0}; while(scanf("%d",&n)!=EOF) { for(int i=0;i<n;i++) {

sort +awk+uniq 統計檔案中出現次數最多的前10個單詞

原文地址：http://blog.sina.com.cn/s/blog_5dce657a01012ddi.html 作者：小新例項cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head

7-6 求整數序列中出現次數最多的數（10 分）c語言解答

**7-6 求整數序列中出現次數最多的數（10 分）**c語言解答本題要求統計一個整型序列中出現次數最多的整數及其出現次數。輸入格式：輸入在一行中給出序列中整數個數N（0<N≤1000），以及N個整數。數字間以空格分隔。輸出格式：在一行中輸出出現次數最多的整數及

演算法練習08 找出字串中出現次數最多的字元

題目找出一個字串中出現次數最多的字元 const str = 'asdfaaaa' 最後的返回值是字串'a' 實現嗯，我略加思考（半個小時左右），給出了一個複雜的方案，一個屎一般的方案屎一般的方案我的方案是利用redcue，計算出了每個字串出現的頻次

如何統計一本英文書(比如簡愛)中出現次數最多的前1000個單詞

如何統計一本書中出現最多的前1000個單詞，其實只要處理好新單詞的儲存，已經出現單詞個數的統計，和根據出現次數的排序，就基本完成了這個專案。思路：1、從檔案中依次讀取一個個字元，如果是字母字元就放到一個字元陣列中，當讀取的字元是空格或者標點符號時，則已經讀取的字串視為一個單詞，將其儲存起來。&

演算法陣列中出現次數最多的數字 MD

Markdown版本筆記我的GitHub首頁我的部落格我的微信我的郵箱 MyAndroidBlogs baiqiantao bai

js 判斷一個字串中出現次數最多的字元，統計其出現次數

js 判斷一個字串中出現次數最多的字元，統計其出現次數 var str = 'asdfssaaasasasasaa'; var json = {}; for (var i = 0; i < str.length; i++) { if(!json[str.charAt(i

js統計陣列中出現次數最多的元素

想來想去沒想出更好的解決方法。思路就是在ana函式裡先遍歷一遍arr，維護一個數組newArr 用於將所有數值相同的放在陣列中的同一個塊內。另外一個數組unique 用於維護數值唯一，判斷當前的item是否已存在於newArr中。為了方便比較物件的數值相同，

判斷一個字串中出現次數最多的字元，統計這個次數

var str = 'asdfssaaasasasasaa'; var json = {}; for (var i = 0; i < str.length; i++) { if(!json[str.charAt(i)]){ json[str.cha

TOP K演算法（微軟筆試題 統計英文電子書中出現次數最多的k個單詞）

相關推薦

TOP K演算法（微軟筆試題統計英文電子書中出現次數最多的k個單詞）