linux統計txt檔案中單詞出現次數並排序
檔案:a.txt
任務:統計該檔案中每一個單詞出現的次數,並按照出現頻率從大到小排序
sed 's/ /\n/g' "a.txt" | sort | uniq -c | sort -nr
解析:
sed替換
sed 's/被替換的字串/新字串/[替換選項]' filename
替換選項g表示替換文字中所有出現被替換字串之處
uniq統計次數
uniq -c表示列印每行在文字中重複出現的次數
sort排序
-n根據數字大小進行排序
-r將排序結果逆向顯示
增強版:
sed -e 's/\?//g' -e 's/ /\n/g' "test.txt" | sort | uniq -c | sort -nr
test.txt檔案為:hello mylove i love you how about you do you love me?
當sed包含多個命令時,需要用-e分隔開來,第一個表示過濾掉檔案中的"?"再進行計算。
輸出結果為:
3 you
2 love
1 mylove
1 me
1 i
1 how
1 hello
1 do
1 about
相關推薦
linux統計txt檔案中單詞出現次數並排序
檔案:a.txt 任務:統計該檔案中每一個單詞出現的次數,並按照出現頻率從大到小排序 sed 's/ /\n/g' "a.txt" | sort | uniq -c | sort -nr 解析: sed替換 sed 's/被替換的字串/新字串/[替換選項]' fil
Hadoop 統計檔案中單詞出現的次數
pom.xml <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://
Linux awk+uniq+sort 統計檔案中某字串出現次數並排序
在伺服器開發中,我們經常會寫入大量的日誌檔案。有時候我們需要對這些日誌檔案進行統計。Linux中我們可以利用以下命令簡單高效的實現這一功能。 需要用到的命令簡介 cat命令 cat命令主要有三大功能 1.一次顯示整個檔案 cat file
統計檔案中單詞出現的頻次
public class Util{ public static void main(String[] args) throws IOException { //鍵盤錄入指定檔名 Scanner sc = new Scanner(Sys
linux統計一個檔案中特定字元的個數
統計一個檔案中某個字串的個數,其實就是在在一塊沙地裡面找石頭,有的人看到石頭以後,在上面做個標記(grep),然後記住自己做了多少個標記;有的人看到石頭以後,把它挖了(tr),最後統計自己挖了多少石頭;有的人看到石頭以後,把它跳過去(awk),然後統計自己跳了多少次。這是我用的的檔案 [[
[Trie樹] 統計英文文字中單詞出現的個數 - C語言實現 - 考慮數字、英文
【英文文字】 However, after reaching the shore there are plenty of challenges waiting for him."The biggest challenge now is learning to walk agai
【OS大作業】用多執行緒統計txt檔案中字元個數(Java實現)
問題描述 給定一個txt檔案,利用不同個數的執行緒查詢檔案中某字元的個數,探究執行緒個數與查詢時間的關係。 本作業程式碼使用JAVA實現,版本為10.0.2,使用的IDE為Eclipse4.9.0. 結果測試所用的txt檔案內容為英文,編碼格式為UTF-8。 原始碼 第一版程式碼:(
統計字串中字元出現次數以及排序
題目是這樣的,對字串“sdfgzxcvasdfxcvdf”每個字元出現次數並對其排序 public static void main(String[] args) { //統計字串中英文字元的出現次數
Java中IO流-29-IO流練習題:統計一個檔案中字元出現個數
這篇來利用IO流知識來做兩個練習題。第一個題目是在文字檔案中統計字元出現次數,並寫入到一個txt檔案裡。第二個練習題是模擬,試用軟體30天倒計時,這裡我們簡化一下,執行一次程式碼,試用天就減去1天。 1.文字檔案內統計字元出現個數 題目:給定一個文字檔案,統計字元出現個數
資料集生成方法:Python讀取txt檔案中的URL路徑並下載圖片
1.資料來源: 可針對自己的模型需要在imagenet官網上下載所需類別對應的txt檔案。 2.資料下載: import os from urllib.request import urlretrieve def download(): catego
Python每日一題:第3題:統計一個檔案中每個單詞出現的次數
題目: 統計一個檔案中每個單詞出現的次數,列出出現頻率最多的5個單詞。 前言: 這道題在實際應用場景中使用比較廣泛,比如統計歷年來四六級考試中出現的高頻詞彙,記得李笑來就利用他的程式設計技能出版過一本背單詞的暢銷書,就是根據詞頻來記單詞,深受學生喜歡。這就是一個把程式設計技能用來解決實際問
做一個詞頻統計程式,該程式具有以下功能 基本要求: (1)可匯入任意英文文字檔案 (2)統計該英文檔案中單詞數和各單詞出現的頻率(次數),並能將單詞按字典順序輸出。 (3)將單詞及頻率寫入檔案。
import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.FileReader; import java.io.FileWriter; import java.io.IOExcep
統計一個檔案中各個字母出現次數
import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; /**
Java版統計文件中的每個單詞出現次數
ack ioe .cn style pri .html key red reg 正則表達式之Pattern和Matcher,請參見轉載博客 http://www.cnblogs.com/haodawang/p/5967219.html 代碼實現: 1 import
使用shell指令碼統計檔案中ip出現的次數
首先準備檔案demo.txt,內容如下: 1 192.168.41.20 2 192.168.41.21 3 192.168.41.22 4 192.168.41.23 5 192.168.41.24 6 192.168.41.25 統
IOS菜鳥的所感所思(十一)——統計文字中單詞出現的次數並按照次數高低排序
//確認我放英文檔案的目錄下又該檔案, - (NSString *)getFileData{ //這是放在其沙盒路徑下 // NSString *docDirPath = [NSSearchPathForDirectoriesInDomains(NSCachesDirectory, NS
統計一TXT文件中單詞出現頻率,輸出頻率最高的10個單詞
實驗過程 主要思路就是首先將標點符號,常用冠詞等替換掉,然後利用雜湊表和陣列原理排序,輸出最高頻率的前十個陣列 程式碼如下 import java.io.BufferedReader; import java.io.File; import java.io.Fil
Linux統計文本中某個字符串出現的次數
技術分享 png inf 文本 兩種 log 出現 打開 mage 常用的有如下兩種方式: 1.VIM 用vim打開文件,然後輸入: :%s/hello//gn 如下圖: 圖中的例子就是統計文本中”hello”字符串出現的次數 2.GREP配合wc命令 grep -o &
統計檔案中單詞的個數
include”stdafx.h” include include include define Inti_word 0 define In_word 1 define Out_word 2 define End_word 3 int Count_word(c
,編寫一個程式,將a.txt檔案中的單詞與b.txt檔案中的單詞交替合併到c.txt檔案中,a.txt檔案中的單詞用回車符分隔,b.txt檔案中用回車或空格進行分隔.
在java面試寶典看到這樣一題,看到答案真蛋疼,看了半天才明白,可能每個人的想法不一樣!答案也不知道是那位前輩寫的,讓人理解起來太費精了!老饒彎子,以下是本人自已整理的,去面試如果真有這麼一題,應該不成問題了。。。。。。。如有不是的地方還望指點 package accp