1. 程式人生 > >任意一個英文的純文本文件,統計其中的單詞出現的個數(shell python 兩種語言實現)

任意一個英文的純文本文件,統計其中的單詞出現的個數(shell python 兩種語言實現)

統計文本英文單詞個數 python shell sort uniq

現有plain text titled test.txt,統計其中的單詞出現的個數。

test.txt的內容:

i have have application someday oneday day demo

i have some one coma ideal naive i


用python實現的代碼:

import re

count = {}

f = open(‘test‘,‘r‘)

b = f.read()

#print b

cd = re.split(‘[ \\n]+‘,b) #註意split的用法

print cd


for i in cd:

count[i] = count.get(i,0) + 1#註意get()方法的用法

print count


執行代碼後得到的結果:

[‘i‘, ‘have‘, ‘have‘, ‘application‘, ‘someday‘, ‘oneday‘, ‘day‘, ‘demo‘, ‘i‘, ‘have‘, ‘some‘, ‘one‘, ‘coma‘, ‘ideal‘, ‘naive‘, ‘i‘]

{‘someday‘: 1, ‘i‘: 3, ‘demo‘: 1, ‘naive‘: 1, ‘some‘: 1, ‘one‘: 1, ‘application‘: 1, ‘ideal‘: 1, ‘have‘: 3, ‘coma‘: 1, ‘oneday‘: 1, ‘day‘: 1}


shell實現的方法為:

tr " " "\\n"

運行結果為


1 application

1 coma

1 day

1 demo

3 have

3 i

1 ideal

1 naive

1 one

1 oneday

1 some

1 someday






本文出自 “Jason的博客” 博客,請務必保留此出處http://jason83.blog.51cto.com/12723827/1982168

任意一個英文的純文本文件,統計其中的單詞出現的個數(shell python 兩種語言實現)