軟工作業：詞頻統計

阿新 • • 發佈：2018-10-08

oerr eve png 之前 call urn 程序代碼 int http

一、程序分析

（1）讀文件到緩沖區 process_file(dst)

def process_file(dst):
    try:
        f = open(dst, "r") #打開文件
    except IOError as s:
        print(s)
        return None
    try:
        bvffer = f.read() #讀文件到緩沖區
    except:
        print(‘Read File Error!‘)
        return None
    f.close()
    return bvffer

（2）統計緩沖區的裏每個單詞的頻率，放入 process_buffer(bvffer)

def process_buffer(bvffer):
    if bvffer:
        word_freq = {}
        # 下面添加處理緩沖區 bvffer代碼，統計每個單詞的頻率，存放在字典word_freq
        for ch in ‘“‘!;,.?”‘: #把換行都換為空
            bvffer = bvffer.lower().replace(ch, " ")
        words = bvffer.strip().split()
         
for word in words:
            word_freq[word] = word_freq.get(word, 0) + 1 #給單詞計數
        return word_freq

（3）輸出詞頻前十的單詞 output_result(word_freq)

def output_result(word_freq):
    if word_freq:
        sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1],reverse=True)
        for item in sorted_word_freq[:10]: # 輸出 Top 10 的單詞
            print(item)

（4）主函數對之前的函數進行整合

if __name__ == "__main__":
    path =  "E:\Gone_with_the_wind.txt"
    bvffer = process_file(path)
    word_freq = process_buffer(bvffer)
    output_result(word_freq)

二、代碼風格說明

python代碼在每行末尾不用加“；”

例如：

path =  "E:\Gone_with_the_wind.txt"
    bvffer = process_file(path)
    word_freq = process_buffer(bvffer)
    output_result(word_freq)

三、程序運行命令、運行結果截圖

技術分享圖片

四、性能分析結果及改進

（1）執行時間最多的代碼

技術分享圖片

(2）執行次數最多的代碼

技術分享圖片

（3）嘗試改進程序代碼

減少運行時間：減少耗時最長的代碼的運行時間

將

        for ch in ‘“‘!;,.?”‘:
            bvffer = bvffer.replace(ch, " ")

改為

     bvffer = bvffer.lower()
         for ch in ‘“‘!;,.?”‘:
            bvffer = bvffer.replace(ch, " ")

可視化操作

根據運行次數排序方式分析命令：

python -m cProfile -o resultc.out -s call test3.py

python gprof2dot.py -f pstats result.out | dot -Tpng -o result.png

根據占用時間排序方式分析命令：

python -m cProfile -o result.out -s cumulative test3.py

python gprof2dot.py -f pstats result.out | dot -Tpng -o result.png

技術分享圖片

軟工作業：詞頻統計

oerr eve png 之前 call urn 程序代碼 int http 一、程序分析（1）讀文件到緩沖區 process_file(dst) def process_file(dst): try: f = open(dst, "r") #打

軟工作業：（2）硬幣遊戲—— 代碼分析與改進

style hold -a p s alpha .py get 倉庫 xlabel 軟工作業：（2）硬幣遊戲—— 代碼分析與改進一、作業要求 1、Python 程序閱讀理解 2、學習Python 編碼風格指南中譯版（Google SOC）（http://blog.csd

軟工作業：（3）用戶體驗分析

span 基礎管理用戶體驗過程在線菜單 ges log 一.作業目標及要求 http://www.cnblogs.com/juking/p/7660646.html 二、分析過程及內容（一）滿意的地方 1.必要的提示和幫助文檔 ①在公共號服務未出現故障的情況

2017（秋）軟工作業：（3）用戶體驗分析

調整進行提供服務 src http -a 快速在線使用 1.目標：基於實例分析，體會用戶體驗設計的7條準則（1）給用戶及時快速反饋；（2）界面符合慣例；（3）用戶控制權（主人）；（4）一致性和標準化；（5）適合各類用戶（不絕對）（6）幫助用戶排除軟件缺陷

期末綜合大作業：詞頻統計

ace 技術分享 nco IV style txt lam bubuko #1. bigFile = open(‘big.txt‘,mode=‘r‘,encoding=‘utf-8‘) bigText=bigFile.read() bigFile.close() pri

軟工作業：實現WordCount命令行程序(更新中)

合計需要代碼規範時間 ble ali 編碼 rem class 軟工作業：實現WordCount命令行程序(更新中) gayhub地址 PSP2.1 Personal Software Process Stages 預估耗時（分鐘）實際耗時（分鐘） P

軟工作業3：詞頻統計

tex split() 數據復雜 all p s pro ioe 創建一、案例程序分析 1.1、編譯環境 pycharm2017、python3.6 1.2、讀文件到緩沖區（process_file(dst)） 1 de

軟工作業三：對輸入文件的詞頻統計

包括 asc filename pro ava ext 符號 function width 一、程序分析　　（1）、讀文件到緩沖區 def process_file(dst): #讀文件到緩沖區 try:

軟工作業3：Python詞頻統計

alt stat 小寫代碼 strong pla 創建處理 inf 一、程序分析 1.讀文件到緩沖區 def process_file(dst): # 讀文件到緩沖區 try: # 打開文件 file=open(dst,"r

軟工作業4：詞頻統計 ——基本功能

結對編程 arm 如何溝通如果單詞 for循環路徑決策 match 一、基本信息 1、編譯環境：Pycharm2018、Python3.8 2、作者：1613072007 周磊 1613072008 俞林森 3、項目地址：https://gitee

軟工作業 4：結對項目之詞頻統計——基本功能

ati 與他如果 lam req ESS fin 有效 stop 一、基本信息　　1、本次作業的地址：https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2088 　 2、項目Git地

軟工作業4：詞頻統計

一、基本資訊 # 編譯環境：Pycharm2018、Python3.7 # 專案名稱：詞頻統計——基本功能（結對程式設計） # 作者: 1613072050：馬鈺 # 1613072051：朱佳豪 # 1613072052:申可佳二、

軟工作業 4：結對專案之詞頻統計——基本功能

一、基本資訊　　1、本次作業的地址：https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2088 　 2、專案Git地址：https://gitee.com/ntucs/Pai

軟工作業4：詞頻統計——基本功能

一、基本資訊編譯環境：Python3.7 專案名稱：詞頻統計——基本功能（結對程式設計）作者：1613072036：譚琪 1613072037：張銘銳專案Git地址：https://gitee.com/zmryy

軟工作業 5：結對專案之詞頻統計——增強功能

軟工作業5：詞頻統計——增強功能一、基本資訊 1.1 編譯環境、專案名稱、作者　　 1 #編譯環境:python3,Geany 2 #專案名稱：結對專案詞之詞頻統計—增強功能 3 #作者：1613072037 張銘銳 4 #

福大軟工1816 · 第二次作業——單詞詞頻統計

process 任務 sof ftw plan improve project devel lan 一、Fork的同名倉庫的Github項目地址 github項目地址二、PSP表格 PSP2.1 Personal Software Process Stages 預估

軟工作業2：硬幣遊戲——代碼的分析與改進

lis com color detail ogl .com commit mon atp 目的： Python 程序閱讀理解學習Python 編碼風格指南中譯版（Google SOC）, 改進Python程序如何設計遊戲規則，使得慈善事業可持續。地鐵口放置硬幣箱

[SakuraiYo][軟工作業(3)]用戶體驗分析：以“南通大學教務管理系統微信公眾號”為例

自動客戶端受限幫助信息 img 堅持理由公告作業一.目標基於實驗分析，體會用戶體驗設計的7 條準則。二. 要求（1）基於我們列出的 7 條UX評價準則，分析“南通大學教務管理系統微信公眾號” 在用戶體驗設計方面讓你覺得滿意的地方（不少於2點）；（20分）

軟工作業3：用戶體驗分析——以“南通大學教務管理系統微信公眾號”為例

結果我們體驗截圖客戶基於快捷要求用戶一、目標基於實例分析，體會用戶體驗設計的 7 條準則。二、要求 1.基於 7 條UX評價準則，分析“南通大學教務管理系統微信公眾號” 在用戶體驗設計方面滿意的地方並陳述理由。 2.同樣

軟工作業4：用戶體驗分析：以 “師路南通網站” 為例

在線咨詢獲取平臺導航欄二維無法登陸我們圖片標題一、目標：針對師路南通，開展UX分析。 PS：對比另外2個學習網站：1. UMU學習平臺；2. 學生安全教育平臺基於實例分析，體會用戶體驗設計的 7 條準則。二、過程（一）滿意的地

軟工作業：詞頻統計

一、程序分析

三、程序運行命令、運行結果截圖

四、性能分析結果及改進

（1）執行時間最多的代碼

相關推薦