軟工作業3：Python詞頻統計

阿新 • • 發佈：2018-10-09

alt stat 小寫代碼 strong pla 創建處理 inf

一、程序分析

1.讀文件到緩沖區

def process_file(dst):     # 讀文件到緩沖區
    try:     # 打開文件
        file=open(dst,"r")
    except IOError as s:
        print(s)
        return None
    try:     # 讀文件到緩沖區
        bvffer=file.read()
    except:
        print("Read File Error!")
        return None
    file.close()
     
return bvffer

2.設置緩沖區，將文本度數緩沖區，並對文本的特殊符號進行修改，使其更容易處理，並讀入字典

def process_buffer(bvffer):
    if bvffer:
        word_freq = {}
        # 下面添加處理緩沖區 bvffer代碼，統計每個單詞的頻率，存放在字典word_freq
        for i in ‘!"#$%&()*+-,-./:;<=>?@“”[\\]^_{|}~‘:
            bvffer = bvffer.replace(i, " ")  # 替換特殊字符 

        bvffer = bvffer.lower()  # 把大寫字母轉換為小寫
        words = bvffer.split()  # 分割字符串
        for word in words:
            word_freq[word] = word_freq.get(word, 0)+1
        return word_freq

3.輸出函數將處理好的單詞按詞頻排序，輸出詞頻Top10 的單詞

def output_result(word_freq):
    if word_freq:
        sorted_word_freq  
= sorted(word_freq.items(), key=lambda v: v[1], reverse=True)
        for item in sorted_word_freq[:10]:  # 輸出 Top 10 的單詞
            print(item)

4.封裝main函數

def main():
    parser = argparse.ArgumentParser()
    parser.add_argument(‘dst‘)
    args = parser.parse_args()
    dst = args.dstdst = "Gone_with_the_wind.txt"
    bvffer = process_file(dst)
    word_freq = process_buffer(bvffer)
    output_result(word_freq)

5.cProfile的性能評估

if __name__ == "__main__":
    import cProfile
    import pstats
    import argparse
    cProfile.run("main()", "result")
    # 直接把分析結果打印到控制臺
    p = pstats.Stats("result")  # 創建Stats對象
    p.sort_stats(‘calls‘).print_stats(10)
    # 按照調用次數排序，打印前10函數的信息
    p.strip_dirs().sort_stats("cumulative", "name").print_stats(10)
    p.print_callers(0.5, "process_file")  # 得知哪些函數調用了process_file
    p.print_callers(0.5, "process_buffer")  
    p.print_callers(0.5, "output_result")

二、代碼風格說明

縮進

if bvffer:
        word_freq = {}

三、程序運行命令、運行結果截圖

對Gone_with_the_wind.txt進行詞頻統計：

運行截圖：

技術分享圖片

按執行次數：

按執行時間：

四、性能分析結果及改進

執行次數最多：

技術分享圖片

執行時間最多：

改進代碼：

分析：可以去掉其中的部分不可能出現的符號

原來代碼：

for i in ‘!"#$%&()*+-,-./:;<=>?@“”[\\]^_{|}~‘:
            bvffer = bvffer.replace(i, " ")  # 替換特殊字符

改進之後：

for i in ‘!"()+-,-./:;<=>?“”^~‘:
            bvffer = bvffer.replace(i, " ")  # 替換特殊字符

技術分享圖片

軟工作業3：Python詞頻統計

alt stat 小寫代碼 strong pla 創建處理 inf 一、程序分析 1.讀文件到緩沖區 def process_file(dst): # 讀文件到緩沖區 try: # 打開文件 file=open(dst,"r

軟工作業3：詞頻統計

tex split() 數據復雜 all p s pro ioe 創建一、案例程序分析 1.1、編譯環境 pycharm2017、python3.6 1.2、讀文件到緩沖區（process_file(dst)） 1 de

軟工作業3：用戶體驗分析——以“南通大學教務管理系統微信公眾號”為例

結果我們體驗截圖客戶基於快捷要求用戶一、目標基於實例分析，體會用戶體驗設計的 7 條準則。二、要求 1.基於 7 條UX評價準則，分析“南通大學教務管理系統微信公眾號” 在用戶體驗設計方面滿意的地方並陳述理由。 2.同樣

軟工作業 3：個人編程

align 作業輸出 ima bsp 打開文件 reverse text pro 一、程序分析 def process_file(dst): # 讀文件到緩沖區 try: # 打開文件 f=open(dst,‘r‘) except

軟工作業 3：個人編程練習

call pre tps items ati put 程序及其排序一、程序分析 1、讀文件到緩沖區 def process_file(dst): # 讀文件到緩沖區 try: # 打開文件 doc=open(dst, ‘r‘)

軟工作業三：對輸入文件的詞頻統計

包括 asc filename pro ava ext 符號 function width 一、程序分析　　（1）、讀文件到緩沖區 def process_file(dst): #讀文件到緩沖區 try:

軟工作業4：詞頻統計 ——基本功能

結對編程 arm 如何溝通如果單詞 for循環路徑決策 match 一、基本信息 1、編譯環境：Pycharm2018、Python3.8 2、作者：1613072007 周磊 1613072008 俞林森 3、項目地址：https://gitee

軟工作業 4：結對項目之詞頻統計——基本功能

ati 與他如果 lam req ESS fin 有效 stop 一、基本信息　　1、本次作業的地址：https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2088 　 2、項目Git地

軟工作業4：詞頻統計

一、基本資訊 # 編譯環境：Pycharm2018、Python3.7 # 專案名稱：詞頻統計——基本功能（結對程式設計） # 作者: 1613072050：馬鈺 # 1613072051：朱佳豪 # 1613072052:申可佳二、

軟工作業 4：結對專案之詞頻統計——基本功能

一、基本資訊　　1、本次作業的地址：https://edu.cnblogs.com/campus/ntu/Embedded_Application/homework/2088 　 2、專案Git地址：https://gitee.com/ntucs/Pai

軟工作業4：詞頻統計——基本功能

一、基本資訊編譯環境：Python3.7 專案名稱：詞頻統計——基本功能（結對程式設計）作者：1613072036：譚琪 1613072037：張銘銳專案Git地址：https://gitee.com/zmryy

軟工作業 5：結對專案之詞頻統計——增強功能

軟工作業5：詞頻統計——增強功能一、基本資訊 1.1 編譯環境、專案名稱、作者　　 1 #編譯環境:python3,Geany 2 #專案名稱：結對專案詞之詞頻統計—增強功能 3 #作者：1613072037 張銘銳 4 #

[SakuraiYo][軟工作業(3)]用戶體驗分析：以“南通大學教務管理系統微信公眾號”為例

自動客戶端受限幫助信息 img 堅持理由公告作業一.目標基於實驗分析，體會用戶體驗設計的7 條準則。二. 要求（1）基於我們列出的 7 條UX評價準則，分析“南通大學教務管理系統微信公眾號” 在用戶體驗設計方面讓你覺得滿意的地方（不少於2點）；（20分）

軟工作業2：硬幣遊戲——代碼的分析與改進

lis com color detail ogl .com commit mon atp 目的： Python 程序閱讀理解學習Python 編碼風格指南中譯版（Google SOC）, 改進Python程序如何設計遊戲規則，使得慈善事業可持續。地鐵口放置硬幣箱

軟工作業4：用戶體驗分析：以 “師路南通網站” 為例

在線咨詢獲取平臺導航欄二維無法登陸我們圖片標題一、目標：針對師路南通，開展UX分析。 PS：對比另外2個學習網站：1. UMU學習平臺；2. 學生安全教育平臺基於實例分析，體會用戶體驗設計的 7 條準則。二、過程（一）滿意的地

軟工作業1：wc.exe項目開發（java）

代碼行數學習正則表達式 default man 控制字符 min 目的若有多個 Github地址：https://github.com/Zzhaomin/learngit 項目相關要求： wc.exe 是一個常見的工具，它能統計文本文件的字符數、

軟工作業 2：時事點評-紅芯瀏覽器事件

pan 兩件 http 技術 ima 瀏覽器內核方便 alt strong 一：紅芯瀏覽器事件 “中國首個自主創新智能瀏覽器內核”的紅芯瀏覽器被爆抄襲，內部代碼引人爭議。二：我的觀點我覺得註釋是必不可少的，無論是便於他人接手時的閱讀，還是

軟工作業2：時事點評-紅芯瀏覽器事件

語言過度代碼冗余發出創新軟工程序 1.26 nbsp 一、紅芯事件 8月16日，自稱“打破美國壟斷，中國首個自主創新智能瀏覽器內核”的紅芯瀏覽器，被網友發現“只是谷歌瀏覽器換了一層皮”——紅芯瀏覽器安裝包解壓後發現，最終可以得到一個版本號為49.1.2623.2

軟工作業 2：時事點評——紅芯軟件

軟件技術註釋分享圖片創新軟工中國 nbsp 發現一、紅芯事件 8月16日，號稱中國首個自主創新瀏覽器內核紅芯瀏覽器被發現只是chrome瀏覽器換個皮。二、我的評論三、我贊同的評論註釋確實需要，為了方便後期的糾錯和查缺，但是代碼冗余度高是真的不能忍，還

軟工作業 6：軟體設計—— 使用者體驗

一：背景為進一步提升資訊化應用水平，更好的服務師生，南通大學智慧校園移動端APP“今日校園”定於11月5日正式上線執行。登陸APP可瀏覽學校新聞、校園生活、各部門微信公眾號等內容，檢視校內通知、校內發文、部門發文，查詢

軟工作業3：Python詞頻統計

一、程序分析

二、代碼風格說明

三、程序運行命令、運行結果截圖

對Gone_with_the_wind.txt進行詞頻統計：

相關推薦