基於Python檢索系統（4）最終版

阿新 • • 發佈：2019-01-28

from tkinter import *
import jieba
import jieba.analyse

#b1函式為 全部新聞顯示頁面
#b2函式為 檢索頁面 檢索成功後，跳轉另外一個頁面


def b1():  #全部新聞顯示頁面
    #記錄檔案中有多少行標題 記錄在count中
    count=0
    for line in open("jia.txt","r",encoding='utf-8'):
        count=count+1
        
    #新建字典title_dict,鍵對應（1-5294）的數字，值是對應的新聞標題
    
    title_dict={}

    f=open("jia.txt","r",encoding='utf-8')
    i=1
    #將文字的每行標題存入字典
    for line in open("jia.txt","r",encoding='utf-8'):
    #新增一個刪除字串末尾/n的操作
        title_dict[i]=line
        i=i+1
    # print(line)

    #將字典title_dict中的值分別進行分詞操作
    seg_list={}
    tags={}
    #將分詞存入tags字典，鍵為1-5294，值為對應的分片語成的列表
    for j in range(1,count+1):
        #搜尋引擎模式
        seg_list[j] =jieba.cut_for_search(title_dict.get(j))
        #精確模式
        #seg_list[j]=jieba.cut(title_dict.get(j),cut_all=True)
        tags[j]=jieba.analyse.extract_tags(title_dict.get(j), topK=40)
    
    # print(tags)

    #將分詞後的結果存入詞項字典
    word_dict={}
    for k in range(1,count+1):
        for z in range(0,int(len(tags.get(k))-1)):   #字典中每個值中，元素的個數
            word_dict.setdefault(tags.get(k)[z])
            if(word_dict.get(tags.get(k)[z])==None):
                word_dict[tags.get(k)[z]]=[]
                word_dict[tags.get(k)[z]].append(k)
            else:
                word_dict[tags.get(k)[z]].append(k)
            
    #gui部分
    root=Tk()
    root.title("上海理工大學新聞檢索")
    root.geometry('800x500+200+100')
    sb=Scrollbar(root)
    sb.pack(side=RIGHT,fill=Y)

    #建立一個空列表
    theLB=Listbox(root,width=100,height=80,yscrollcommand=sb.set)

    count=0
    for line in open("jia.txt","r",encoding='utf-8'):
        count=count+1
    
    for a in range(1,count+1):
        theLB.insert(a,title_dict.get(a))

    theLB.pack(padx=20,pady=20,fill=BOTH)
    sb.config(command=theLB.yview)
    mainloop()

def b2():
    def compare():
        count=0
        for line in open("jia.txt","r",encoding='utf-8'):
            count=count+1
        title_dict={}
        f=open("jia.txt","r",encoding='utf-8')
        i=1
        for line in open("jia.txt","r",encoding='utf-8'):
            title_dict[i]=line
            i=i+1
        seg_list={}
        tags={}
        for j in range(1,count+1):
            seg_list[j] =jieba.cut_for_search(title_dict.get(j))
            tags[j]=jieba.analyse.extract_tags(title_dict.get(j), topK=40)
        word_dict={}
        for k in range(1,count+1):
            for z in range(0,int(len(tags.get(k))-1)):   
                word_dict.setdefault(tags.get(k)[z])
                if(word_dict.get(tags.get(k)[z])==None):
                    word_dict[tags.get(k)[z]]=[]
                    word_dict[tags.get(k)[z]].append(k)
                else:
                    word_dict[tags.get(k)[z]].append(k)


        user_input=a.get()
        for i in range(1,len(word_dict.keys())):
            if user_input==list(word_dict.keys())[i-1]:
                print("標題匹配成功\n")

                root=Tk()
                root.title("上海理工大學新聞檢索")
                root.geometry('800x500+200+100')
                sb=Scrollbar(root)
                sb.pack(side=RIGHT,fill=Y)
                theLB=Listbox(root,width=100,height=80,yscrollcommand=sb.set)
                
                for k in range(1,len(word_dict[list(word_dict.keys())[i-1]])):
                    theLB.insert(k,title_dict[word_dict[list(word_dict.keys())[i-1]][k]])


                theLB.pack(padx=20,pady=20,fill=BOTH)
                sb.config(command=theLB.yview)
                mainloop()
                #print(title_dict[word_dict[list(word_dict.keys())[i-1]][k]])
                #print('\n')    # word_dict[list(word_dict.keys())[i-1]][k]
            else:
                pass
        
    root=Tk()
    root.title("上海理工大學新聞檢索")
    #a是文字框，用於輸入要檢索的文字，按下回車或者單擊Button按鈕可以接受使用者輸入
   
    a=Entry(root,width=40,validate="focusout",validatecommand=compare)
    a.pack(side=LEFT,padx=40,pady=60)


    mainloop()


root=Tk()
root.title("上海理工大學新聞")

#插入一個圖片
photo = PhotoImage(file="logo.gif")
Label(root,image=photo).grid(row=0,column=0,rowspan=4,padx=15,pady=10)
#標籤的屬性
Label(root,text="歡迎進入本系統",font=("華康少女字型",30),fg="red").grid(row=0,column=1,columnspan=2,padx=10,pady=10)

photo1 = PhotoImage(file="a.gif")
Label(root,image=photo1).grid(row=1,column=1)
a = Button(root,text="檢視所有內容",width=10,command=b1).grid(row=1,column=2,columnspan=2,padx=10,pady=5)

photo2 = PhotoImage(file="b.gif")
Label(root,image=photo2).grid(row=2,column=1)
b = Button(root,text="檢索",width=10,command=b2).grid(row=2,column=2,columnspan=2,padx=10,pady=5)

photo3 = PhotoImage(file="c.gif")
Label(root,image=photo3).grid(row=3,column=1)
c = Button(root,text="退出",width=10,command=root.quit).grid(row=3,column=2,columnspan=2,padx=10,pady=5)

mainloop()

基於Python檢索系統（4）最終版

from tkinter import * import jieba import jieba.analyse #b1函式為全部新聞顯示頁面 #b2函式為檢索頁面檢索成功後，跳轉另外一個頁面 def b1(): #全部新聞顯示頁面 #記錄檔案中有多少行

基於Python檢索系統（3）分詞後建立資料結構

分詞應用的是Jieba分詞工具，將爬取得到的新聞進行中文分詞，也就是為了得到以後檢索要用到的關鍵詞。我們給每個關鍵詞建立一個單獨的索引，引入間接桶，應用倒排索引的方法實現最終的結果。

ASP.NET MVC5+EF6+EasyUI 後臺管理系統（4）-創建項目解決方案

構建文章數據庫操作 webapi http 業務 pps 技術分享系列目錄前言為了符合後面更新後的重構系統，文章於2016-11-1日重寫設計中術語，概念這種東西過於模糊，我們必須學習累積才能認識這些概念模型。我無法用文章來下詳細解析此系統的深層概念，需要

python學習——練習題（4）

某年時間 ftime true 題目 error == highlight exc """ 題目：輸入某年某月某日，判斷這一天是這一年的第幾天？ """ import datetime import time from functools import reduce

Python冒泡排序（4）

冒泡排序 post span body print style nbsp bsp -i Python代碼： """ 冒泡排序（4）在未排序的數中，通過兩兩比較[換位]的方式，將最小的數移至首位 N個數排序，則需要執行N-1輪，第1輪比較N-1次，後續每輪比上一輪少比較

python學習筆記（4）

python函數定義和調用函數就是最基本的一種代碼抽象的方式（python有許多內置函數）調用：要調用一個函數，需要知道函數的名稱和參數比較函數cmp(x,y)就需要兩個參數，如果x<y，就返回-1，如果x==y，就返回0，如果x>y就返回1數據類型轉換函數，不如int()函數可以把其他數據類型

Python學習筆記（4）：容器、叠代對象、叠代器、生成器、生成器表達式

iter 有一種 ref function 但是 tool 數列 edt 叠代器類型在了解Python的數據結構時，容器(container)、可叠代對象(iterable)、叠代器(iterator)、生成器(generator)、列表/集合/字典推導式(list,se

Learning-Python【21】：Python常用模組（4）—— re、logging、hashlib、subprocess

re 模組：與正則相關的模組在使用 re 模組之前，需要先了解正則表示式（regular expression），描述了一種字串匹配的模式（pattern），可以用來檢查一個字串是否含有某個子字串、將匹配的子字串替換或者從某個字串中取出符合某個條件的子字串等。 import

Python入門學習（4）

刪除包含特定值得所有列表元素 pets = ['cat','dog','goldfish','cat','rabit','cat'] print(pets) while 'cat' in pets: pets.remove('cat') print(pets)

Python之Pandas（4）

#Pandas具有全功能的，高效能記憶體中連線操作，與Sql關係資料庫非常相似 import numpy as np import pandas as pd In [18]: #合併連線去重替換 df1 = pd.DataFrame({'key':['K0','K1','K2

基於springboot2 框架整合（4）：swagger ui 整合

前言專案中使用了很多現成的框架，都是專案經理、架構師帶來的，從來沒有自己整合過！這次決定自己從零開始整合一次，以學習鞏固。過程中參考很多開源框架的思路，工具類等，若有侵權，請速速聯絡，一定妥善處理一：簡介前面已經把springboot+mybatis

python練習筆記（4）-製作地圖

Mapping Tools地圖對映工具 geopandas provides a high-level interface to the matplotlib library for making maps. Mapping shapes is as easy as usi

Python學習筆記（4）——Matplotlib中的annotate（註解）的用法

在上一篇博文ID3決策樹演算法中，繪製決策樹時，使用了Matplotlib的註解工具annotate，藉此機會系統學習一下annotate的用法。 annotate用於在圖形上給資料新增文字註解，而且

Spring Cloud學習筆記5——天氣預報系統（4）為天氣預報製作

開發環境 JDK8+ Gradle4+ Redis 3.2.100 Apache HttpClient 4.5.3 Spring Boot Web Starter Spring Boot Data Redis Starter Spring Boot Quart

Python資料型別（4）字串

字串字串(string)是一種不可變的序列物件。字串常量用引號定義，可以是單引號，雙引號，三引號，這三者沒有任何區別，但要成對使用。字串的建立 >>> 'xyz' #單引號定義 'xyz' >>> "xyz"

vue全家桶+element-UI搭建後臺管理系統（4）“：登入攔截，登陸後才可以操作”

首先明白如何實現登入攔截，他的原理是什麼？這裡主要用到的是路由攔截，在路由表裡新增一個欄位：requireAuth，用於判斷該路由的訪問是否需要登入；定義完路由後，我們主要是利用vue-router提供的鉤子函式beforeEach()對路由進行判斷。現在我們開始.....

實戰智慧推薦系統（4）-- 什麼是好的推薦系統？

推薦系統與搜尋引擎要回答什麼是好的推薦系統，我覺得首先得知道為什麼需要推薦系統。推薦系統的存在價值必須建立在兩個必要的前提：（1）資訊過載。隨著資訊科技和網際網路的發展，人們逐漸從資訊匱乏走向了資訊過載時代。比如說如果在小超市買個東西，一件一件挑就是了。但是在淘寶網買東西，假

appium+python自動化測試（4）

混合應用的開發：測試案例是《果時匯.apk》，首先，如果做appium測試，必須具備一定的app開發瞭解，比如什麼是混合開發，什麼是純h5開發，什麼是純原生的。將apk安裝到手機。首先是一個連線的問題：執行一段時間後設備adb服務中斷，多次拔插資料線才能再連上，換了多個ap

學習Linux系統 --- （4）

兼容絕對路徑 col nbsp 內容如果保存文件打包工具技術分享 ---恢復內容開始--- 1.ZIP 壓縮包打包程序　　命令 zip 　　示例： zip -r -q - o 待保存文件名目標文件夾　　　　　　解釋：-r 因為是壓縮文件夾所以到遞歸遍歷整

python自動化測試（4）-使用第三方python庫技術實現

4.2 python庫本文的主打語言是Python語言，所展開的內容也是和Python語言相關，在JSON官網 [1] 上提供瞭如下幾種Python語言的JSON庫： The Python Standard Library. simplejson. pyson. Yajl-Py. u

基於Python檢索系統（4）最終版

相關推薦