1. 程式人生 > >Lucene的學習第七篇——Lucene開發的lukeall的使用

Lucene的學習第七篇——Lucene開發的lukeall的使用

入門程式碼的再學習後,前面的內容應該明白,理解80%以上,這裡介紹lukeall的使用。Lukeall就是lucene開發必備的,lukeall我從兩個方面介紹:
1:lukeall是什麼?
2:lukeall怎麼用?
先說上次遺留兩個問題:
1:預設麼排序的?
2:我們只是能夠搜尋這個spring.txt文件,怎麼實現搜尋“全文”,搜尋到“全文檢索.txt
如果我們能開啟索引檔案,檢視索引庫是怎麼存放的。那麼就明白了,看看怎麼排序,哪些語彙單元,以及他們的索引。
這個檔案開啟,需要我們的lukeall工具。
這就解決了lukeall是什麼問題。
 下面介紹lukeall怎麼用:
Lukeall是lucene的索引檢視工具,是一個jar包。
這裡寫圖片描述


第一個jar是IK分詞器(後面介紹)
執行lukeall(執行jar包的通用方法)
第一步:
準備lukeall jar包(與lucene的版本一致,否則,會報異常)
將lukeall跟分詞器放到一起
第二步:執行
cmd 執行黑視窗,輸入命令:
java -jar lukeall-4.10.3.jar如果:執行lukeall,如果需要載入第三方分詞器,需通過-Djava.ext.dirs載入jar包:可簡單的將第三方分詞器和lukeall放在一塊兒,cmd下執行:
java -Djava.ext.dirs=. -jar lukeall-4.10.3.jar

執行結果:


這裡寫圖片描述
第三步:
1, 選擇到索引庫所在的目錄,
2, 點選ok開啟

這裡寫圖片描述

-

這裡寫圖片描述
域:

-
這裡寫圖片描述

四個域:
右邊每一行:就是 一個域中的一個term。每個term中,包含:出現的次數,域名,term的內容。

所以到這裡:
搞明白了三個問題:


 - 1:不同的域中分出來的相同的單詞,是不同的語彙單元,
 - 2:term的預設排序,就是按照每個term出現的次數,
   3:我們不能根據“全文”,或者是“全文檢“,搜尋到文件,是因為沒有這樣的內容的term,
   (顯示的是文件的內容是一個漢字,分成了一個term)

這裡寫圖片描述

6個文件,0-5;
文件的四個域:
內容沒有儲存:所以顯示的是空
名字,路徑,大小,都有存。
根據介紹的
子類域和程式碼 進行一一比對,就明白了。

相關推薦

Lucene學習——Lucene開發lukeall的使用

入門程式碼的再學習後,前面的內容應該明白,理解80%以上,這裡介紹lukeall的使用。Lukeall就是lucene開發必備的,lukeall我從兩個方面介紹: 1:lukeall是什麼? 2:l

R語言學習 :列表

方法 靈活的數據類型 引號 bounds 參考 最大的 post 長度 索引操作 列表(List)是R中最復雜的數據類型,一般來說,列表是數據對象的有序集合,但是,列表的各個元素(item)的數據類型可以不同,每個元素的長度可以不同,是R中最靈活的數據類型。列表項可以是列表

Java學習 -- Java開發環境

jet 編輯器 協議 dea $path shell pat 工具 cpu Java開發環境 Java SE 開發環境 Java的開發環境支持Windows、MacOS、Linux,故下面以操作系統作為分類去配置開發環境。 Windows Java Platform, St

機器學習

決策樹 相比於其他方法,決策樹是一種更為簡單的機器學習方法,它是對被觀測資料進行分類的一種相當直觀的方法,決策樹在經過訓練之後,看起來更像是以樹狀形式排列的一系列if-then語句。只要沿著樹的路徑一直向下,正確回答每一個問題,最終就會得到答案,沿著最終的葉節點向上回溯,就會得到一個有關最終分類

android Telephony學習 --- android7.0 來電(MT)流程

我們先看下7.0來電大體流程: ##Framework modem接收到來電通知訊息後,以AT指令的方式上報RIL層,RIL層通過sokcet將訊息傳送給RILJ, 上報事件ID: RIL_UNSOL

Python 語言學習 :函式1(定義、呼叫和變數的作用域)

函式是把一些語句集合在一起的程式結構,用於把複雜的流程細分成不同的元件,能夠減少程式碼的冗餘、程式碼的複用和修改程式碼的代價。 函式可以0個、1個或多個引數,向函式傳遞引數,可以控制函式的流程。函式還可以返回程式碼執行的結果,從技術上講,任何函式都要返回結果,一個沒有返回值的函式會自動返回none物件。如果

ORACLE學習(常用處理函式)

一、常用聚合函式 求最大值:select max(sal) from emp ; 求最小值:select min(sal) from emp ; 求平均值:select avg(sal) from emp ; Sum 求和:select sum(sal) from emp ; Count

從.Net到Java學習——SpringBoot Redis 快取穿透

場景描述:我們在專案中使用快取通常都是先檢查快取中是否存在,如果存在直接返回快取內容,如果不存在就直接查詢資料庫然後再快取查詢結果返回。這個時候如果我們查詢的某一個數據在快取中一直不存在,就會造成每一次請求都查詢DB,這樣快取就失去了意義,在流量大時,可能DB就掛掉了。 穿透:頻繁查詢一個不存在的資料,

python全棧開發】Python文件操作

編寫 alt utf-8 str 不存在 odi 得到 encoding 處理流 一、文件處理流程   1.打開文件,得到文件句柄並賦值給一個變量   2.通過句柄對文件進行操作   3.關閉文件 r模式,默認模式,文件不存在則報錯 w模式,文件不存在則創建,文件存在則覆蓋

MySQL數據庫學習】單表查詢

not null for 比較運算符 創建 字符串 直接 過濾 field gpo 先創建表 #創建表 create table employee( id int not null unique auto_increment, name varchar(20) not

Python 學習日記 -- 函數相關

函數裝飾器一、裝飾器前戲-閉包簡單來說,python中函數的閉包就是在內部函數裏對外部作用域(但不是全局作用域)的變量進行引用,這麽說,不太好理解,下面的示例幫助理解 def outer(): a = 1 def inner(): # 內部函數inner print(a)

Python學習----模塊筆記(Web開發進階之Django數據庫操作)

long 機制 idt 4.5 gen git 表之間 protoc 小數 4、Django ORM 4.1、連接數據庫 創建Django工程後運行該工程,會在工程根目錄下創建db.sqlite3文件,為Django自帶的sqlite3數據庫(Django自帶的功能也需要數

Python全棧開發記錄_(模組_time)

這一篇主要是學習python裡面的模組,篇幅可能會比較長 一、time模組 # -*- coding:utf-8 -*- import time # print(help(time)) # 1、time() 返回時間戳 print(time.time()) # 返回當前時間的時間戳 1541

Python開發】:面向物件初級

面向物件初級篇 概述 面向過程:根據業務邏輯從上到下寫壘程式碼 函式式:將某功能程式碼封裝到函式中,日後便無需重複編寫,僅呼叫函式即可 面向物件:對函式進行分類和封裝,讓開發“更快更好更強...” 面向過程程式設計最易被初學者接受,其往往用一長段程式碼來實現指定功能,開發過程中最常見的

Python開發】:面向物件(進階

上一篇《Python 面向物件(初級篇)》文章介紹了面向物件基本知識: 面向物件是一種程式設計方式,此程式設計方式的實現是基於對 類 和 物件 的使用 類 是一個模板,模板中包裝了多個“函式”供使用(可以講多函式中公用的變數封裝到物件中) 物件,根據模板

】Qt學習與使用---TreeView目錄以及其點選事件

1、目的     想要寫一個目錄,可以列出某一路徑下所有的 檔案,並且可以點選開啟。(初始是想做一個閱讀器程式 ) 2、思路 (1)首先需要將檔名稱以目錄的 形式列出。 (2)可以開啟不同型別的檔案,如  資料夾,PDF,doc,csv,&nb

spring boot 開發使用JWT保證api介面安全

1、jwt簡介 JWT是一種用於雙方之間傳遞安全資訊的簡潔的、URL安全的表述性宣告規範。JWT作為一個開放的標準(RFC 7519),定義了一種簡潔的,自包含的方法用於通訊雙方之間以Json物件的形式安全的傳遞資訊。因為數字簽名的存在,這些資訊是可信的,JW

:微信公眾平臺開發實戰Java版之如何獲取微信使用者基本資訊

在關注者與公眾號產生訊息互動後,公眾號可獲得關注者的OpenID(加密後的微訊號,每個使用者對每個公眾號的OpenID是唯一的。對於不同公眾號,同一使用者的openid不同)。 公眾號可通過本介面來根據OpenID獲取使用者基本資訊,包括暱稱、頭像、性別、所在城市、語言和關注時間。 開發者可通過Ope

Vue學習之路:跑馬燈項目實現

let rip char eth sta 對象 app 清除 一個 前面六篇講解了Vue的一些基礎知識,正所謂:學以致用,今天我們將用前六篇的基礎知識,來實現類似跑馬燈的項目。 學前準備: 需要掌握定時器的兩個函數:setInterval和clearInterval以及作用

cocos2dx學習之路----(座標系統中本地座標與世界座標的轉換詳解)

這一篇我們來談談關於座標系統中本地座標與世界座標的轉換問題。 在上一篇中我們知道了標準的螢幕座標系、本地座標與世界座標的區別,還了解了關於cocos2dx的座標系問題。 其實關於OpenGL的座標,如果我們做2d程式設計,是可以暫時忽略Z軸座標的。但是卻需要記住的是渲染的深