Python ElasticSearch基礎教程

阿新 • • 發佈：2019-01-11

ElasticSearch簡介
ElasticSearch是一個基於Lucene的搜尋伺服器。它提供了一個分散式多使用者能力的全文搜尋引擎，基於RESTful web介面。Elasticsearch是用Java開發的，並作為Apache許可條款下的開放原始碼釋出，是當前流行的企業級搜尋引擎。設計用於雲端計算中，能夠達到實時搜尋，穩定，可靠，快速，安裝使用方便。
我們建立一個網站或應用程式，並要新增搜尋功能，但是想要完成搜尋工作的建立是非常困難的。我們希望搜尋解決方案要執行速度快，我們希望能有一個零配置和一個完全免費的搜尋模式，我們希望能夠簡單地使用JSON通過HTTP來索引資料，我們希望我們的搜尋伺服器始終可用，我們希望能夠從一臺開始並擴充套件到數百臺，我們要實時搜尋，我們要簡單的多租戶，我們希望建立一個雲的解決方案。因此我們利用Elasticsearch來解決所有這些問題及可能出現的更多其它問題。
官網連結：

https://www.elastic.co/cn/products
2.Elasticsearch方法的使用及原始碼

1.Elasticsearch模組的安裝與引用：
Python環境中，第一步需要安裝相對應的elasticsearch模組，pip install elasticsearch，
然後在檔案中引用from elasticsearch import Elasticsearch
2.Elasticsearch的連線
obj = ElasticSearchClass("59.110.41.175", "9200", "", "")
其中ElasticSearchClass裡面是elasticsearch的的一些常用方法：
3. 
ElasticSearch的原始碼：
class ElasticSearchClass(object):

    def __init__(self, host, port, user, passwrod):
        self.host = host
        self.port = port
        self.user = user
        self.password = passwrod
        self.connect()

def connect(self):
    “””客戶端的連線”””
        self.es = Elasticsearch(hosts=[{'host' 
: self.host, 'port': self.port}],
                                http_auth=(self.user, self.password ))

    def insertDocument(self, index, type, body, id=None):
        '''
        插入一條資料body到指定的index、指定的type下;可指定Id,若不指定,ES會自動生成
        :param index: 待插入的index值
        :param type: 待插入的type值
        :param body: 待插入的資料 -> dict型
        :param id: 自定義Id值
        :return:
        '''
        return self.es.index(index=index, doc_type=type, body=body, id=id)

    def count(self, indexname):
        """
        :param indexname:
        :return: 統計index總數
        """
        return self.conn.count(index=indexname)

    def delete(self, indexname, doc_type, id):
        """
        :param indexname:
        :param doc_type:
        :param id:
        :return: 刪除index中具體的一條
        """
        self.es.delete(index=indexname, doc_type=doc_type, id=id)

    def get(self, doc_type, indexname, id):
        return self.es.get(index=indexname,doc_type=doc_type, id=id)

    def searchindex(self, index):
        """
        查詢所有index資料
        """
        try:
            return self.es.search(index=index)
        except Exception as err:
            print(err)

    def searchDoc(self, index=None, type=None, body=None):
        '''
        查詢index下所有符合條件的資料
        :param index:
        :param type:
        :param body: 篩選語句,符合DSL語法格式
        :return:
        '''
        return self.es.search(index=index, doc_type=type, body=body)
    def search(self,index,type,body,size=10,scroll='10s'):
        """
        根據index，type查詢資料，
        其中size預設為十條資料，可以修改為其他數字，但是不能大於10000
        """
        return self.es.search(index=index, doc_type=type,body=body,size=size,scroll=scroll)
    def scroll(self, scroll_id, scroll):
        """
        根據上一個查詢方法，查詢出來剩下所有相關資料
        """
        return self.es.scroll(scroll_id=scroll_id, scroll=scroll)

3.Elasticsearch的基本操作

1.elasticsearch的連線
obj = ElasticSearchClass("59.110.41.00", "9200", "", "") 
   連線elasticsearch客戶端

2.資料的的插入
obj.insertDocument(index=”question”,type='text,id=9,body={"any":body,"timestamp":datetime.now()})
其中index和type是固定傳入，id可以自己傳入也可以系統生成，其中body資料為自己組合的資料
3.資料的刪除
dd = obj.delete(index='question', type='text', id=7310)
資料刪除時候是根據id進行刪除，刪除資料時候，index，type需要和之前傳入時候的index，type保持一致
4.  資料的搜尋
其中，搜尋之後資料顯示預設為十條資料
4.1、通過index搜尋資料
res = obj.search(indexname=index)
4.2、通過body搜尋資料
4.2.1、全部匹配：
# 查詢所有資料
body = {
    "query":{
        "match_all":{}
    }
}
response = obj.search(index="question",type="text",body=body)
返回的資料預設顯示為十條資料，其中hits[“total”]為查詢數量總數

其中Match_all 預設匹配所有的資料
4.2.2、廣泛匹配某個欄位
body = {
    "query" : {
        "match" : {
            "data.content" : "一根鐵絲"
        }
    }
}
Match預設匹配某個欄位
response = obj.search(index="question",type="text",body=body)
返回結果：

4.2.3、匹配多個欄位
body = {
  "query": {
    "bool": {
      "should": [
        { "match": { "data.content":  "一根鐵絲" }},
        { "match": { "data.question_content": "一根鐵絲"  }},
        { "match": { "data.ask_content.content": '一根鐵絲' }}
      ],
    }
  }
}
Should或匹配可以匹配某個欄位也可以匹配所有欄位，其中至少有一個語句要匹配，與 OR 等價
response = obj.search(index="question",type="text",body=body,scroll='5s') 

4.2.4、匹配所有欄位
body = {
  "query": {
    "bool": {
      "must": [
        { "match": { "data.content":  "李阿姨" }},
        { "match": { "data.question_content": "李阿姨"   }},
        { "match": { "data.ask_content.content": '李阿姨' }}
      ],
    }
  }
}
Must必須匹配所有需要查詢的欄位
response = obj.search(index="question",type="text",body=body,scroll='5s')
返回結果

4.2.5、短語匹配查詢：
精確匹配一系列單詞或者短語
body = {
    "query" : {
        "match_phrase" : {
            "data.content" : "一根鐵絲"
        }
    }
}
response = obj.search(index="question",type="text",body=body,scroll='5s')



返回結果：

4.2.6、高亮搜尋：
許多應用都傾向於在每個搜尋結果中 高亮 部分文字片段，以便讓使用者知道為何該文件符合查詢條件。在 Elasticsearch 中檢索出高亮片段也很容易。
再次執行前面的查詢，並增加一個新的 highlight 引數：
Body = {
    "query" : {
        "match_phrase" : {
            "about" : "rock climbing"
        }
    },
    "highlight": {
        "fields" : {
            "about" : {}
        }
    }
}
當執行該查詢時，返回結果與之前一樣，與此同時結果中還多了一個叫做 highlight 的部分。這個部分包含了 about 屬性匹配的文字片段，並以 HTML 標籤 <em></em> 封裝：
{
   ...
   "hits": {
      "total":      1,
      "max_score":  0.23013961,
      "hits": [
         {
            ...
            "_score":         0.23013961,
            "_source": {
               "data.content":       "李阿姨"
                       },
            "highlight": {
               "about": [
                  "張阿姨和<em>李阿姨</em>" 
               ]
            }
         }
      ]
   }
}

4.資料的返回格式

{
   ...
   "hits": {
      "total":      1,
      "max_score":  0.23013961,
      "hits": [
         {
            ...
            "_score":         0.23013961,
            "_source": {
               "欄位名1":  "XXX",
               "欄位名2":   "XXX",
               "欄位名3":   "XXX",
            }
         }
      ]
   }
}

Python ElasticSearch基礎教程

ElasticSearch簡介 ElasticSearch是一個基於Lucene的搜尋伺服器。它提供了一個分散式多使用者能力的全文搜尋引擎，基於RESTful web介面。Elasticsearch是用Java開發的，並作為Apache許可條款下的開放原始碼

最完整的Elasticsearch 基礎教程

epo -o 小寫名稱搜索結果博客需要必須搜索api 基礎概念 Elasticsearch有幾個核心概念。從一開始理解這些概念會對整個學習過程有莫大的幫助。接近實時（NRT） Elasticsearch是一個接近實時的搜索平臺。這意

Elasticsearch基礎教程(轉載)

3-0 是你 apple tle 平臺部分 con ping tails Elasticsearch基礎教程基礎概念 Elasticsearch有幾個核心概念。從一開始理解這些概念會對整個學習過程有莫大的幫助。接近實時（NRT） Elasti

Python的基礎教程，比PHP、GO等前景好的一門開發語言！

動態 www. 成功創業包括數據分析資源 ros 單元 ogl Python代表了將來很長一段時間技術走向，其在人工智能和網絡爬蟲、大數據分析等科學領域是有很大的優勢的。代表方向 Python的基礎教程，比PHP、GO等前景好的一門開發語言！人工智能 Python

Python 3基礎教程2-列印語句和字串

本文介紹Python 3中的列印語句和字串使用，具體練習請看下面的demo.py print ('Hello Python 3!') """ 文字講列印語句和字串列印語句，裡面的訊息可以用單引號或

Python Numpy-基礎教程

目錄 1. 為什麼要學習numpy? 2. Numpy基本用法 2.1. 建立np.ndarry 2.2. Indexing and Slicing Boolean Index 2.3. Universal Functions

python numpy 基礎教程

Numpy簡單介紹 1.Numpy是什麼很簡單，Numpy是Python的一個科學計算的庫，提供了矩陣運算的功能，其一般與Scipy、matplotlib一起使用。其實，list已經提供了類似於矩陣的表示形式，不過numpy為我們提供了更多的函式。如果接觸過matlab、

Python Django基礎教程（三）（模型models）

Django版本：1.11 作業系統：Windows python：3.5 歡迎加入學習交流QQ群：657341423 模型的使用： Django的模型就是說資料庫的使用，通常最笨最基礎的用法都是用語法連結資料庫，進行sql語句操作，然後關閉資料庫。但是現在

Python 3基礎教程43-cx_Freeze把py檔案打包成exe

本文介紹如何把py檔案打包成exe的可執行檔案，這個場景還是很有用處的，例如，你用Python開發了一個軟體，你如果要讓windows使用者使用，你肯定要把你的專案打包成exe檔案吧。 1

python入門基礎教程(一)

1.如何在終端視窗列印訊息？ print("Hello World"); 2.如何使用變數儲存資訊，並列印該變數? message = "Hello World";#變數定義無需var,int等操作符 print(message); 3.如何在一

Python 3基礎教程34-tkinter新增一個按鈕

在前面一篇文章的基礎上，我們在上個窗體上新增一個按鈕。 # tkinter 模組新增一個按鈕 from tkinter import * ''' 開始接觸桌面圖形介面程式設計你可以到安裝路徑：\l

Python Django基礎教程（二）（模板templatetags）

Django版本：1.11 作業系統：Windows 歡迎加入學習交流QQ群：657341423 模板的使用：模板是一個文字，用於分離文件的表現形式和內容。模板定義了佔位符以及各種用於規範文件該如何顯示的各部分基本邏輯（模板標籤）。模板通常用於產生HT

python openpyxl基礎教程2.5.3

2.5.3的更新有很大的變化，很多api 已經過時了 import openpyxlwb=openpyxl.load_workbook(r"E:\pythion\電影250.xlsx")type(wb)wb.properties 表的資訊建立日期修改日期等可以

Python 3基礎教程36-tkinter建立選單

本文來介紹tkinter下的選單建立過程，我們用過很多記事本軟體，第一個選單一般是File，File下面有儲存，退出等按鈕，第二個選單是Edit，編輯選單有撤銷等功能。我們下面的程式碼大

Python Numpy基礎教程

Python Numpy基礎教程本文是一個關於Python numpy的基礎學習教程，其中，Python版本為Python 3.x 什麼是Numpy Numpy = Numerical + Python，它是Python中科學計算的核心庫，可以高效的處理多維陣列的計算。並且，因為它的許多底層函式是用C語

Python爬蟲基礎教程，手把手教你爬取拉勾網！

一、思路分析：在之前寫拉勾網的爬蟲的時候，總是得到下面這個結果（真是頭疼），當你看到下面這個結果的時候，也就意味著被反爬了，因為

<<Python基礎教程>>學習筆記 | 第12章 | 圖形用戶界面

lena text 平臺 post ack 由於 contents exp 一個 Python支持的工具包非常多。但沒有一個被覺得標準的工具包。用戶選擇的自由度大些.本章主要介紹最成熟的跨平臺工具包wxPython.官方文檔: http://wxpython.org/

Python基礎教程之第5章條件, 循環和其它語句

like eba cti python基礎 word 沒有 positive while循環 pytho Python 2.7.5 (default, May 15 2013, 22:43:36) [MSC v.1500 32 bit (Intel)] on win32

python 基礎教程筆記一

python第一章 python 基礎知識1.1 數字和數學表達式1.2 python 2.x 和python 3.x print的區別1.3 python 2.x 和 python 3.x input 的區別1.4 數學函數1.5 input 和 raw_input 區別第二章列表和元組第三章使用字符串

Python在線基礎教程

pythonhttp://www.runoob.com/python/python-tutorial.html 學習之路（9）Python-Anaconda安裝http://bbs.pinggu.org/thread-4711162-1-1.htmlPython在線基礎教程

Python ElasticSearch基礎教程

相關推薦