ES（Elasticsearch）scroll查詢獲取所有資料的某個欄位

阿新 • • 發佈：2018-11-22

在ElasticSearch中實現分頁查詢的方式有兩種，分別為深度分頁(from-size)和快照分頁(scroll)

快照分頁(scroll)
相對於from和size的分頁來說，使用scroll可以模擬一個傳統資料的遊標，記錄當前讀取的文件資訊位置。這個分頁的用法，不是為了實時查詢資料，而是為了一次性查詢大量的資料（甚至是全部的資料）。因為這個scroll相當於維護了一份當前索引段的快照資訊，這個快照資訊是你執行這個scroll查詢時的快照。在這個查詢後的任何新索引進來的資料，都不會在這個快照中查詢到。但是它相對於from和size，不是查詢所有資料然後剔除不要的部分，而是記錄一個讀取的位置，保證下一次快速繼續讀取。
```
   curl -XGET 'localhost:9200/twitter/tweet/_search?scroll=1m' -d '
   {
        "query": {
             "match" : {
             "title" : "elasticsearch"
          }
       }
    }
```
該查詢會自動返回一個_scroll_id，通過這個id(經過base64編碼)可以繼續查詢
```
curl -XGET  '叢集節點IP:9200/_search/scroll?scroll=1m&scroll_id=c2Nhbjs2OzM0NDg1ODpzRlBLc0FXNlNyNm5JWUc1'
 
```

python 實現

#coding: utf-8
from elasticsearch import Elasticsearch
if __name__ == "__main__":
	hosts = 'localhost:9200/' 
	es = Elasticsearch(hosts=hosts, maxsize=25)
	index_name = 'test_es'
	dbname='test_bj'
	tbl='test_table1'
	test_table = "%s.%s" % (dbname, tbl)
	query_json = {"match_all": {}}
	es_data=es.search(index=index_name, doc_type=dbname, body={"query": query_json},filter_path=["_scroll_id","hits.total","hits.hits._id"], scroll = '5m',size =1000,timeout='1s')
	es_ids = [ int(id['_id'])  for id in es_data.get("hits").get("hits")]
	scroll_id = es_data['_scroll_id']
	es_total = es_data.get('hits').get('total')
	for i in range(es_total/1000):
		res = es.scroll(scroll_id=scroll_id,scroll='5m')
		es_ids += [int(id['_id']) for id in res.get('hits').get('hits')]
	sql_not_exist = "SELECT id from " + test_table +" where id not in " + str(tuple(es_ids))
	cur_sell.execute(sql_not_exist)
	print "es缺少資料"+str(cur_sell.fetchall())

參考：
https://blog.csdn.net/u013514928/article/details/78749419
http://www.cnblogs.com/blue163/p/8126156.html

ES（Elasticsearch）scroll查詢獲取所有資料的某個欄位

在ElasticSearch中實現分頁查詢的方式有兩種，分別為深度分頁(from-size)和快照分頁(scroll) 快照分頁(scroll) 相對於from和size的分頁來說，使用scro

Elasticsearch利用scroll查詢獲取所有數據

0.12 但是比較 ext class python實現方式 search contex Elasticsearch有兩種分頁方式，一種是通過from和size條件來實現，但是該方法開銷比較大，另一種是利用scroll來實現，通過scroll來實現分頁獲取所有的數據，下

spark將資料寫入ES（ElasticSearch）終極總結

簡介 spark接入ES可以使用多種方式，常見型別如下。將Map物件寫入ElasticSearch 將case class 類物件寫入ElasticSearch 將Json的字串寫入ElasticSearch 本文主要介紹將case class 類物件寫入El

ES （Elasticsearch）入門指南

簡介 ES=elaticsearch簡寫， Elasticsearch是一個開源的高擴充套件的分散式全文檢索引擎，它可以近乎實時的儲存、檢索資料；本身擴充套件性很好，可以擴充套件到上百臺伺服器，處理PB級別的資料。本質上是一個分散式nosql資料庫，允許多臺伺服

ES（elasticsearch）安裝使用

記得 nbsp cast sea grunt blank file flight delayed 首先配置系統參數（各個節點均需要配置） 1. 設置內核參數 vim /etc/sysctl.conf 添加如下內容: fs.file-max=65536 vm.m

java程式設計師菜鳥進階（二）oracle基礎詳解（二）oracle查詢語句和資料排序

本文所以練習都是基於oracle自帶提供的一個數據庫進行的。資料庫中包含員工表emp。部門資訊表dept。員工工資工總表下面是三個表的表結構：一：基本查詢語句1.最簡單的查詢所有列語句Select * from emp;2.查詢指定列表的查詢語句Select empno ,e

淺談highcharts（echarts）通過ajax獲取後臺資料從而改變資料圖

好久沒寫csdn部落格了，隨著工作專案的展開自己也越來懶了。。不過今天有點空餘的時間，所以來寫寫部落格。恰巧這次的專案有圖表這一塊，所以就用到了highcharts和echarts。我們都知道如果寫純靜態的圖表圖很簡單，那麼如果寫動態的圖表圖該如何寫呢？好了，不多BB

AngularJS學習筆記（3）——通過Ajax獲取JSON資料

通過Ajax獲取JSON資料以我之前寫的與使用者互動的動態清單列表為例，使用JSON前todo.html程式碼如下： <!DOCTYPE html> <html ng-app="todoApp"> <head>

sqlserver 獲取所有表的欄位型別等資訊

USE [MultipleAnalysisDataFY] GO /****** Object: View [dbo].[selectfieldtype] Script Date: 2018/11/7 星期三 12:02:27 ******/ SET ANSI_NULLS ON GO SET

SAP 通過事務程式碼與螢幕變式（SHD0）控制控制使用者介面的某些欄位，以控制生產訂單的排程型別為例

在實際工作中經常會遇到要求把SAP中某些欄位鎖定，或設為必須輸入，這時可以用事務程式碼與螢幕變式進行控制，事務程式碼：SHD0 （Transaction and Screen Variants）。下面是控制生產訂單排程型別為固定值的操作實錄：一、檢視生產訂單排程型別的螢幕號輸入事務

keepalived簡單實驗（三）vrrp_script中要不要寫weight欄位

今天在公司看到keepalived主備機器上的keepalived配置檔案的vrrp_scrip段中都沒有weight欄位，直接貼圖吧： master的配置檔案： backup的配置檔案：指令碼的內容：我在想，這樣寫就算master那邊的vrrp_scrip

sqlserver查詢資料庫中包含某個欄位的所有表和所有儲存過程

1、查詢包含某欄位的所有表 1 2 3 4 5 6 select object_name(id) objName,Name as colName from syscolumns where

基於MVC4+EasyUI的Web開發框架經驗總結（9）--在Datagrid裡面實現外來鍵欄位的轉義操作

我們在使用EasyUI的時候，很多情況下需要使用到表格控制元件datagrid，這個控制元件控制元件非常強大，使用起來很簡潔，但是我在使用中，發現對於一個表裡面的外來鍵欄位進行轉義，並顯示引用表的一些名稱的操作，卻顯得比較難以實現，找了很多資料，基本上沒有找到對應的解決方案。本文主要介紹我對這種外來鍵欄位轉義

mongodb系列（二）使用複合索引中要注意欄位的前後

背景預先建立了一個複合索引，分別以 updated_at 和 size 兩個欄位作為索引依據，其中該collection有94萬+個document db.cms_resources.createIndex({updated_at:-1,size:-1},{name:'

查詢資料庫中帶有某個欄位的所有表名

mysql資料庫查詢帶有某個欄位的所有表名 SELECT * FROM information_schema.columns WHERE column_name='column_name'; ora

QGis（四）shp向量圖層新增新欄位

新增一個新的欄位到shp檔案中，並且從Excel裡匯入資料到該欄位。原shp檔案裡的欄位ID應該與Excel裡的欄位ID一一對應才能正確的匯入。下圖分別是shp的欄位和Excel的欄位將class欄位新增到shp中去：（1）從Excel中讀取資料（為了讀取方便，存為.

php、mysql查詢當天,查詢本週,查詢本月的資料例項(欄位是時間戳)

mysql查詢當天,查詢本週,查詢本月的資料例項(欄位是時間戳) //其中 video 是表名； //createtime 是欄位； // //資料庫time欄位為時間戳 // //查詢當天： $start = date('Y-m-d 00:00:00'); $end = date('Y-m-d

無視修飾符，不經過getter函式直接獲取物件的某個欄位的屬性值

直接上程式碼： public class ReflectionUtils { /** * 直接讀取物件屬性值, 無視private/protected修飾符, 不經過getter函式. */ public static Object getFieldValue(fin

hibernate實現查詢某實體的某個欄位的多個值的對應實體列表

在使用hibernate和資料庫互動時，可以是使用hibernate的session的各種操作資料庫方法，在實際使用中也常常結合hbm.xml檔案裡寫好的query執行塊，再通過setParameter方式設定引數後執行查詢獲取結果。其中經常使用的一個場景----hibern

Elasticsearch學習筆記（十）批量查詢mget、批量增刪改bulk

出錯 color body 換行 nor test 增刪 doc document 一、批量查詢 mget GET /_mget { "docs":[ { "_index":"ecommerce

ES（Elasticsearch）scroll查詢獲取所有資料的某個欄位

相關推薦