ElasticSearch - 批量操作 bulk

阿新 • • 發佈：2018-11-08

bulk允許在一個請求中進行多個操作(create、index、update、delete)，也就是可以在一次請求裡做很多事情
- 也由於這個關係，因此bulk的請求體和其他請求的格式會有點不同
bulk的請求模板
- 分成action、metadata和doc三部份
  - action : 必須是以下4種選項之一
    - index(最常用) : 如果文件不存在就建立他，如果文件存在就更新他
    - create : 如果文件不存在就建立他，但如果文件存在就返回錯誤
      - 使用時一定要在metadata設定_id
        
        值，他才能去判斷這個文件是否存在
    - update : 更新一個文件，如果文件不存在就返回錯誤
      - 使用時也要給_id值，且後面文件的格式和其他人不一樣
    - delete : 刪除一個文件，如果要刪除的文件id不存在，就返回錯誤
      - 使用時也必須在metadata中設定文件_id，且後面不能帶一個doc，因為沒意義，他是用_id去刪除文件的
  - metadata : 設定這個文件的metadata，像是_id
    
    、_index、_type...
  - doc : 就是一般的文件格式
```
POST 127.0.0.1/mytest/doc/_bulk
{ action : { metadata } }
{ doc }
{ action : { metadata } }
{ doc }
....
```

具體例項

bulk請求

POST 127.0.0.1/mytest/doc/_bulk
//建立一筆資料
{ "create" : { "_id": 1 } }
{ "color": "create black" }
//建立一筆資料，因為id=1的文件已經存在，所以會建立失敗
{ "create" : { "_id": 1 } }
{ "color": "create black2" }
//索引一筆資料
{ "index" : { "_id": 2 } } 
{ "color": "index red" }
//索引一筆資料，但是index可以建立也可以更新，所以執行成功
{ "index" : { "_id": 2 } } 
{ "color": "index red2" }
//索引一筆資料，不一定要設定id(index又能建立又能更新又不用設id，超好用)
{ "index": {} } 
{ "color": "index blue" } 
//刪除一筆文件，注意delete後面不接一個doc
{ "delete" : { "_id": "2" } } 
//找不到此id的文件，刪除失敗
{ "delete" : { "_id": "2" } } 
//更新一筆文件，注意doc格式不太一樣
{ "update" : { "_id": 1 } } 
{ "doc": { "color": "update green"} }
//更新一筆文件，但因為此id的文件不存在，所以更新失敗
{ "update" : { "_id": 100 } } 
{ "doc": { "color": "update green2"} }

bulk的返回結果

因為在bulk中，每個action的執行結果都是獨立的，所以有幾個action，就會有幾個返回結果，返回結果如下

最上面會有一個errors，表示這一次bulk請求中，是否有action出錯了
- 因此寫程式碼時可以先檢查errors這個值，如果是false，表示這次bulk請求全部通過，就不用再一一去檢查是否有action出錯，但如果是true，則必須去items一個一個檢查到底是哪個action出錯了
items是一個數組，裡面則放著每個action對應的結果，上面的請求執行了9個action，所以返回結果的items就會有9個
- 返回結果會依照action的順序排好，因此items的第一個結果就是請求時第一個action的執行結果

{
    "took": 22,
    "errors": true,
    "items": [
        {
            "create": {
                "_index": "mytest",
                "_type": "doc",
                "_id": "1",
                "status": 201
            }
        },
        {
            "create": {
                "_index": "mytest",
                "_type": "doc",
                "_id": "1",
                "status": 409,
                "error": {
                    "type": "version_conflict_engine_exception",
                    "reason": "[doc][1]: version conflict, document already exists (current version [1])",
                    "index_uuid": "hc_2I5efRMK3_RUC0HJGew",
                    "shard": "3",
                    "index": "mytest"
                }
            }
        },
        {
            "index": {
                "_index": "mytest",
                "_type": "doc",
                "_id": "2",
                "status": 201
            }
        },
        {
            "index": {
                "_index": "mytest",
                "_type": "doc",
                "_id": "2",
                "status": 200
            }
        }
        ... 5 RESULTS REMOVED ...
    ]
}

使用bulk要注意的地方
- 如果使用127.0.0.1/_bulk，那麼就是在整個ES的範圍中插入資料，因此在metadata中要指定插入的index和type，優點是可以一次插入多筆資料到不同的索引
  - 而如果使用127.0.0.1/mytest/doc/_bulk，就不用在metadata再次指定要插入的index和type，可以想像成是_bulk API幫我們自動填好了metadata的_index和_type，很方便
- 還有因為bulk和其他請求的格式不同，或是說基本上他已經不是正常的json格式了，所以在使用bulk時，HTTP header要使用application/x-ndjson
  - 而且每一行的結尾，都要使用\n，如果是一般在postman寫請求不會有問題，但是如果是使用curl來發送請求，就要使用--data-binary，才會使每一句的結尾都是\n

ElasticSearch - 批量操作 bulk

bulk允許在一個請求中進行多個操作(create、index、update、delete)，也就是可以在一次請求裡做很多事情也由於這個關係，因此bulk的請求體和其他請求的格式會有點不同 bulk的請求模板分成action、m

elasticsearch（五）java 使用批量操作bulk及注意事項

1，BulkRequest物件可以用來在一次請求中，執行多個索引、更新或刪除操作且允許在一次請求中進行不同的操作，即一次請求中索引、更新、刪除操作可以同時存在 BulkRequest bulkRequest = new BulkRequest(); bulk

Elasticsearch的bulk批量操作和對映（mapping)

批量操作的格式：一般為兩行，delete除外在執行是前面加POST _bulk 只有delete是一行，其餘操作都是兩行對映：當我們建立索引的時候，可以預先定義欄位的型別以及相關屬性，也就是建表見型別。型別

elasticsearch使用bulk實現批量操作

本篇文章提供ES原生批量操作語法及使用bulk批量操作文件。文章依舊提供語法，具體實現大家根據語法，在對應處進行替換即可一、原生批量獲取文件 1、獲取指定文件值（1）語法： GET /_mget { “doc

elasticsearch基本索引和CRUD操作、bulk批量操作

ELK包括ElasticSearch（資料儲存、快速查詢）、logstash（日誌蒐集）、kibana（展示ElasticSearch資料的圖形介面）。 4種常用的HTTP請求方法： POST /uri 建立 DELETE /uri/xxx 刪除 P

ElasticSearch學習（八）在Java應用中實現批量操作（mget&bulk）和查詢刪除、match_all（查詢所有）

//mget批量查詢 @Test public void test6() throws Exception { //指定ES叢集 Settings settings = Settings.builder().put("clus

Elasticsearch使用MultiGet批量獲取文件與使用Bulk批量操作

Multi Get 批量獲取 Multi Get API可以通過索引名、型別名、文件id一次得到一個文件集合，文件可以來自同一個索引庫，也可以來自不同的索引庫。 GET /_mget { "docs":[ { "_index

26.bulk批量操作

不成功 san ont class req 使用 mono _id ret 主要知識點 1、bulk語法 2、bulk使用時的註意事項 3、bulk size 對es性能的影響一、bulk語法每一個操作要兩個json串（delete操作除外

elasticsearch _mget取回多個文件及_bulk批量操作

取回多個文件 Elasticsearch 的速度已經很快了，但甚至能更快。將多個請求合併成一個，避免單獨處理每個請求花費的網路延時和開銷。如果你需要從 Elasticsearch 檢索很多文件，那麼使用 multi-get 或者 mget API 來將這些檢索請求放在一

elasticsearch的一次體驗——5.批量操作

指定索引，型別，id獲取多條資料 GET _mget { "docs":[ { "_index":"job", "_type": "job1", "

Oracle資料庫的批量操作，forall，BULK COLLECT

oracle forall FORALL語句的一個關鍵性改進，它可大大簡化程式碼，並且對於那些要在PL/SQL程式中更新很多行資料的程式來說，它可顯著提高其效能。 1: 用FORALL來增強DML的處理能力 Oracle為Oracle8i中的PL/SQL

26.PLSQL中使用forall和bulk collect批量操作資料庫

假設有以下資料表emp: 一、使用forall批量修改資料庫如果有以下需求：要求修改EMPNO為7499、7566、和7654的成員的sal值為5000，如果我們在P

jQuery 批量操作checkbox

ttr als false box rip 後來 true 全不選批量操作困擾很久的問題：如果只是 $(‘input[type=checkbox]‘).attr(‘checked‘,true);//全選 $(‘input[type=checkbox]‘).a

elasticsearch基本操作之--使用QueryBuilders進行查詢

constant false cor ble conn 中一 listen terms int /** * 系統環境: vm12 下的centos 7.2 * 當前安裝版本: elasticsearch-2.4.0.tar.gz */ QueryBuilder 是es

elasticsearch常用操作

response spa pda 插件 cat 滾動 max 常用 post 3.3.1 Preparing a query 準備查詢請求 import org.elasticsearch.action.search.SearchResponse; import or

不做需求復印機——批量操作流程設計

批量；回調；需求；設計相信每個技術人員都不會甘心做“需求復印機”。不做需求復印機，有兩種簡單的方式。一種是在代碼/模塊/系統的結構上下功夫，例如前面幾篇設計方案（審批、分發等）。另一種則是直接對業務流程開刀，例如這篇文章要舉的例子。背景大家一定都遇到過“批處理”這類需求。這次的背景就是

ELK 學習筆記之 elasticsearch Mget操作

get arch curl idt under alt ima .cn blog Mget操作: 查詢多個文檔： curl -XGET ‘http://192.168.1.151:9200/_mget‘ -d ‘{"docs": [{"_index": "library

C# 遍歷所有的子控件和孫控件，包括容器中的，並批量操作和調用

cnblogs ati tex foreach pri int 遍歷 asc 語句這裏要用兩個知識，一個是遞歸，一個是隊列。 //定義一個Control類型的隊列allCtrls private static Queue <Control> allCtrls

wb 黑名單批量操作

follow valid 讀取 resp exce deb r.js mount ted 0. 參考 yu961549745/WeiboBlackList 微博批量拉黑 1. 代碼 block.py 更新內容：多線程，urllib.request 改為 requests

elasticsearch更新操作java

nts earch email ear java art cut bsp ace /** * 更新操作，更新某個_id下的field的值 * @throws IOException */public static void UpdateDoc() throws IOExce

ElasticSearch - 批量操作 bulk

相關推薦