1. 程式人生 > >ElasticStack系列之十九 & bulk時 index 和 create 的區別

ElasticStack系列之十九 & bulk時 index 和 create 的區別

忽略 使用 sea amp tro creat 嘗試 ron 機制

區別:

  兩篇文章 id 都一樣的情況下,index 是將第二篇文章覆蓋第一篇;create 是在第二篇插入的時候拋出一個已經存在的異常

解釋:

  在批量請求的時候最好使用 create 方式進行導入。假如你批量導入一個大小為500MB 的文件,中途突然網絡中斷,可能其中有5萬條數據已經導入,那麽第二次嘗試導入的時候,如果選用 index 方式,那麽前5萬條數據又會重復導入,增加了很多額外的開銷,如果是 create 的話,elasticsearch 針對 bulk 操作機制是忽略已經存在的(當然在 bulk 完成後會返回哪些數據是重復的),這樣就不會重復被導入了

ElasticStack系列之十九 & bulk時 index 和 create 的區別