ES 32 - Elasticsearch 資料建模的探索與實踐

阿新 • • 發佈：2019-10-07

1 什麼是資料建模?
2 如何對 ES 中的資料進行建模
- 2.1 欄位型別的建模方案
- 2.2 檢索、聚合及排序的建模方案
- 2.3 額外儲存的建模方案
3 ES 資料建模例項演示
- 3.1 動態建立對映關係
- 3.2 手動建立對映關係
- 3.3 新增需求 - 新增大欄位
- 3.4 解決大欄位帶來的效能問題
- 3.5 mapping中欄位的常用引數
- 3.6 mapping 設定小結
4 ES 資料建模最佳實踐
- 4.1 如何處理關聯關係
- 4.2 避免太多的欄位
- 4.3 避免正則查詢
- 4.4 避免空值引起的聚合不準

1 什麼是資料建模?

資料建模(Data modeling), 是建立資料模型的過程.

資料模型是對真實世界進行抽象描述的一種工具和方法, 實現對現實世界的對映. 比如影視作品、演員、觀眾評論...

資料建模有三個過程: 概念模型 => 邏輯模型 => 資料模型(第三正規化)

資料模型, 需要結合使用的資料庫型別, 在滿足業務讀寫效能等需求的前提下, 制定出最終的定義.

2 如何對 ES 中的資料進行建模

ES中的資料建模:

由資料儲存、檢索等功能需求提煉出實體屬性、實體之間的關係 =》形成邏輯模型;

由效能需求提煉制定索引模板、索引Mapping(包括欄位的配置、關係的處理) ==》形成物理模型.

ES 中儲存、檢索的基本單位是索引文件(document), 文件由欄位(field)組成, 所以ES的建模就是對欄位進行建模.

文件類似於關係型資料庫中的一行資料, 欄位對應關係型資料庫中的某一列資料.

2.1 欄位型別的建模方案

(1) text 與 keyword 比較:

text: 用於全文字欄位, 文字會被 Analyzer 分詞; 預設不支援聚合分析及排序, 設定 "fielddata": true

即可支援;
keyword: 用於 id、列舉及不需要分詞的文字, 比如身份證號碼、電話號碼，Email地址等; 適用於 Filter(精確匹配過濾)、Sorting(排序) 和 Aggregations(聚合).
設定多欄位型別:

預設會為文字型別設定成 text, 並設定一個 keyword 的子欄位;
在處理人類自然語⾔時, 可以新增“英⽂”、“拼⾳”、“標準”等分詞器, 提高搜尋結果的正確性.

(2) 結構化資料:

數值型別: 儘量選擇貼近的型別, 例如可以用 byte, 就不要用 long;
列舉型別: 設定為 keyword, 即使是數字, 也應該設定成 keyword, 獲取更好的效能; 另外範圍檢索使用keyword, 速度更快;
其他型別: 日期、二進位制、布林、地理資訊等型別.

2.2 檢索、聚合及排序的建模方案

如不需要檢索、排序和聚合分析, 則可設定 "enable": false ;
如不需要檢索, 則可設定 "index": false ;
如不需要排序、聚合分析功能, 則可設定 "doc_values": false / "fielddate": false ;
更新頻繁、聚合查詢頻繁的 keyword 型別的欄位, 推薦設定 "eager_global_ordinals": true .

2.3 額外儲存的建模方案

是否需要專門儲存當前欄位資料?

"store": true, 可以儲存該欄位的原始內容;

一般結合 "_source": { "enabled": false } 進行使用, 因為預設的 "_source": { "enabled": true }, 也就是新增索引時文件的原始 JSON 結構都會儲存到 _source 中.

disable_source: 禁用 _source 元欄位, 能節約磁碟, 適用於指標型資料 —— 類似於標識欄位、時間欄位的資料, 不會更新、高亮查詢, 多用來進行過濾操作以快速篩選出更小的結果集, 用來支撐更快的聚合操作.

官方建議: 如果更多關注磁碟空間, 那麼建議優先考慮增加資料的壓縮⽐, 而不是禁用 _source;

無法看到 _source 欄位, 就不能做 reindex、update、update_by_query 操作;

目前為止, Kibana 中無法對禁用了 _source 欄位的索引進行 Discover 挖掘操作.

—— 謹慎禁用 _source 欄位, 參考: https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-source-field.html

3 ES 資料建模例項演示

3.1 動態建立對映關係

# 直接寫入一本圖書資訊:
POST books/_doc
{
  "title": "Thinking in Elasticsearch 7.2.0",
  "author": "Heal Chow",
  "publish_date": "2019-10-01",
  "description": "Master the searching, indexing, and aggregation features in Elasticsearch.",
  "cover_url": "https://healchow.com/images/29dMkliO2a1f.jpg"
}

# 檢視自動建立的mapping關係:
GET books/_mapping
# 內容如下:
{
  "books" : {
    "mappings" : {
      "properties" : {
        "author" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "cover_url" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "description" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "publish_date" : {
          "type" : "date"
        },
        "title" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

3.2 手動建立對映關係

# 刪除自動建立的圖書索引:
DELETE books

# 手動優化欄位的mapping:
PUT books
{
  "mappings": {
    "_source": { "enabled": true },
    "properties": {
      "title": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 100
          }
        }
      },
      "author": { "type": "keyword" },
      "publish_date": {
        "type": "date",
        "format": "yyyy-MM-dd HH:mm:ss||yyyyMMddHHmmss||yyyy-MM-dd||epoch_millis"
      },
      "description": { "type": "text" },
      "cover_url": {          # index 設定成 false, 不支援搜尋, 但支援 Terms 聚合
        "type": "keyword",
        "index": false
      }
    }
  }
}

說明: _source 元欄位預設是開啟的, 若禁用後, 就無法對搜尋的結果進行展示, 也無法進行 reindex、update、update_by_query 操作.

3.3 新增需求 - 新增大欄位

需求描述: 新增圖書內容欄位, 要求支援全文搜尋, 並且能夠高亮顯示.
需求分析: 新需求會導致 _source 的內容過⼤, 雖然我們可以通過source filtering對要搜尋結果中的欄位進行過濾:
```
"_source": {
    "includes": ["title"]  # 或 "excludes": ["xxx"] 排除某些欄位, includes 優先順序更高
}
```
但這種方式只是 ES 服務端傳輸給客戶端時的過濾, 內部 Fetch 資料時, ES 各資料節點還是會傳輸 _source 中的所有資料到協調節點 —— 網路 IO 沒有得到本質上的降低.

3.4 解決大欄位帶來的效能問題

(1) 在建立 mapping 時手動關閉 _source 元欄位: "_source": { "enabled": false} ;

(2) 然後為每個欄位設定 "store": true .

# 關閉_source元欄位, 設定store=true:
PUT books
{
  "mappings": {
    "_source": { "enabled": false },
    "properties": {
      "title": {
        "type": "text",
        "store": true,
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 100
          }
        }
      },
      "author": { "type": "keyword", "store": true },
      "publish_date": {
        "type": "date",
        "store": true,
        "format": "yyyy-MM-dd HH:mm:ss||yyyyMMddHHmmss||yyyy-MM-dd||epoch_millis"
      },
      "description": { "type": "text", "store": true },
      "cover_url": {
        "type": "keyword",
        "index": false,
        "store": true
      },
      "content": { "type": "text", "store": true }
    }
  }
}

(3) 加資料, 並進行高亮查詢:

# 新增包含新欄位的文件:
POST books/_doc
{
  "title": "Thinking in Elasticsearch 7.2.0",
  "author": "Heal Chow",
  "publish_date": "2019-10-01",
  "description": "Master the searching, indexing, and aggregation features in Elasticsearch.",
  "cover_url": "https://healchow.com/images/29dMkliO2a1f.jpg",
  "content": "1. Revisiting Elasticsearch and the Changes. 2. The Improved Query DSL. 3. Beyond Full Text Search. 4. Data Modeling and Analytics. 5. Improving the User Search Experience. 6. The Index Distribution Architecture.  .........."
}

# 通過 stored_fields 指定要查詢的欄位:
GET books/_search
{
  "stored_fields": ["title", "author", "publish_date"],
  "query": {
    "match": { "content": "data modeling" }
  },
  "highlight": {
    "fields": { "content": {} }
  }
}

查詢結果如下:

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.5753642,
    "hits" : [
      {
        "_index" : "books",
        "_type" : "_doc",
        "_id" : "dukLoG0BdfGBNhbF13CJ",
        "_score" : 0.5753642,
        "highlight" : {
          "content" : [
            "<em>Data</em> <em>Modeling</em> and Analytics. 5. Improving the User Search Experience. 6."
          ]
        }
      }
    ]
  }
}

(4) 結果說明:

返回結果中不包含 _source 欄位;

對需要顯示的資訊, 要在查詢中指定 "stored_fields": ["xxx", "yyy"] ;

禁⽌ _source 欄位後, 仍然支援使用 Highlights API 的使用.

3.5 mapping中欄位的常用引數

參考: https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-params.html

enabled – 設定成 false, 當前欄位就只儲存, 不支援搜尋和聚合分析 (資料儲存在 _source 中);
index – 是否構建倒排索引, 設定成 false, 就無法被搜尋, 但還是支援聚合操作, 並會出現在 _source 中;
norms – 只⽤來過濾和聚合分析(指標資料)、不關心評分的欄位, 建議關閉, 節約儲存空間;
doc_values – 是否啟用 doc_values, 用於排序和聚合分析;
field_data – 如果要對 text 型別啟用排序和聚合分析, fielddata 需要設定成true;
coerce – 是否開啟資料型別的自動轉換 (如: 字串轉數字), 預設開啟;
multifields - 是否開啟多欄位特性;
dynamic – 控制 mapping 的動態更新策略, 有 true / false / strict 三種.

doc_values 與 fielddata 比較:

doc_values: 聚合和排序的欄位需要開啟 —— 預設為所有非text型別的欄位開啟 —— 記憶體不夠時, 會寫入磁碟檔案中;

fielddata: 是否為text型別開啟, 以實現排序和聚合分析 —— 預設關閉 —— 全部載入進記憶體中.

3.6 mapping 設定小結

(1) 支援加入新的欄位 (包括子欄位)、更換分詞器等操作:

可以通過 update_by_query 令舊資料得到清洗.

(2) Index Template: 根據索引的名稱匹配不同的 mappings 和 settings;

(3) Dynamic Template: 在一個 mapping 上動態設定欄位型別;

(4) Reindex: 如果要修改、刪除已經存在的欄位, 或者修改分片個數等引數, 就要重建索引.

必須停機, 資料量大時耗時會比較久.

可藉助 Index Alias (索引別名) 來實現零停機維護.

4 ES 資料建模最佳實踐

4.1 如何處理關聯關係

(1) 正規化化設計:

我們知道, 在關係型資料庫中有“正規化化設計”的概念, 有 1NF、2NF、3NF、BCNF 等等, 主要目標是減少不必要的更新, 雖然節省了儲存空間, 但缺點是資料讀取操作可能會更慢, 尤其是跨表操作, 需要 join 的表會很多.

反正規化化設計: 資料扁平, 不使用關聯關係, 而是在文件中通過 _source 欄位來儲存冗餘的資料拷貝.

優點: 無需處理 join 操作, 資料讀取效能好;

缺點: 不適合資料頻繁修改的場景.

==》ES 不擅長處理關聯關係, 一般可以通過物件型別(object)、巢狀型別(nested)、父子關聯關係(child/parent)解決.

具體使用所佔篇幅較大, 這裡省略.

4.2 避免太多的欄位

(1) 一個⽂檔中, 最好不要有⼤量的欄位:

過多的欄位導致資料不容易維護;

mapping 資訊儲存在 Cluster State 中, 資料量過⼤, 對叢集效能會有影響 (Cluster State 資訊需要和所有的節點同步);

刪除或修改欄位時, 需要 reindex;

(2) ES中單個索引最大欄位數預設是 1000, 可以通過引數 index.mapping.total_fields.limt 修改最⼤欄位數.

思考: 什麼原因會導致文件中有成百上千的欄位?

ES 是無模式 (schemaless) 的, 預設情況下, 每新增一個欄位, ES 都會根據該欄位可能的型別自動新增對映關係.

如果業務處理不嚴謹, 會出現欄位爆炸的現象. 為了避免這種現象的發生, 需要制定 dynamic 策略:

true - 未知欄位會被自動加入, 是預設設定;

false - 新欄位不會被索引, 但是會儲存到 _source 中;

strict - 新增欄位不會被索引, ⽂檔寫入失敗, 丟擲異常.

—— 生產環境中, 儘量不要使用預設的 "dynamic": true .

4.3 避免正則查詢

正則、字首、萬用字元查詢, 都屬於 Term 查詢, 但是效能很不好(掃描所有文件, 並逐一比對), 特別是將萬用字元放在開頭, 會導致效能災難.

(1) 案例:

文件中某個欄位包含了 Elasticsearch 的版本資訊, 例如 version: "7.2.0" ;

搜尋某系列的 bug_fix 版本(末位非0的版本號)? 每個主要版本號所關聯的文件?

(2) 萬用字元查詢示例:

# 插入2條資料:
PUT softwares/_doc/1
{
  "version": "7.2.0",
  "doc_url": "https://www.elastic.co/guide/en/elasticsearch/.../.html"
}

PUT softwares/_doc/2
{
  "version": "7.3.0",
  "doc_url": "https://www.elastic.co/guide/en/elasticsearch/.../.html"
}

# 萬用字元查詢:
GET softwares/_search
{
  "query": {
    "wildcard": {
      "version": "7*"
    }
  }
}

(3) 解決方案 - 將字串型別轉換為物件型別:

# 建立物件型別的對映:
PUT softwares
{
  "mappings": {
    "properties": {
      "version": {      # 版本號設定為物件型別
        "properties": {
          "display_name": { "type": "keyword" },
          "major": { "type": "byte" },
          "minor": { "type": "byte" },
          "bug_fix": { "type": "byte" }
        }
      },
      "doc_url": { "type": "text" }
    }
  }
}

# 新增資料:
PUT softwares/_doc/1
{
  "version": {
    "display_name": "7.2.0",
    "major": 7,
    "minor": 2,
    "bug_fix": 0
  },
  "doc_url": "https://www.elastic.co/guide/en/elasticsearch/.../.html"
}

PUT softwares/_doc/2
{
  "version": {
    "display_name": "7.3.0",
    "major": 7,
    "minor": 3,
    "bug_fix": 0
  },
  "doc_url": "https://www.elastic.co/guide/en/elasticsearch/.../.html"
}

# 通過filter過濾, 避免正則查詢, 大大提升效能:
GET softwares/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "match": { "version.major": 7 }
        },
        {
          "match": { "version.minor": 2 }
        }
      ]
    }
  }
}

4.4 避免空值引起的聚合不準

(1) 示例:

# 新增資料, 包含1條 null 值的資料:
PUT ratings/_doc/1
{
  "rating": 5
}
PUT ratings/_doc/2
{
  "rating": null
}

# 對含有 null 值的欄位進行聚合:
GET ratings/_search
{
  "size": 0,
  "aggs": {
    "avg_rating": {
      "avg": { "field": "rating"}
    }
  }
}

# 結果如下:
{
  "took" : 3,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,              # 2條資料, avg_rating 結果不正確
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "avg_rating" : {
      "value" : 5.0
    }
  }
}

(2) 使用 null_value 解決空值的問題:

# 建立 mapping 時, 設定 null_value:
PUT ratings
{
  "mappings": {
    "properties": {
      "rating": {
        "type": "float",
        "null_value": "1.0"
      }
    }
  }
}

# 新增相同的資料, 再次聚合, 結果正確:
{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  },
  "aggregations" : {
    "avg_rating" : {
      "value" : 3.0
    }
  }
}

參考資料

《極客時間》視訊課之《Elasticsearch核心技術與實戰》

版權宣告

作者: 馬瘦風(https://healchow.com)

出處: 部落格園馬瘦風的部落格(https://www.cnblogs.com/shoufeng)

感謝閱讀, 如果文章有幫助或啟發到你, 點個[好文要頂

ES 32 - Elasticsearch 資料建模的探索與實踐

目錄 1 什麼是資料建模? 2 如何對 ES 中的資料進行建模 2.1 欄位型別的建模方案 2.2 檢索、聚合及排序的建模方案 2.3 額外儲存的建模方案 3

閒魚在資料聚合上的探索與實踐

概述隨著業務的不斷擴張，各種運營活動越來越多，原有的前端渲染-後端提供業務介面的開發方式對於一個生命週期可能只有幾天的活動來說成本巨大。閒魚在降低開發成本，提高整體效率上做了一些嘗試和實踐。本文介紹閒魚從資料聚合方面進行了一些探索和嘗試，以及Graphql的引入給閒魚帶了研發效率的提升。

衛星影像識別技術在高德資料建設中的探索與實踐

導讀對於地圖服務而言，地圖資料的準確率和覆蓋率是服務質量的關鍵因素，而地圖資料的更新，依賴於多種資訊源，如軌跡熱力，實採影象，衛星影像等。近年來，由於遙感衛星數量的增多及高解析度光譜相機的出現，以及衛星影像圖自身覆蓋廣、視角好、資訊豐富的特點，衛星影像作為地圖資料更新的資訊源起到了越來越重要的作用。對於衛星

記新田縣“黨建+脫貧”的探索與實踐z

rmq 主任 knn pcr k8s svd wcf ps3 kml 記新田縣“黨建+脫貧”的探索與實踐　　紅網時刻湘潭站9月1日訊(通訊員賀淩雲周翼記者淩雨晴)9月1日，湖南省級貧困村平裏村迎來了期盼已久的大喜事，韶山市平裏村田園綜合體項目舉行奠基儀式。奠基儀式

OpenSearch演算法產品化探索與實踐

作為搜尋的使用者，我覺得最關心的是兩個方面：一是召回的結果是否符合預期，二是召回結果的排序是否符合預期。OpenSearch作為一個搜尋服務提供平臺，在這兩個方面我們提供了一定機制方便使用者定製自己的召回和排序邏輯。將搜尋這邊積累的演算法功能通過這兩個視

區塊鏈在版權保護方面的探索與實踐

人類傳播史上，經歷了語言、書寫、印刷、電子、互動等 5 次革命，區塊鏈的出現將把人類帶入價值傳播的新時代。億書（英文名 Ebookchain），是目前國內唯一一款專注於版權保護的區塊鏈產品，本文通過簡單介紹億書產品的實現，分享區塊鏈在版權保護方面的探索與實踐。版權保護的困局和傳統方法的侷限隨

DT時代下資料庫災備的探索與實踐

摘要：隨著DT時代的到來，企業對資料的依賴程度與日俱增，資料保護早已成為企業的一門必修課。只有擁有先知先覺的防範意識和充分的技術準備，才能“覆巢之下，亦有完卵” 170餘場主題峰會和分論壇完美呈現，上千位分享嘉賓、數萬名創新創業導師齊聚一堂，剛剛結束的2018杭州雲棲大會

資料庫智慧運維探索與實踐

從自動化到智慧化運維過渡時，美團DBA團隊進行了哪些思考、探索與實踐？本文根據趙應鋼在“第九屆中國資料庫技術大會”上的演講內容整理而成，部分內容有更新。背景近些年，傳統的資料庫運維方式已經越來越難於滿足業務方對資料庫的穩定性、可用性、靈活性的要求。隨著資料庫規模急速擴大，各種NewSQL系統上線使用，

金海：從網格計算到雲端計算——虛擬化的探索與實踐

金海：大家好，我是金海，華中科技大學計算機學院的。今天想和大家分享的是從網格計算到雲端計算——虛擬化的探索與實踐。我的演講主要分為幾個方面： 1、網格計算和雲端計算 2、計算系統虛擬化基礎理論與方法研究973專案簡介 3、桌面虛擬化技術實踐 4、最後進行一個小的總結

【AIOps下的探索與實踐】神州靈雲和Rancher共同舉辦Container Open Talk 沙龍活動

10月13日，由神州靈雲和Rancher Labs共同舉辦的Container Open Talk技術沙龍在北京舉行。現場吸引了近100名技術專家、學者及IT從業者參加。大家與行業大咖一起體驗創新，探討學習交流，共享技術盛宴。來自Rancher Labs、神州

乾貨 | 論Elasticsearch資料建模的重要性

1、什麼是資料模型？資料模型是抽象描述現實世界的一種工具和方法，是通過抽象的實體及實體之間聯絡的形式，用圖形化的形式去描述業務規則的過程，從而表示現實世界中事務的相互關係的一種對映。核心概念：實體：現實世界中存在的可以相互區分的事務或概念稱為實體。

餓了麼全鏈路壓測的探索與實踐報告

自2015年開始，隨著網際網路行業的快速發展，餓了麼公司的業務也進入了快速擴張階段，餓了麼線上外賣平臺使用者量達2.6億，覆蓋全國2000多個城市。外賣業務本身具備以下特點：時效性: 從使用者下單到商家接單再到物流配送到家，整個流程要控制在一定時間範圍之內，對

Hadoop大資料平臺架構與實踐

一、什麼是Apache Hadoop？ 1.1 定義和特性可靠的、可擴充套件的、分散式計算開源軟體。 Apache Hadoop軟體庫是一個框架，允許使用簡單的程式設計模型，在計算機叢集分散式地處理大型資料集。它可以從單個伺服器擴充套件到數千臺機器，每個機

阿里巴巴敏捷研發的探索與實踐

今天你敏捷了嗎？敏捷產品開發提倡快速迭代、小步快跑，以便更靈活地應對變化，目前逐漸演變為行業潮流。阿里巴巴內部也在不斷進行敏捷實踐。3月15日雲效開啟敏捷專場沙龍，特邀阿里巴巴敏捷教練何勉、張迎輝、張燎原為大家分享阿里巴巴的敏捷實踐，從中大家可以瞭解到網際網路產品全生命週期的

8位16位32位資料的拆分與合併程式

拆分 //16位拆成兩個8位 u16 data16 = 0x1234; u8 data8_H,data8_L; data8_H = (u8)(data16 >> 8); data8_L = (u8)data16; 32位拆成4個8位方法一：

Android 模組化探索與實踐

首發於《程式設計師》雜誌五月刊一、前言全球資訊網發明人 Tim Berners-Lee 談到設計原理時說過：“簡單性和模組化是軟體工程的基石；分散式和容錯性是網際網路的生命。” 由此可見模組化之於軟體工程領域的重要性。從 2016 年開始

深度學習在搜尋業務中的探索與實踐

本文根據美團高階技術專家翟藝濤在2018 QCon全球軟體開發大會上的演講內容整理而成，內容有修改。引言 2018年12月31日，美團酒店單日入住間夜突破200萬，再次創下行業的新紀錄，而酒店搜尋在其中起到了非常重要的作用。本文會首先介紹一下酒店搜尋的業務特點，作為O2O搜尋的一種，酒店搜尋和

HTTPS優化探索與實踐

HTTPS 是網際網路安全的基礎之一，然而引入 HTTPS 卻會帶來效能上的損耗。本文作者深入解析了 HTTPS 協議優化的各個方面，對實戰很有幫助。 2012 年斯諾登（Edward Snowden）爆出稜鏡門事件後，網際網路安全問題日益得到大家的重視。去年 Ap

Kafka 在華泰證券的探索與實踐

本文轉自公眾號：上交所技術服務，https://mp.weixin.qq.com/s/q5aKS

360搜尋容器雲探索與實踐

隨著容器化程序的加速，容器編排的需求也越來越強烈。而容器編排也經歷了從Kubernetes、Me

ES 32 - Elasticsearch 資料建模的探索與實踐

1 什麼是資料建模?

2 如何對 ES 中的資料進行建模

2.1 欄位型別的建模方案

2.2 檢索、聚合及排序的建模方案

2.3 額外儲存的建模方案

3 ES 資料建模例項演示

3.1 動態建立對映關係

3.2 手動建立對映關係

3.3 新增需求 - 新增大欄位

3.4 解決大欄位帶來的效能問題

3.5 mapping中欄位的常用引數

3.6 mapping 設定小結

4 ES 資料建模最佳實踐

4.1 如何處理關聯關係

4.2 避免太多的欄位

4.3 避免正則查詢

4.4 避免空值引起的聚合不準

參考資料

版權宣告

相關推薦