1. 程式人生 > >Elasticsearch之配置詳解

Elasticsearch之配置詳解

配置詳解

Cluster

  • 叢集名稱,預設為elasticsearch:
    cluster.name: elasticsearch

  • 設定一個節點的併發數量,有兩種情況,一種是在初始復甦過程中:
    cluster.routing.allocation.node_initial_primaries_recoveries: 4
    另一種是在新增、刪除節點及調整時:
    cluster.routing.allocation.node_concurrent_recoveries: 2

Node

  • 節點名稱,es啟動時會自動建立節點名稱,但你也可進行配置:
    node.name: elasticsearch-01
  • 是否允許作為主節點,預設值為true:
    node.master: true

  • 節點自定義屬性,可用於後期叢集進行碎片分配時的過濾:
    node.rack: rack-01

  • Index

    • 設定一個索引的碎片數量,預設值為5:
      index.number_of_shards: 5
    • 設定一個索引可被複制的數量,預設值為1:
      index.number_of_replicas: 1

    當你不需要分散式時,可進行如下設定:

    index.number_of_shards: 1
    index.number_of_replicas: 0

    上述兩個屬性的設定直接影響叢集中索引和搜尋操作的執行,假設有足夠的機器來持有碎片和副本,那麼可以按如下規則設定這兩個值:
    - 擁有更多的碎片可以提升索引執行能力,並允許通過機器分發一個大型的索引;
    - 擁有更多的副本能夠提升搜尋執行能力以及叢集能力,但副本增多會降低插入和刪除操作的效率。

    - 對於一個索引來說,number_of_shards一旦設定將不能修改,而number_of_replicas可以使用索引更新設定API在任何時候被增加或者減少;

    ElasticSearch關注載入均衡、遷移、從節點聚集結果等等,可以嘗試多種設計來完成這些功能,可以連線http://localhost:9200/A/_status來檢測索引的狀態。

    Paths

    • 配置檔案所在的位置,即elasticsearch.yml和logging.yml所在的位置:
      path.conf: /path/to/conf
    • 分配給當前節點的索引資料所在的位置:
      path.data: /path/to/data

      可以可選擇的包含一個以上的位置,使得資料在檔案級別跨越位置,這樣在建立時就有更多的自由路徑,如:
      path.data: /path/to/data1,/path/to/data2
    • 臨時檔案位置:
      path.work: /path/to/work
    • 日誌檔案所在位置:
      path.logs: /path/to/logs
    • 外掛安裝位置:
      path.plugins: /path/to/plugins
    • 外掛託管位置,若列表中的某一個外掛未安裝,則節點無法啟動:
      plugin.mandatory: mapper-attachments,lang-groovy

    Memory

    • JVM開始交換時,ElasticSearch表現並不好:你需要保障JVM不進行交換,可以將bootstrap.mlockall設定為true禁止交換:
      bootstrap.mlockall: true
      請確保ES_MIN_MEM和ES_MAX_MEM的值是一樣的,並且能夠為ElasticSearch分配足夠的內在,併為系統操作保留足夠的記憶體。
    • 預設情況下,ElasticSearch使用0.0.0.0地址,併為http傳輸開啟9200-9300埠,為節點到節點的通訊開啟9300-9400埠,也可以自行設定IP地址:
      network.bind_host: 192.168.0.1
    • publish_host設定其他節點連線此節點的地址,如果不設定的話,則自動獲取,publish_host的地址必須為真實地址:
      network.publish_host: 192.168.0.1
    • bind_host和publish_host可以一起設定:
      network.host: 192.168.0.1
    • 可以定製該節點與其他節點互動的埠:
      transport.tcp.port: 9300
    • 節點間互動時,可以設定是否壓縮,轉為為不壓縮:
      transport.tcp.compress: true
    • 可以為Http傳輸監聽定製埠:
      http.port: 9200
    • 設定內容的最大長度:
      http.max_content_length: 100mb
    • 禁止HTTP:
      http.enabled: false
    • 閘道器允許在所有叢集重啟後持有叢集狀態,叢集狀態的變更都會被儲存下來,當第一次啟用叢集時,可以從閘道器中讀取到狀態,預設閘道器型別(也是推薦的)是local:
      gateway.type: local
    • 允許在N個節點啟動後恢復過程:
      gateway.recover_after_nodes: 1
    • 設定初始化恢復過程的超時時間:
      gateway.recover_after_time: 5m
    • 設定該叢集中可存在的節點上限:
      gateway.expected_nodes: 2

    Indices

    • 設定復甦時的吞吐量,預設情況下是無限的:
      indices.recovery.max_size_per_sec: 0
    • 設定從對等節點恢復片段時開啟的流的數量上限:
      indices.recovery.concurrent_streams: 5
    • 設定一個叢集中主節點的數量,當多於三個節點時,該值可在2-4之間:
      discovery.zen.minimum_master_nodes: 1
    • 設定ping其他節點時的超時時間,網路比較慢時可將該值設大:
      discovery.zen.ping.timeout: 3s
      上有更多關於discovery的設定。
    • 禁止當前節點發現多個叢集節點,預設值為true:
      discovery.zen.ping.multicast.enabled: false
    • 設定新節點被啟動時能夠發現的主節點列表(主要用於不同網段機器連線):
      discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]

    Various

    • 在一個系統上禁用啟動多個節點:
      node.max_local_storage_nodes: 1
    • 在刪除索引時,是否需要明確指定名稱,該值為false時,將可以通過正則或_all進行所以 刪除:
      action.destructive_requires_name: true