2018.10.9 上線發現elasticsearch寫入速度超級慢，原來罪魁禍首是阿里雲服務的OSS的鍋

阿新 • • 發佈：2018-11-11

問題描述：

按照專案計劃，今天上線部署日誌系統（收集線上的所有日誌，便於問題排查）。
運維按照以前的部署過程，部署elasticsearch,部署結束之後，通過x-pack的monitor發現elasticsearch的索引速度只有幾百/秒的索引速度，遠遠小於同樣的配置，沒有做優化的另一個es叢集。問題就產生了，什麼原因呢

問題定位：

下午比較忙，沒有時間排查問題，就讓另個同事，排查，下午下班的時候去問什麼原因，同事告訴我說是，logstash問題，我信了，因為他對比了以前的logstash 配置，消費kafka主題的配置從以前的topics_pattern=>["server1.history","server2.history"]變更為了topics_pattern => [".*history"]；對於這個回答我信了，我問他對比測試過了？，回答說給了肯定的回答。那好，找到問題，可以去吃飯了。
結果到了晚上，8點從公司外面回來，同事過來和我說，還是有問題。
正好我有空，我就自己來排查，雖然過程麻煩了點
首先我排查：同事說的kafka的資料產生的慢的問題；我自己用消費命令消費一個產資料很多的topic的最新資料，kafka-console-consumer.sh --bootstrap-server:localhost:9092 --topic server.history ;肉眼看明顯資料產生並不慢。那麼問題並不是kafka的問題。我也沒見過kafka會出現大問題
然後，我排查logstash的消費快慢問題；我把logstash的output配置成stdout.肉眼看明顯消費也不慢。那麼問題也不是logstash的消費慢的問題
剩下的排查點就是logstash的output的問題了。改成elasticsearch之後，發現進入elasticsearch的資料幾百/秒，可見問題很大在elasticsearch這邊
我果斷的把一個logstash的output的目標給為另一個正常的，速度較快elasticsearch叢集。馬上發現，這個叢集elasticsearch的索引速度一下就是幾千每秒（還沒做優化，後期優化之後是幾萬每秒）。說明問題在新的elasticsearch叢集
簡單對比了一下叢集配置，沒有什麼大的區別，發了個問題在群裡“新的elasticsearch叢集和以前的有什麼區別”。我以為會得到答案：“沒有區別”，

結果答案是“這次的使用的磁碟是阿里雲的oss磁碟”。我反正不懂這是什麼磁碟。然後我登到elasticsearch伺服器上看

[[email protected] ~]# top

top - 21:53:28 up 1 day, 10:30,  1 user,  load average: 2.16, 1.98, 1.65

Tasks:  94 total,   2 running,  92 sleeping,   0 stopped,   0 zombie

%Cpu(s):  15.4/12.0   27[|||||||||||||||||||||||||||                                                                         ]

KiB Mem :  8010196 total,   507524 free,  7048124 used,   454548 buff/cache

KiB Swap:        0 total,        0 free,        0 used.   702952 avail Mem

add filter #1 (ignoring case) as: [!]FLD?VAL

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                                                               

21285 elastic   20   0 1850420  36896   1812 S 102.2  0.5 736:00.98 ossfs online-all-log /data/ -ourl=http://oss-cn-hangzhou-internal.aliyuncs.com                        

16719 elastic   20   0  9.857g 6.518g  11656 S  11.0 85.3   3:24.11 /usr/jdk1.8.0_162/bin/java -Xms6g -Xmx6g -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=75+

從top中可以看到，21285 elastic 20 0 1850420 36896 1812 S 102.2 0.5 736:00.98 ossfs online-all-log /data/ -ourl=http://oss-cn-hangzhou-internal.aliyuncs.com ossfs 服務佔了100%上下的cpu 。問題定位到了。發了個郵件出來。
第二天，運維重新換磁碟。換了磁碟之後。問題解決。

問題解決過程反思：

排查問題，要一步一步來，確定問題點，才能解決問題。猜測是沒有辦法解決問題的。而且猜測了要去論證

2018.10.9 上線發現elasticsearch寫入速度超級慢，原來罪魁禍首是阿里雲服務的OSS的鍋

問題描述：按照專案計劃，今天上線部署日誌系統（收集線上的所有日誌，便於問題排查）。運維按照以前的部署過程，部署elasticsearch,部署結束之後，通過x-pack的monitor發現elasticsearch的索引速度只有幾百/秒的索引速度，遠遠小於同樣的配置，沒有做優化的另一個es叢集

NOIP2018模擬賽 HDU 4630 No Pain No Game 2018 10 9 T1

難度：NOIP+ 演算法：離線+樹狀陣列簡述題意： 1.1 題目描述給定一個長度為n 的排列a1; a2; a3; :::; an, 現在有Q 個詢問，每次詢問區間[l,r] 內任意選取兩個不同的數字能夠得到的gcd 的最大值。 1.2 輸入一行兩個整數n;Q 接下來一行是

2018.10.9學習筆記

10.9學習筆記今天學習了《Java程式設計思想》的第八章—多型，以及《大話設計模式》的第七章—代理模式，下面對今日學習收穫與疑惑作一個總結。《Java程式設計思想》部分： 1.多型多型是指程式中定義的引用變數所指向的具體型別和通過該引用變數發出的方法呼叫在程式設計時並不

2018/10/9 地平線內推面試

地平線-智慧駕駛演算法實習生【地平線-智慧駕駛演算法實習生】工作職責： 1、負責智慧駕駛車輛的視覺感知相關演算法的效果和效能優化； 2、參與視覺相關演算法的調研、實現和工程化等工作。任職資格： 1、熟悉機器學習和深度學習，如KNN，SVM，boost，CNN等。熟悉演算法的效能優

第1次上機題目2018.10.9

第1次上機題目2018.10.1 以下僅供娛樂，請多指教！歡迎探討！ 1.從鍵盤輸入三個數（要求在輸入資料之前有輸入資料的提示資訊），使用條件表示式求出他們的最小值並輸出結果。 #include <stdio.h> int main() {

c學習筆記2018.10.9

這期筆記整理一下以前學的內容，emmmmm 不一定會畢竟好長時間了，擺出來可以經常複習複習 Hello world 1 #include<stdio.h> #include <stdlib.h> int main() { puts(

頭髮篇【工作日誌：2018.10.9】

Shader "Unlit/NewUnlitShader" { Properties { _Color("Color Tint", Color) = (1,1,1,1) _MainTex("MainTex", 2D) = "White" {} _Cu

基於虛擬機器Linux作業系統專案開發日報表（2018.10.9）

1.學習了fopen、fwrite、fread、fcopy等相關函式和指令。 2.read，write和fread，fwrite的區別：read，write屬於Linux系統呼叫，fread，fwrite屬於C語言標準庫。使用系統呼叫會影響系統的效能，在程式中儘量減少系統呼叫的次數，並且讓每次系統呼叫完成儘可

《C++ primer 》獵豹網校特殊工具與技術 2018/10/9

特殊工具和技術 allocator類 PTTI 類成員的指標巢狀類 union 區域性類位域 volatile exter "C" #include <iostream> using namespace std; class Item_bas

將 ELASTICSEARCH 寫入速度優化到極限

基於版本: 2.x – 5.x在 es 的預設設定,是綜合考慮資料可靠性,搜尋實時性,寫入速度等因素的,當你離開預設設定,追求極致的寫入速度時,很多是以犧牲可靠性和搜尋實時性為代價的.有時候,業務上對兩者要求並不高,反而對寫入速度要求很高,例如在我的場景中,要求每秒200w

關於HMaster為什麼會啟動後就消失不見了。2018-10-9記

網上翻了很多部落格，同質化太嚴重====== 如果你試了網上很多方法沒有解決你的問題時候，那麼問題還是在自己身上=== 我的問題就是，，我用的是hadoop2.9.0，結果如下圖，你看到hbase是X，就是NotSupport。=== 所以還是換成2.7.1.x

2018/10/9 地平線內推面試

地平線-智慧駕駛演算法實習生【地平線-智慧駕駛演算法實習生】工作職責： 1、負責智慧駕駛車輛的視覺感知相關演算法的效果和效能優化； 2、參與視覺相關演算法的調研、實現和工程化等工作。任職資格： 1、熟悉機器學習和深度學習，如KNN，SVM，boost，C

【實戰】 elasticsearch 寫入速度提升的案例分享

文章首發投稿至InfoQ,【俠夢的開發筆記】公眾號，歡迎關注 https://www.infoq.cn/article/t7b52mbzxqkwrrdpVqD2 基本配置基本配置，5臺配置為 24C 125G 17T 的主機，每臺主機上搭建了一個elasticsearch節點。採用的elasti

2018/10/11 林奇Linkey-完美扛住暴跌，跑贏走勢！

昨夜，美股慘遭血洗，堪稱黑色星期三，道指大跌800點，跌幅超3.15%，標普500指數收跌3.29%，納指暴跌4.08%。美股暴跌波及全球市場，香港恆生指數暴跌超千點，上證指數盤中跌幅超4% 。對於這次罕見的暴跌，美國總統特朗普也坐不住了，在盤後他表示： “我認為美聯儲在犯錯誤，他們

2018 10 02 校內模擬字首和+二分+線段樹，廣義尤拉定理

T1:聚會 party.cpp 【描述】在成都的一條街道上，一共有 N 戶人家，每個家庭有 Xi 個人，他們和諧的生活在一起，作為全國和諧街道，他們經常會小範圍組織活動，每次活動會選擇一戶作為聚點，並要求某些家庭參加，為了方便通知，村長每次邀請位置連續的家

【2018.10】【小白向】利用閒置VPS搭建私有離線下載服務最新基於Aria2 +WebUI Aria2實現含帶GUI的離線下載私有迅雷

引子： Aria2是老東西了，下載服務的佼佼者，越來越成熟手頭裡有個專門用來“ 閒置 ”的Vultr伺服器，Vultr家的伺服器有丟包現象，但最大的優點是價效比極高，頻寬極高，用來搭建科學上網和學習實驗用的服務是非常不錯的選擇，而且還支援Alipay和WeChat P

《惢客創業日記》2018.10.17（週三）80後很優秀，就差一點沒捅透

　　今天，到一個朋友的公司，正好趕上他們的新員工培訓會。就聽了起來，臺上的講師就是他們的總經理，也是一個非常優秀的專業講師，整個培訓體系都是圍繞新員工設計的。既有情緒激勵，又有互動遊戲，既不枯燥，又有興趣，整個過程的完整性非常的流暢。老師講完以後，下一個環節挺新穎，就是讓

MySQL MyISAM和InnoDB引擎的寫入速度優化比較，分頁速度優化

以下的文章主要介紹的是MySQL MyISAM的引擎和InnoDB引擎的實際效能的比較，我們首先是通過MySQL資料庫的表結構來出MySQL MyISAM的引擎和InnoDB引擎的實際效能的實際操作。幫助 01 02 03 04 05

2014/08/23——OJ及相關站點打開速度非常慢，訓練計劃login直接error！

erro art family -s ted host 問題： use isp 問題：這個問題存在已經將近一個星期了。剛開始時發現OJ及相關的站點有時候打開有點慢，那時候也沒在意，後來時快時慢的越來越頻繁；今天早上直接一直都打開非常慢（無論什麽時候。這樣的情況）;訓練

python使用pymysql操作資料庫，速度太慢，已解決-------mysql-connector-python

python使用pymysql操作資料庫，速度太慢，已解決-------mysql-connector-python 小編使用python的pymysql操作資料庫使發現，網頁的載入速度特別慢，正常載入時間應該是零點幾秒，可是用pymysql載入的速度高至十幾秒，開始分析時，認為是圖片，

2018.10.9 上線發現elasticsearch寫入速度超級慢，原來罪魁禍首是阿里雲服務的OSS的鍋

相關推薦