1. 程式人生 > >週記:Twenty-six

週記:Twenty-six

忽然發現上週沒有寫週記,可能是因為回學校了一趟,節奏被打亂了吧……回來公司的時候已經是上週週四了。

元旦快樂!!!

前幾天問 H R HR 得知,我們加班節假日是三倍工資,估計週末加班應該是兩倍,好想元旦加班啊,不過還是陪物件更重要。

這兩週在儲存叢集上取得了一定的成果,讓人充滿了信心。

上週通過 PXE 網路安裝,眼看就要成功了,可是卡在 P

u p p e t   E r r o r
  500 Puppet\ Error\ 500 ,怎麼也找不到解決方案,於是韜哥決定讓先不管 F o r e
m a n Foreman
,先部署 H d f s + z f s Hdfs + zfs ,然後再把部署好的機器掛載到 F o r e m a n Foreman ,這是一個好辦法,因為最開始的時候我就是這樣搞的,並且也是幾乎要成功的節奏。

興高采烈的開始幫忙部署 H d f s + z f s Hdfs + zfs ,接著往 F o r m e n a Formena 上掛載,這週三的時候就全部都掛載上去了,此時我以為終於告一段落了,晚上興奮的我睡不著。

誰成想,到了第二天四號機器與十二號機器出問題了,四號機是 H d f s Hdfs 有問題,經排查是莫名其妙的自動重啟導致的,這部分是同事在負責,所以我不用操心,但是十二號機則是 P u p p e t Puppet ,依然是 E r r o r   500 Error\ 500 ,炸裂啊!!!一同操作猛如虎,然後所有機器均出現了這個問題。不過幸運的是,上週入職的高階運維幫我找到了一篇關於這個問題的連結,看了一下午終於搞定了這個問題,原來是因為資訊解析的問題, F o r e m a n Foreman 在往十二號機發送索取資訊的請求時,十二號機對 F o r e m a n Foreman 的請求預設為是 H a s h Hash 處理過的 S t r i n g String ,導致無法識別這個操作,所以在 p u p p e . c o n f puppe.conf 裡禁用掉 H a s h Hash 處理就好了。

到這裡,我才意識到自己真真正正的解決了導致 P X E PXE 部署失敗的問題,恰巧依然是十二號機一直卡死,打算重灌,便嘗試了通過 P X E PXE 進行網路安裝,改了 F o r e m a n Foreman 的指令碼以後,成功的部署到了十二號機上邊,並且經過觀察,再也沒有出現 P u p p e t   E r r o r   500 Puppet\ Error\ 500 了。

至此,關於儲存叢集的任務,我算是結束了,隊友的那部分也搞定了,可以開始搞專案程式碼了。不過,事情總不會那麼順利,經過搞雲端計算的同事進行測試,發現了一個十分嚴重的問題,傳輸資料的速度被嚴重削弱,之前測試 z f s zfs 時,讀寫速度可以達到 1 2 G / s 1\sim2G/s ,整個叢集預計可以達到 40 G / s 40G/s ,但是現在測試發現,單個機器的速度被削弱到 100 300 M / s 100\sim300M/s ,大大的低於預期的效果,實在是扎心啊,不過還好,這部分已經不是我的責任了,我也插不上手,剩下的就交給他們了,接下來我能做的也就是做好下一個工作。

關於 F o r e m a n Foreman 的相關操作,我已經悉數寫成文件, 交給運維去維護,以後有問題,可能還是要麻煩我吧……不過希望文件可以解決他們的問題。

滿滿的成就感,攻克難題的成就感。

倦鳥
2018.12.30