1. 程式人生 > >Backblaze根據他們手中的歷史資料,對不同品牌、容量的機械硬碟進行了一番對比

Backblaze根據他們手中的歷史資料,對不同品牌、容量的機械硬碟進行了一番對比

日前,國外雲備份服務公司Backblaze根據他們手中的歷史資料,對不同品牌、容量的機械硬碟進行了一番對比,得出結論稱無論故障率還是壽命,日立最好,西數其次,希捷第三,同時還宣稱企業級硬碟反而不如消費級產品更可靠。

這自然引發了極大的爭論,那麼各大硬碟品牌真的可以如此排序麼?是否能公正地反映客觀情況?國外科技媒體TweakTown撰文詳談了他們的看法,這裡我們原文編譯出來和大家分享。至於他們的結論,那是相當的明顯……

我們在本文中詳細記錄了Backblaze在提供可信的硬碟可靠性資料方面的失敗嘗試。閱讀之後你就瞭解為什麼你根本不用在意這些測試結果了。

企業都有一個有趣的傾向,即無所不用其極地為公司做宣傳。作為一個儲存類產品的作者,我需要隨時關注最新的訊息。在一週的時間裡我看到有些公司每天都在吵鬧著要求獲取關注。他們的嘗試包羅永珍,有的平凡、有的熱鬧、有的甚至惹人生疑。有些公司會做任何事情以使自己從成千上萬其他公司的喧囂中脫穎而出。

就個人而言,我很高興我並沒有被分配任務去宣傳某些公司或其產品。在過去的幾天裡我們觀察到,Backblaze的新聞頭條鋪天蓋地。

Backblaze藉助其硬碟可靠性測試的部落格,已經在本週佔據了所有高科技網站的首頁。Backblaze在不斷更新他們的部落格,並努力為使用者提供每月不到5美元的無限線上備份服務。你讀到這條新聞的時候就使得Backblaze做這一切都值得了——他們已經將資訊傳達了出去。

這條最新的帖子起源於他們討論硬碟能用多久的部落格,測試的結果是企業級硬碟還不如消費級硬碟可靠。毫無疑問,我們可以確信這種測試方法存在漏洞,而且漏洞大的足以開輛卡車通過了。然而,部落格標題誘導公眾關注更詳細的硬碟故障率,而Backblaze總結成了最新的帖子: “我應該買什麼硬碟?”

硬碟可靠性品牌排行?認真你就輸了

然而Backblaze或許清楚這個測試結果,但他們並沒有說明測試的環境,也沒有很好地解釋其測試資料對於典型消費者沒有過多價值的原因。既然大家的目的都是為了獲取硬碟可靠性資料,那就應當對一些有疑義的測試進行進一步調查。

Backblaze採用了開源方法在其儲存架構上分享資料,甚至分享原理圖,以便其使用者建立自己的Backblaze伺服器。這使得我們有了進一步探究其測試資料的依據。

在2011年硬碟危機時期閱讀Backblaze釋出的有關於硬碟方面的部落格是很有幫助的,當時他們竭盡全力以符合成本效益的方式維持運營。很遺憾,這種敬業的態度並沒有在其評測硬碟可靠性排名的測試中體現出來。更嚴重的是,目前有很多科技網站已經在其網站轉載了這項測試結果,並且聲稱這個測試結果可以作為評估硬碟可靠性的最終標準。

Backblaze使用很好看的圖表釋出了測試結果,並評選出了獲勝者。從該圖表看,日立和西部資料的硬碟可靠性最高,分居前兩位,而希捷以較大劣勢位於第三位。

然而,在這種情況下,獲勝者並不是真正意義上的獲勝。讓我們發動卡車,穿過測試中的巨大漏洞,並闡述為何這份結果不應該影響消費者的購買信心。

硬碟採購

Backblaze毫不掩飾地儘可能採購最為廉價的消費級硬碟,以儲存客戶的資料。他們的目標是提供儘可能便宜的儲存服務,為客戶節約資金。他們並非不分青紅皁白地使用這些硬碟,每種硬碟型號均須經過短期測試,以確保它能夠滿足上述目標。將這些廉價的硬碟和各種RAID以及複製方案結合在一起,就能夠安全地儲存資料。

在2011年10月份發生的泰國洪災期間,Backblaze不得不全力以赴,希望能夠採購到足夠的硬碟以維持運營。硬碟價格暴漲,但仍然供不應求,於是他們直接走上街頭四處採購,用這種極端的方式來控制損失。他們將這種做法稱為“硬碟包收(drive farming)”。

首先,他們發現購買外接硬碟非常經濟有效。市場情況說明,外接硬碟通常比內建桌上型電腦硬碟便宜。外接硬碟的外殼比較小,一般通過USB或eSATA連線。於是,Backblaze採購外接硬碟,去掉外殼,並把這個過程親切地稱為“剝殼”。就像剝玉米一樣,他們將外殼拆下來,就能夠得到可用的硬碟。 

硬碟可靠性品牌排行?認真你就輸了

起初,他們到Fry's和Costco瘋狂搶購,直到部分員工最終被這些商店禁止繼續購買硬碟。於是他們進一步擴大範圍,召集朋友和家人幫忙繼續採購硬碟,甚至制定出複雜的硬碟採購方案,以避開各種硬碟採購限制。

當這種方法開始在區域性地區失去效力時,他們甚至考慮從雷德(Ryder)汽車租賃公司租來卡車,到全國各地沿途收購硬碟。

最終他們採用了眾包(crowdsourcing)的方式。只要在Costco銷售硬碟時購買到產品併發送給公司,Backblaze便為他們額外提供每塊硬碟5美元的獎金 。

這種做法顯示出驚人的創造力,其目的也是為客戶實現最大的利益,值得稱道。不幸的是,這種做法沒有很好地創建出一個用於判斷硬碟可靠性的穩定的樣品池。Backblaze也承認樣品池中的部分硬碟為返修產品(RMA)。

硬碟可靠性品牌排行?認真你就輸了

Backblaze的故障大多數發生在這些硬碟投入使用的最初幾周時間裡,若考慮一下它的硬碟採購方法,便能夠理解為什麼是這種情況。一般的故障涉及到大量的儲存裝置,故障最有可能發生在產品生命週期的初期和末期階段,但可以斷言的是,他們的硬碟採購方法導致了其結果。

很有趣的是,Backblaze獲得了500萬美元的風險投資。不久,Costco規定每人限購買五塊外接硬碟。即便有了大規模的投資,Backblaze仍然採用其老辦法來採購硬碟。正如他們自己所說,積習難改。

不幸的是,他們採購的這些硬碟被納入了故障率的計算之中。

機箱

Backblaze還把自己的創造力延伸到了伺服器機架領域。他們設計了專門的storage pod enclosures,並在網路上共享其原理圖。這種值得稱讚的資訊共享做法也有助於解讀他們的“故障率”資料。

上述storage pod目前已升級到3.0版本,前兩個版本進行升級都是為了解決大量的設計問題,其中最顯著的問題就是震動。

震動是硬碟的大敵,會導致各種元件出現嚴重的磨損,甚至會影響效能。一般的桌上型電腦硬碟在穩定的環境中基本不存在震動,因此在設計的時候抗震性也稍差。企業級硬碟設計的主要差別之一就是抗震技術。抗震技術使得硬碟能夠抵抗伺服器機箱和機架的磨損,並良好地執行。

一個機箱中安裝太多的硬碟會增大震動量。Backblaze在每個機箱中安裝了45塊硬碟,以便將儲存密度最大化。硬碟最初都是遭受伺服器內部鄰近硬碟震動的影響,而一旦放置於機架中,硬碟還會遭受其它伺服器震動的影響。這樣就會產生震動的“完美風暴”,使用消費級硬碟就會導致可怕的故障率,Backblaze的資料便是最好的證明。

硬碟可靠性品牌排行?認真你就輸了

難怪Backblaze不斷地改善其機箱,以便更好地抗震:早期型號僅採用尼龍墊片減震。進一步分析其資料,我們可以發現,最早投入使用的硬碟,其故障率最高。原因很簡單:這些硬碟安裝在1.0版本的儲存機箱裡,震動問題非常嚴重。

不幸的是,這些硬碟絕大部分來自於希捷的產品線。由於機箱問題導致這些硬碟的年故障率高達25.4%,如果真是這樣,那麼希捷就不用做生意了。

Backblaze披露的故障率資料沒有考慮大量的資訊。將所有硬碟按照不同的機箱版本進行分組,才是負責任的傳遞資訊方法。我們確信,較早的硬碟沒有安裝在最好的機箱中,3.0版本的機箱直到2013年2月份才推出。

環境

影響硬碟壽命的另外一個因素是溫度。溫度和溼度的變化可對硬碟壽命造成影響。通讀Backblaze部落格,有一條關於伺服器機架溫度的評論吸引了我的注意;

……過去三年,我們觀察到:1)機架頂部pod中的硬碟溫度相比較低層硬碟平均高出三度;2)Pod中心的硬碟溫度相比邊界硬碟高出五度;3)各pod無需所有六部風扇——只用兩部風扇,硬碟便可維持建議的執行溫度;4)熱量與硬碟故障無關(至少在storage pod中是這樣)。

Backblaze聲稱硬碟溫度不影響硬碟壽命。這與硬碟製造商等許多其他人的觀察相悖。硬碟執行需保持在一定的溫度範圍內是有原因的。儘管Backblaze的硬碟可能在這些範圍之內,但若溫度不同則無法直接進行比較,不在溫度範圍之內的硬碟就更不用說了。

再次重申,缺乏有針對性的資訊就不可能做出真實的結論,測試環境的參差不齊毀掉了Backblaze的資料。

工作負載

每塊硬碟均經過精心設計,以便在目標使用環境中提供嚴格規定的服務水平。這種指導原則不僅決定著硬碟的設計,而且還決定著採用的元件型別。最經濟有效的硬碟設計目的是在目標環境中提供適當的效能和壽命,僅此而已。採用超出硬碟工作負載需求的強大元件是一種浪費,並且會增加不必要的成本。這種設計效率還意味著硬碟在非目標環境下更加容易發生故障。

Backblaze始終在市場上採購最便宜的硬碟,而不管其額定的工作負載,然後將它們應用於最嚴酷的環境之中,這樣勢必會破壞硬碟,導致故障率比自然狀態下更高。這隻能說明這些硬碟的工程設計精準地滿足既定目的,僅此而已。

另外一個問題就是:即使工作負載不同,也強行在硬碟之間進行直接的比較。實際上,若沒有實施同樣的工作負載,則無法將同型號的硬碟進行比較,而比較不同的型號和製造商更是荒謬絕倫。沒有辦法計算硬碟旋轉了多少次,也沒有辦法計算硬碟處理了多少次不同型別的資料請求。

隨機資料需要硬碟磁頭更多的運動,因此會給精密的硬碟磁頭造成更多的磨損。旋轉加速減速,進入以及從各種休眠狀態恢復,時間長了也會給硬碟造成不同程度的磨損。工作負載的分配沒有真正的邏輯性,更不用說環境了,所以直接比較硬碟是行不通的。

只有一件事是確定的,那就是:硬碟處理的工作負載遠遠超過了它們的設計極限。

最終思考

Backblaze的資料不應該影響任何消費者的購買決策,無論他們購買什麼型別的硬碟。無數的變數,以及缺少證明檔案,導致其結果不可靠。即使對於獲勝者來說,測試結果也是不利的,故障率遠遠超出了實際的觀察情況。大家應該置疑,若在實際的情形中質保返修率如此高,那麼這些公司怎麼能夠生存下來?

我們論及了Backblaze比較方法的一些最顯而易見的漏洞,但實際上還有更多的漏洞存在,比如樣本數量。每種型號的硬碟數量各不相同,而部分壞的批次可能進入了樣本池,進一步扭曲了評測資料。

最好的例子來自於他們自己的部落格帖子“企業級硬碟:事實還是虛構?”這篇部落格帖子顯示,Backblaze將可能是同一批次採購的368塊企業級硬碟與14719塊消費級硬碟進行了比較。除了壞的批次可能扭曲了測試資料之外,Backblaze還承認他們將硬碟用於不同的機箱、溫度和工作負載。這樣導致他們的資料基本上是毫無價值的比較,不過配上一個引人注目的標題之後,這些資料確實達到了譁眾取寵的目的。

我十分欣賞Backblaze的發展歷程。他們決心為客戶提供卓越的價值,併為此目標而竭盡全力。他們的部落格帖子詳細說明了他們採取的各種極端措施,讀起來真是引人入勝,我相信他們享受挑戰。他們的storage pod設計新穎,經過了廣泛的現場測試和改善,能夠提供有吸引力的每GB價格。

但是,他們用簡單的圖表進行虛假的展示,這樣釋出的資料刺激到了堅守原則的我。

硬碟製造商在研發方面花費了數十億美元,他們的實驗室就是為了打造和測量其儲存解決方案的可靠性和耐用性。Backblaze的環境則剛好相反。我做夢都想不到能夠在這樣差的條件下開展硬碟的可靠性研究和比較。

很難相信他們開展策劃、召集會議、制定流程,通過各種可笑的途徑採購最便宜的硬碟,把它們安裝在各種不同(有時還存在缺陷)的機箱裡,堆垛起來,讓它們來應付完全不同的工作負載和環境條件……而做這些都是為了測試硬碟的可靠性。

這當然不是目的,但有些人會這樣解讀這些資料。在我看來,媒體宣傳的魅力戰勝了常識,Backblaze釋出了這些資料,用花哨的標題吸引了眾多眼球。

相關推薦

Backblaze根據他們手中歷史資料不同品牌容量機械硬碟進行一番對比

日前,國外雲備份服務公司Backblaze根據他們手中的歷史資料,對不同品牌、容量的機械硬碟進行了一番對比,得出結論稱無論故障率還是壽命,日立最好,西數其次,希捷第三,同時還宣稱企業級硬碟反而不如消費級產品更可靠。 這自然引發了極大的爭論,那麼各大硬碟品牌真的可以如此排序麼

根據字典中值得大小字典中的項排序

lam and for 數據 bcd 參數 sorted imp abcde 案例1: 某班語文科目的成績以字典形式存儲,形式為:{"lili":89,"wenwen":91 ...} 根據成績高低,計算學生的排名 解決方案: 使用內置函數sorted 1,利用zip將

根據屬性名稱的字串集合按條件過濾

1. Java8裡面有根據物件屬性名稱,對集合進行過濾,如下: 過濾出doctId為1948的物件集合: ret.setSchedulList(ret.getSchedulList().parallelStream().filter(g -> g.getDoctId().equals("194

根據使用者輸入的資料建立一個有序連結串列

步驟分析 分析: 建立連結串列是一個從無到有的過程。 空連結串列是有序的 只有一個結點的連結串列是有序的 把一個結點,加入到一個有序連結串列中去,使其仍然有序. 那麼我們就需要一個插入操作 **找插入位置** 從小到大順序 在連結串列中去找到

根據ID查詢資料庫資料處理欄位為null的資料

        /// <summary>        /// 根據ID查詢資料給模型        /// </summary>        /// <param name="id"></param>        ///

Matlab之Kalman:用線性系統狀態方程通過系統輸入輸出觀測資料系統狀態進行最優估計的演算法

       卡爾曼濾波(Kalman filtering)一種利用線性系統狀態方程,通過系統輸入輸出觀測資料,對系統狀態進行最優估計的演算法。由於觀測資料中包括系統中的噪聲和干擾的影響,所以最優估計也

ajax返回json資料其中日期的解析

JS 對其格式化 方法如下 function ChangeDateFormat(d){ //將時間戳轉為int型別,構造Date型別 var date = new Date(parse

Python 造資料拍利器

0.簡介: 在Python環境下,利用random,或洛谷研發的Cyaron都是不錯的選擇。 如果要使用Cyaron 請參見 1.環境配置: 安裝Python3及以上版本,在安裝時選擇自定義,勾選自動設定環境變數選項。當然能自己搞%%

Pma模塊詳解用戶登錄linux等進行限制密碼修改限制等

ble link 標準 下一個 過程 並不是 改密 blank 登入 PAM詳細介紹 2014-04-02 09:26:41 標簽:PAM 原創作品,允許轉載,轉載時請務必以超鏈接形式標明文章 原始出處 、作者信息和本聲明。否則將追究法律責任。http://lide

遞歸函數二分查找面相象初識類空間象空間組合繼承

二分查找 tar %s anim style nim index 訪問類 AI 一、遞歸函數 一般遞歸100多次,都沒有解決的問題,放棄遞歸。 默認遞歸深度:998 修改默認遞歸次數 import sys sys.setrecursionlimit(100000)

記錄一個python裏面很神奇的操作一個包含列表的元組進行增量賦值成功賦值但還報錯

png code error peer 列表 mage pictures 但是 stack 記錄一個python裏面很神奇的操作 今天記錄一個很神奇的操作。關於序列的增量賦值。如果你很熟悉增量賦值,你也不妨看下去,我想說的是有關於增量賦值和元組之間一種神奇的操作。來自 《流

當兩條分支同一個檔案的同一個文字塊進行不同的修改並試圖合併時Git不能自動合併的

當兩條分支對同一個檔案的同一個文字塊進行了不同的修改,並試圖合併時,Git不能自動合併的,稱之為衝突(conflict)。解決衝突需要人工處理。   那麼讓我來帶領大家解讀下上面截圖中馬蜂窩出現的bug事故分析:   <<<<<<

vue專案中使用Echarts 動態更改圖表資料 Vue 折線圖柱狀圖等圖表動態重新整理

問題:在vue元件中,用echarts外掛 動態獲取、修改圖表資料 解決:已解決! 第一步:開啟cmd命令視窗 安裝echarts依賴 安裝:npm install echarts -S 第二步:在main.js中全域性引入   //引入echarts的圖表外掛

phpexcel根據傳來的欄位生成不同的列名傳多則多傳少則少

$select_field = I('select_field'); if($select_field){ $indexKey = explode(',',$select_field); }else{

sklearn kMeans 分類實戰滬深300的每日漲跌進行分類

# ohlc_clustering.py import copy import datetime import pymysql import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import

使用if語句在mocha jwebdriver的加入判斷邏輯分支實現根據元素狀態是否存在進入不同的分支邏輯

let driver, testVars, exiserror = "first"; before(function(){ let self = this; driver = self.driver; testVars = self.te

[Java原始碼]鍵盤輸入會員卡號其格式位數進行判斷不符合規則會跳轉重新輸入

4位數的會員卡號,活動期間,4位數字求平均值為5,則商品免費 -----------------------背景-------------------------------分割線--------------------------------------------------- 下面一段

Mysql 一條SQL語句實現批量更新資料update結合casewhen和then的使用案例

如何用一條sql語句實現批量更新?mysql並沒有提供直接的方法來實現批量更新,但是可以用點小技巧來實現。 複製程式碼 程式碼如下: UPDATE mytable SET myfield = CASE id WHEN 1 THEN

記錄一個python裡面很神奇的操作一個包含列表的元組進行增量賦值成功賦值但還報錯

記錄一個python裡面很神奇的操作 今天記錄一個很神奇的操作。關於序列的增量賦值。如果你很熟悉增量賦值,你也不妨看下去,我想說的是有關於增量賦值和元組之間一種神奇的操作。來自 《流暢的Python》 一書,讓我們更加深入地瞭解裡面的原理 神奇的操作

如何網課遊戲直播等進行錄屏

9.png mage images 一場 pow 攝像頭 sof head 進入 現在網絡直播、網課、遊戲直播越來越流行,但當要對一節網課或一場遊戲直播反復觀看時,該怎麽辦?下面就教大家如何進行錄屏~ 工具/原料 電腦 APOWERSOFT 方法/步驟 1、百度