無處不在的資料是否讓儲存瀕臨崩潰邊緣?
企業正被資料洪流所淹沒。而供應商和評論家也在不斷提醒企業這一事實。但實際情況卻並非如此。
談論資料的海量規模、多樣性和急劇增長已是司空見慣,專家每次都會反覆地對企業所產生的龐大資料做出聳人聽聞的預測。而他們給出的建議是,如果不採取根本性的措施,那麼用於儲存和保護所有這些資料的系統會瀕臨崩潰邊緣。
本文卻有不同看法。在這篇文章中,我們不僅將資料洪流視為一個儲存問題,還將它視為一次資料優化的機遇。之後,我們將重點談論英特爾® 傲騰™技術,這項技術在充分利用資料優化機遇方面將發揮重大作用。英特爾® 傲騰™技術是 20 世紀 70 年代以來首個真正意義上的新記憶體技術(DRAM 起源於 1966 年,是 20 世紀 70 年代早期的固態盤的前身)。這項技術可作為現代企業資料策略的一部分,從根本上改變企業資料效能及與此相關的開銷。
對企業資料策略的迫切需求
企業資料儲存確實面臨諸多挑戰。其中不僅包括數量(volume)、多樣性(variety)和速度(velocity)方面的挑戰。還包含其他同等重要的難題,這些問題綜合起來,導致企業迫切需要構建全面的企業資料策略。
除了“三個 V”之外,IT 組織還面臨著巨大壓力,必須以不同於以往的方式使資料變得更有用。隨著資料分析和人工智慧(AI)應用對業務的重要性與日俱增,這意味著資料必須是可訪問和可查詢的,且通常要近乎實時的,但當今的儲存架構在設計時情況並非如此。高效能運算(HPC)應用需要將龐大的資料集儲存在記憶體中,或者儲存在效能儘可能接近記憶體的儲存裝置中。實時的流傳輸應用(例如,金融服務領域中的應用)需要採集資料,並將資料儲存在非常靠近計算節點的超快速儲存裝置中。上述這些需求會直接影響某些資料層的識別和儲存方式。
隨著企業需要使用更多資料來做更多更重要的事情,儲存的資料也開始分佈在不同位置上。物聯網(IoT)應用,無論是自動駕駛汽車、智慧城市還是智慧零售,都需要在接近資料生成地點的位置儲存和處理資料。從某種程度上講,資料中心正在分解,並且一些類似資料中心的技術出現在了網路邊緣,所有這些都需要採集、儲存和分析資料。
最後,我們要面對成本挑戰。儲存的總體擁有成本(TCO)一如既往地重要,但是成本計算難度卻在不斷增加。這個成本不僅僅是指在類似保險庫的冷儲存中儲存和保護資料的成本,還涉及在需要時訪問和分析資料所產生的操作成本。基準測試需要體現不斷變化的實際工作負載,而不是簡化的理想狀態。因此,綜合起來,這些因素決定了企業需要一種全面的方法實現現代企業資料策略。
構建企業資料策略
IT 必須建立一個智慧資料策略,這個策略不僅要有效地安全儲存資料,而且還要預先定位資料以供應用實時使用或日後使用。瞭解應用和位置要求(訪問速度和連續性,靠近計算節點的位置等)實際上意味著,要了解資料策略所須支援的業務流程和應用。除了資料洪流外,其他老生常談的 IT 言論為“IT 必須更接近業務”。
這一言論在資料策略方面尤為貼切。在瞭解了圍繞資料分析或人工智慧構建且有利於實現競爭優勢的應用,並對這些應用可能移向網路邊緣的方式有所瞭解後,IT 能構建一個直接決定企業成敗的資料策略。
英特爾認為,一個成功的現代資料策略應該是軟體定義的策略,以應用要求為基礎,並能實現智慧分層。本文將重點關注資料分層,以及英特爾® 傲騰™技術在這當中發揮的作用。適用於資料分層的戰略性方法如下:
• 瞭解當前的應用資料要求:資料和使用資料的應用之間有怎樣的關係?如何使用資料?對於延遲和可用性有哪些要求?誰需要訪問資料,以哪種方式訪問?哪些應用是業務關鍵型應用?
• 規劃未來資料要求:哪些未來應用會產生具有挑戰性的資料要求(效能、位置或成本)?長期業務計劃對資料要求的影響有哪些?
• 建立資料層次結構:資料無處不在,既存在於企業內部,也存在於企業外部。大多數應用策略需要各類資料。務必瞭解各種結構化資料庫和非結構化資料庫之間的關係。資料建模可為整個企業提供層次結構,並且通常是資料分析策略執行過程中確保成功的一個重要因素。
• 考慮企業層面的影響因素:由業務目標驅動的資料策略需要應對影響儲存環境和資料分析策略的各種因素。其中包括資料可用性、資料隱私、資料保留、合規性(企業需要遵守的資料相關法規)、資料搜尋和資料清潔度。
在這個流程的結尾,企業應該建立一張關於當前和未來資料層次結構的 3D 圖,並且能夠開始對層次結構進行分層。大多數 IT 部門會用溫度這個概念來理解資料。“冷”資料幾乎不會被訪問,但需要安全地儲存起來。而與之相對的“熱”資料則會被頻繁、快速且安全地訪問。當然,要能夠根據應用和安全需求在各個層級之間移動資料。
許多企業將“冷”資料儲存在磁帶儲存器或雲中。“暖”資料可以放心地儲存在磁碟上。而問題就在於極暖的資料和“熱”資料的儲存。現代應用需要以更快的速度獲取越來越多的資料。因此,回到本文開頭的地方,資料洪流應該有四個向量:數量、速度、多樣性和熱度。越來越多的資料會是(或者在理想狀態下將是)熱資料。這就會給 IT 帶來實際的成本問題和技術難題,而這正是英特爾® 傲騰™技術的用武之地。
英特爾® 傲騰™技術:打破傳統的資料分層模型
傳統意義上,我們一直根據訪問需求在介質上進行資料分層和儲存,而這些介質的成本和效能正在不斷提高:
• 磁帶價格便宜,但速度慢
• 硬碟價格適中,速度適中
• 固態盤(SSD)價格較高,速度更快
• DRAM價格極昂貴,速度也極快
• 處理器快取的價格最昂貴,速度也最快(但是在大小方面有嚴格的限制)。
一些企業使用雲端儲存來儲存冷資料,因而這個模型在某種程度上已在低端中斷,但是在暖/熱資料方面,要實現成本和效能之間的平衡仍是一個棘手的問題。
英特爾® 傲騰™技術是一項全新技術,儘管它的速度沒有 DRAM那樣快,但也足以用作擴充套件的記憶體池,並且它的響應速度甚至比高效能 NAND 固態盤還要快。這意味著,對於許多應用而言,英特爾® 傲騰™技術可以提高媲美記憶體的效能,從而為暖資料或熱資料提供一個更高效能的解決方案,這個解決方案在效能方面優於磁碟,在價格方面低於 DRAM。

圖 1.英特爾® 傲騰™ 技術為儲存基礎設施引入全新的儲存層
實際上,英特爾® 傲騰™技術將記憶體和儲存的特性與低延遲、高耐久性、高服務質量和高吞吐量結合在一起。它建立了一個新的資料層,並且對於在當今企業環境下能夠提升競爭優勢的以下應用尤為有用:高階分析、人工智慧和高效能運算。
在現今的架構中,儲存和記憶體之間的界限變得很模糊,這意味著會加快實現快速儲存並擴充套件快取。英特爾® 傲騰™技術增加了每臺伺服器的規模,並降低了事務處理成本。通過與最新的英特爾® 至強® 可擴充套件處理器結合使用,英特爾®傲騰™固態盤支援部署更大且更經濟實惠的資料集,以便通過更大的記憶體池獲得新洞察。
將英特爾® 傲騰™固態盤用作快速儲存或快取裝置後,許多應用將從中受益。這些固態盤提供了實現新的更高效能快取或層級所需的效能,並且用作直連儲存時,能夠為最嚴苛的應用或服務提供極低的延遲。在這些應用中,英特爾® 傲騰™固態盤將大幅提高效能、打破儲存瓶頸、增強工作負載擴充套件能力,並降低總部署成本。與DRAM 相比,能夠使用更大容量和更低成本的裝置讓企業有可能通過替換部分DRAM 組來節省成本;或者通過增加DRAM 來發展成為更大的記憶體池,從規模和複雜性日益增長的資料集中獲取新的洞察。

圖 2.英特爾® 傲騰™ 技術支援實現更快的儲存和快取,並幫助擴充套件記憶體
英特爾® 3D XPoint™技術 - 英特爾® 傲騰™技術的核心
英特爾® 傲騰™技術的核心是英特爾® 3DXPoint™技術(發音為 cross point),該技術以材料科學的巨大進步為基礎,採用了全新的記憶體方法。
英特爾® 3D XPoint™技術將材料的亞微觀層切分為多個列,每列包含一個記憶體單元和一個選擇器。它使用垂直線纜連線各個列,並採用了創新的交叉點結構,可以通過在頂部和底部各選擇一根線纜來單獨定址記憶體單元。可以從三個維度堆疊這些記憶體網格,以提高儲存密度。DRAM 需要為每個記憶體單元使用一個電晶體,因而在大小和成本方面產生了不良影響;而與之不同的是,每個英特爾® 3D XPoint™記憶體單元可以通過改變線纜中的電壓來實現輕鬆寫入或讀取,完全不需要電晶體。
記憶體單元會保持持久狀態,這意味著它們即便被斷電,也會保留它們自己的值。這些功能共同提供了快速、密集和非易失特性,使英特爾® 傲騰™技術成為模糊儲存和記憶體之間界限的完美選擇。
對於某些工作負載而言,英特爾® 傲騰™固態盤將記憶體池的大小提高了多達8 倍1,並將 DRAM 替換為至多 10:12。隨著時間的推移,英特爾® 傲騰™技術將在其他產品中提供,這將釋放生態系統的創造力,以便根據不斷髮展的應用和位置需求重塑更高要求的效能計算。
英特爾的儲存產品組合
英特爾® 儲存解決方案以基於標準的技術為基礎構建而成,它可以降低風險,並能在多個供應商或開源解決方案間靈活實施您選擇的儲存架構。
通過與英特爾® 傲騰™技術結合使用,英特爾® 3DNAND 固態盤改變了儲存基礎設施的經濟性,同時在可擴充套件性、效能和選擇靈活性之間實現了全新的平衡,可加快資料密集型應用的交付,降低延遲敏感型工作負載的事務處理成本,並降低整個資料中心的 TCO。
英特爾® 傲騰™技術的基準測試:真實的基準測試揭示了超凡的企業資料中心效能
人們通常在高佇列深度下評估儲存效能,這個佇列深度實際是指任何時候的儲存資料併發請求數。大多數 NAND 固態盤的測量值都是峰值效能,此時的佇列深度通常為 128 或更高。此外,測量 NAND 固態盤的效能時通常採用 100% 讀取或 100% 寫入工作負載。但這些都不是常見的工作負載。企業應用中的大多數典型工作負載混合了讀取和寫入,佇列深度在 8 到 12 之間。
許多企業應用,尤其是操作型資料庫、儲存快取、日誌檔案和類似的效能或任務關鍵型應用,均要求系統有良好的響應能力。這意味著通常會限制指定給任何一臺儲存裝置的工作規模。事實上,這些型別的工作負載所達到的佇列深度高於 4 到 12 之間的情況並不常見。
英特爾使用了極常見的混合工作負載(70% 的讀取和 30% 的寫入)對英特爾® 傲騰™技術進行了測試,這種混合工作負載常見於資料庫的事務處理中。我們還在儲存裝置上展示了 1 到 16 範圍內佇列深度的情況 -出色的 I/O 效能。在這種情況下,NAND 固態盤達到的效能越高越好。英特爾® 傲騰™技術可將關鍵方面的效能提高5-15 倍2。
• 對於 70/30 混合工作負載,英特爾® 傲騰™ 技術在 QD1 下實現的效能是高耐久性NAND 固態盤(P3700)所實現效能的 15 倍
• 英特爾® 傲騰™ 技術可在 QD12 下達到最大吞吐量,而大多數基於 NAND 的固態盤需要在佇列深度達到 100 或更高的情況下才能實現最高效能
• 英特爾® 傲騰™ 技術將延遲降為以前的十分之一(延遲< 10 微秒)
• 英特爾® 傲騰™ 技術將 QoS 提高了 100 倍(讀取/寫入 < 200 微秒99.999th)
• 英特爾® 傲騰™ 技術提高了讀取速度(7 微秒對比70 微秒),這得益於介質的物理特性(每個 IO 的速度提高了10 倍,因此您能夠以更快的速度實現峰值吞吐量)
英特爾® 精選解決方案(Intel® Select Solution)提供針對工作負載經過優化的配置,所包含的現代英特爾® 固態盤已經過驗證,可適用於基於英特爾® 至強® 可擴充套件處理器的平臺,並且旨在幫助加速儲存現代化舉措。當企業選擇英特爾® 精選解決方案時,他們可獲得超融合基礎設施所需的最佳效能,且無需耗費時間和精力去調優堆疊。
英特爾目前正在促進行業範圍內的協作和創新,以便為客戶提供多個解決方案,利用儲存經過優化的平臺、元件和軟體提供現今企業所需的效能和效率。
英特爾® Storage Builders 提供了一個開放的協作環境,以實現真正的儲存創新和進步。該計劃彙集了眾多具有前瞻性的公司、廣泛的英特爾生態系統、關鍵基礎技術和戰略資源,使我們的成員能夠推動儲存向前發展。
實現資料策略現代化
企業需要清楚認知自身的應用和架構需求,瞭解如何讓資料融入其中,以便應對未來的資料挑戰。之後,這些企業需要繪製一張清晰的路線圖,以實現儲存現代化,從而為他們的資料策略提供支援。
另一種選擇是抑制資料增長,但這會導致成本上升並錯失商機。現代化策略的關鍵在於資料分層,而英特爾® 傲騰™技術通過模糊記憶體和儲存之間的界限,採用全新的分層方法為實時和資料密集型應用提供支援