DDN走出HPC小眾市場大舉進入企業AI系統主流市場
HPC供應商DDN加入小型的、但不斷增長逐漸進入企業AI主流市場的公司,DDN旗下的儲存產品可與Nvidia的DGX-1 GPU伺服器結合在一起。
DDN最近出臺了一系列舉措以擴充套件旗下企業儲存公信力,上個月收購了Tintri(https://www.theregister.co.uk/2018/09/05/ddn_buys_tintri_biz_remains_for_60mn/)後有了出售企業儲存陣列的能力,現在又憑藉旗下A3I品牌的可擴充套件參考架構產品進入人工智慧(AI)系統領域。
DDN A 3 I可擴充套件參考架構
企業AI系統市場最初由Pure建立,Pure將AIRI(https://www.theregister.co.uk/2018/03/27/pure_nvidia_ai_airi/)的FlashBlade陣列與DGC-1雙響炮結合在一起。後來NetApp攜其A700全快閃記憶體陣列/ FGX-1組合加入該市場,後來又推出更快的A800/ DGX-1裝置( ofollow,noindex" target="_blank">https://www.theregister.co.uk/2018/08/03/netapp_a800_pure_airi_flashblade/ )。戴爾EMC則推出人工智慧完備解決方案(Ready Solution for AI):深度學習(https://www.theregister.co.uk/2018/08/07/dell_emc_ai_deep_learning/ ),思科也推出了C480 AI /機器學習伺服器( https://www.theregister.co.uk/2018/09/10/cisco_ai_server_nvlinked_tesla_gpu/ )。
所有這些系統都涉及到全快閃記憶體,DDN則擁有AI200和AI400全快閃記憶體系統以及混合快閃記憶體/磁碟AI7990。二者都執行DDN的Exascaler軟體,Exascaler是個基於Lustre的並行檔案系統。
AI200是個容量高達360TB的24倍雙埠NVMe快閃記憶體驅動器,置於2U機箱內,以4 x EDR InfiniBand(EDR IB)或100Gbit / s乙太網(100 GbitE)連線到DGX-1。AI200可提供高達20GB/秒的檔案系統順序讀取吞吐量和超過100萬IOPS。
AI400使用相同的機箱,可提供高達40GB/秒的順序讀取吞吐量和高達300萬IOPS。AI400具有8個EDR InfiniBand埠或100GbitE埠,快閃記憶體容量與AI200相同。
而較大的AI7990則置於4U機箱內,迴歸20Gb /秒的順序讀取效能,可提供高達700,000的IOPS。AI7990支援90 x 3.5英寸的插槽,可用於SSD和磁碟驅動器。最多可以有4個擴充套件機座,每機座有90個架,可提供高達5.6PB的容量。
DDN 的A 3 I解決方案簡介可從網上下載( https://www.ddn.com/?wpdmdl=42534&ind=1538608827207 ),簡介裡提供了使用A 3 I軟體的示例,例如Resnet-50和Resnet-152,Caffe GoogleNet,Inception V3 。
A 3 I解決方案指南( http://www.ddn.com/?wpdmdl=42573&ind=1538599065785 )提供了Tensorflow,Horovod,TensorRT,Torch,PyTorch提供具有9 x DGX-1伺服器和系統性能的AI200及其他AI框架的配置示例。
不同GPU數量的Resnet-12結果。有些供應商未提供每個GPU計數級別的值,因此圖表中的結果存在差距。
在Resnet-152和Resnet-50測試中,AI200的測試速度比競爭對手Pure、NetApp和Dell EMC的系統更快。思科未提供旗下AI系統性能的任何公開資訊。
Resnet-50結果。同樣,有些供應商未提供每個GPU計數級別的值
AI200和AI7990資料表可從此處獲取: https://www.ddn.com/products/a3i-accelerated-any-scale-ai/ 。