re:Invent 2018:Amazon首次展示Inferentia定製機器學習預測晶片
至頂網軟體頻道訊息: 今天 AWS推出了一款專為機器學習設計的新處理器晶片,這也是Amazon在雲端計算領域雄心勃勃的另一個標誌。
這款名為Inferentia的晶片將通過AWS EC2計算服務、SageMaker AI服務和 (今天公佈的新服務) Amazon Elastic Inference提供,旨在加速由機器學習模型執行的推理或預測過程, 為 Amazon Alexa和自動駕駛汽車等服務提供動力。
Inferentia 晶片是由 Amazon幾年前成立的晶片設計公司Annapurna Labs設計,據稱它與GPU(主要來自於Nvidia公司,一直是機器學習的首選晶片)相比具有低延遲和低成本等優點。
預計Inferentia晶片 將於明年上市。 AWS執行長Andy Jassy在今天上午的re:Invent大會 主題演講中簡要介紹了 Inferentia晶片,但他給出的設計或者規格細節很少,只是說Inferentia晶片支援多種資料型別和所有主流 框架,如 PyTorch和TensorFlow和MXNet。此外它還將提供 數百的 TOPS效能,聚合起來可以實現上千的TOPS效能。
Inferentia 晶片是本週以來 AWS宣佈推出第二款晶片。週一晚上,AWS 宣佈推出名為 Graviton的處理器,該處理器可通過AWS EC2雲端計算服務提供給雲客戶。Graviton是基於智慧手機、 網路路由器和各種其他裝置中使用的 Arm架構,並將逐漸用於計算機伺服器中 ,例如 AWS設計用於海量資料中心的計算機伺服器。
Moor Insights&Strategy總裁兼首席分析師Patrick Moorhead表示:“AWS宣佈將自開自己的支援多種框架的機器學習推理晶片是一個重大的訊息。 與 Google Cloud不同,這項AWS服務將廣泛應用並具有彈性。目前AWS針對推理 提供 CPU、GPU、FPGA、以及現在自己的ASIC。”
在過去幾年中我們看到,市場中出現了大量新晶片用於特定應用的優化,特別是機器學習和人工智慧。例如,Google提供對自定義Tensor處理單元晶片的雲訪問。晶片設計興起的一個原因是,所謂的超大規模資料中心企業需要對他們的硬體進行儘可能多的效率優化。
所有這些都讓資料中心領導者英特爾處於了守勢。英特爾收購了Altera和Movidius等多家公司,為其核心X86產品線增加了新的晶片設計和專業技術。此外英特爾 還調整了 X86晶片(如目前的至強產品線),以更好地應對機器學習和其他任務。
Amazon還發布了Elastic Inference,這是一項 由 GPU提供支援的深度學習推理加速服務。Jassy表示,這項服務僅根據需要 提供儘可能多的 AWS計算例項,可以節省高達75%的推理成本。
此外,AWS推出了一系列與人工智慧相關的服務和產品,包括自主模型汽車Deep Racer,開發者可用來研究強化學習,預訂價為249美元。