華為之後 亞馬遜釋出首款雲AI晶片!算力驚人 2019年面世
11月26日-30日,亞馬遜於賭城拉斯維加斯舉辦了AWS re:Invent 2018大會。作為全球最大的公有云廠商,AWS(亞馬遜雲,Amazon Web Service)每一年的re:Invent大會都會吸引來自全球的數萬名開發者和業內人士參加。
去年的re:Invent 2017大會上,亞馬遜雲一口氣釋出了22款重磅產品,而今年的好戲也逐一上演。
在前天推出首款自研ARM架構雲伺服器CPU Graviton後,亞馬遜雲CEO Andy Jassy釋出了其首款雲端AI晶片——Inferentia。
據官方介紹,Inferentia定位於一款低成本、高效能、低延遲的機器學習推理(inference)晶片,將於2019年下半年正式上市。
關於晶片的詳細引數官方公佈不多,只公佈了一些核心賣點,比如其計算力將會高達幾百TOPS,多晶片組合後算力可達數千TOPS。此外,Inferentia支援FP16、INT8精度,並支援TensorFlow、Caffe2、ONNX等流行機器學習框架。
由此,亞馬遜雲也成為谷歌、華為之後,第三家推出雲端AI晶片的雲服務廠商。
今年10月份, 華為釋出了自研雲端AI晶片“昇騰(Ascend )”系列,基於達芬奇架構,首批推出7nm的昇騰910以及12nm的昇騰310。
其中,昇騰910是目前單晶片計算密度最大的晶片,計算力遠超谷歌和英偉達。昇騰910半精度(FP16)運算能力為256TFLOPS,整數精度(INT8)512TOPS。
作為雲端計算市場的一哥,亞馬遜今年第三季度雲業務營收高達66.8億美元,同比增長46%。但在谷歌、微軟的緊逼下,其市場份額已經從2017年最高的54.1%下降到32%,壓力開始凸顯。