1. 程式人生 > >OpenStack柏林峰會,這些關於HPC、GPU、AI的演講不容錯過

OpenStack柏林峰會,這些關於HPC、GPU、AI的演講不容錯過

11月,OpenStack峰會將在柏林召開,其中200多個由用例組成的會議涵蓋:人工智慧和機器學習、高效能運算、邊緣計算、網路功能虛擬化、容器基礎設施以及公有/私有和多雲戰略。

在這裡,重點介紹一些關於HPC、GPU和AI的會議。

The AI Thunderdome:Using OpenStack to accelerate AI training with Sahara,Spark and SwiftRed Hat的Sean Pryor說,OpenStack非常適合大資料問題。他將談論如何使用Swift和Ceph,資料儲存比以往更容易。大資料領域中最重要的問題之一是使用AI來理解不斷增加的資料量。OpenStack使這成為一個可解決的問題:儲存在Swift中的資料可以由Sahara叢集訪問,該叢集可以使用GPU例項來加速並行AI引數調優。

這種能力允許使用者只需一小部分手動工作就可以完成大型AI的訓練——這不就是雲的全部內容嗎?

NASA Goddard Private Cloud: Genesis and lessons learned2016年秋季,美國宇航局戈達德的NASA氣候模擬中心(NCCS)和資訊科技與通訊局(ITCD)開始合作,使用從NCCS的傳統HPC叢集Discover回收的硬體為整個Goddard社群提供內部私有云。2018年10月,GPC正在按計劃生產就緒(執行Queens),但是在Mitaka的原型環境中有超過30個專案(並且還在增加!)。

來自美國宇航局的Mike Moore將描述所遇到的挑戰以及在此過程中設計的創新解決方案,包括:遙測/計費、資料保護/災難恢復、安全性、“雲化”工作負載、容器以及指導HPC使用者轉向雲端計算。

Monitoring-as-a-Service in HPC Cloud當應用程式遷移到雲時,第一步是在軟體定義的基礎設施上重新建立相同的平臺。這並不符合雲的真正潛力。一旦雲使用者意識到可用的強大API和服務,OpenStack基礎設施就可以提供更多功能。

在本次演講中,StackHPC Ltd.的Stig Telfer和Verne Global的Darryl Weaver將介紹如何將HPC雲遷移提升到新的水平。他們將展示Monasca服務的整合,以便監控和記錄以效能為中心的部署。他們將展示如何為所有使用者解鎖最佳效能遙測,以及如何為使用者和管理員提供理解和優化其應用的新機會。

Cyborg:Accelerate your cloud

隨著資料中心工作負載逐漸變得越來越計算密集型,對加速器的需求也越來越大。有各種各樣的加速器,包括GPU、FPGA、ASIC和工作負載特定的加速器,如TPU。OpenStack中的Cyborg專案旨在簡化這些不同加速器型別的採用和生命週期管理。

英特爾的Sundar Nadathur稱,Cyborg和Nova開發者已經建立了一個架構,可以解除安裝到各種加速器。該架構包括FPGA,它對程式設計和位元流管理有獨特的需求。這個演講將介紹一般的解除安裝到器件的用例、FPGA的程式設計模型以及Placement中器件(包括FPGA)的表示。Nadathur將密切關注需要加速器的例項的排程。他將詳細介紹os-acc的架構——這是用於Nova與Cyborg互動的庫。最後將介紹Cyborg開發的現狀。

原文連結:

http://superuser.openstack.org/articles/inside-hpc-gpu-ai-must-see-sessions-at-the-berlin-summit/

內容覆蓋主流開源領域

640?wx_fmt=png640?wx_fmt=png640?wx_fmt=jpeg640?wx_fmt=jpeg640?wx_fmt=jpeg640?wx_fmt=jpeg640?wx_fmt=gif

投稿郵箱

[email protected]

640?wx_fmt=gif

640?wx_fmt=jpeg