YVR18資料關注點2:HPC相關進展
Linaro的HPC實驗室籌劃了有相當長的時間了,這次第一次看到有實物介紹出來(116)。網路上包含兩個1G的子網,用於外部接入(uplink)和BMC訪問(bmc),以及兩個100G子網,用於Lustre檔案系統(fs)和InfiniBand(mpi)。
軟體棧使用CentOS(未來可以擴充套件到OpenSuse),Warewulf(叢集管理)和Slurm(Workload管理)。
投入的客戶硬體包括華為和高通的伺服器,InfiniBand都使用Mellanox的ConnectX上的板卡(而不是SoC上自帶的RoCE功能),軟體使用OFED。
檔案系統使用Lustre,據說過程比較痛苦,因為Mellanox的部分驅動不是開源的,每個有這種商業公司介入的領域,都只能一個個單獨合作,不太適合作為合作的中心。RoCE如此,GPU也是如此。OPTEE其實也是一樣的,給我的感覺,這個東西用於實用,不如說定義了一個非安全軟體(比如Linux)和安全軟體之間進行通訊的介面定義。
203介紹了一下LLVM的進展,聚焦在指令排程上,不做編譯器的估計不會太關心。
todo:其他的待補