1. 程式人生 > >航空航天空氣動力學高效能運算解決方案

航空航天空氣動力學高效能運算解決方案

科百華公司作為國內頂尖的高效能運算系統供應商,多年來致力於為我國航空航天界提供優秀的高效能運算解決方案,推動國內空氣動力學數值模擬研究的發展。

1.概述

傳統的飛行器氣動佈局設計主要依賴理論研究估算、設計師的經驗以及大量的風洞試驗結果,風洞試驗是主要設計工具。計算機技術的迅猛發展推動了航空空氣動力學的革命。目前正在大力發展的計算流體力學將以突破對黏流流場物理現象的模擬能力為重點,尤其是精確預測流動分離點和轉捩過程以及湍流流動。

1.1.國外發展概況

美國

美國在空氣動力學研究與發展領域一直處於世界領先地位,在探索新概念飛行器、航空新技術、新研究和試驗方法上也具有明顯優勢。美國對空氣動力學技術的投資堪稱世界第一,為促進氣動技術的發展,先後建造了一大批用於各類飛行器研製的氣動力地面試驗設施,現有高、低速搭配、尺寸配套的科研生產型風洞70多座。

長期以來,美國充分利用其處於世界先進水平的計算機軟硬體技術優勢,大力開展計算流體力學(CFD)技術研究,投資建立數值模擬中心,推廣CFD技術的工程應用。特別是航空、航天飛行器的氣動設計中,採用先進的CFD技術使設計週期和成本大幅度降低,設計質量迅速提高,飛機氣動效能不斷改進。

歐洲

總體上講,歐洲,主要是德國、法國和英國在空氣動力學發展研究方面稍遜於美國。由於經濟原因,在高超聲速飛行器研究上,歐洲明顯落後於美國,但歐洲的氣動試驗設施在某些方面比美國先進,比如歐洲的跨聲速風洞,其試驗能力和試驗效率明顯高於美國現有的風洞。

英國航空航天界人士認為,目前空氣動力學已達到非常先進的階段,但還不成熟,業界未來的目標應該在於開發未來先進的、快速的和適用的方法,用於設計可顯著改善氣動效率和降低成本的機翼,為應用行業帶來顯著的效益。CFD方法的研究進展在其中應保持優先性,其研究的方向仍然是繼續提高計算精度和應用能力,特別是在粘黏性和非定常流的模擬計算上。

俄羅斯

作為世界航空航天大國,俄羅斯在空氣動力學的理論研究和試驗能力方面一直與美國並駕齊驅,特別是在基礎理論研究方面具有一定優勢,但在計算流體力學方面進展落後於美國。從美國與俄羅斯以及西歐與俄羅斯在氣動技術研究發展方面的合作專案上可看出,俄羅斯主要提供新的設計思想和理論方法,而相應的試驗和計算軟體開發一般由美國或西歐承擔。

中國

新中國自建立以來,一直把發展航天航空技術放在作為國家戰略高度,在老一輩空氣動力學專家的帶領下,中國在過去幾十年的時間裡,在空氣動力學方面的研究已經取得了重大的研究成果,並直接使我國躋身航天航空大國之列。目前中國航天航空研發機構主要包括三個部分:

航天科技集團和航天科工集團下屬各研究院,如航天一院、二院、三院、十一院等,其研究涉及飛行器設計、洲際導彈、載人航天等多個方面,是我國航天航空研究的主力軍。

其次就是國防科工委下屬的各個重點高等院校,包括北京航空航天大學、西北工業大學、哈爾濱工業大學等,此外,清華大學、上海交通大學等國內知名高校也紛紛開設了航天航空氣動力學專業。

我國軍用、民用飛機設計的主力軍無疑是國內幾大飛機設計院:西飛、成飛、沈飛等,並且在我國已經形成了陝西閻良、四川成都、遼寧瀋陽、等幾個航空研發基地,近年來已經開發出飛豹、殲10、空中加油機、支線飛機等高新技術產品,並在積極努力開發中國自主智慧財產權的大飛機設計。

1.2.CFD方法發展與挑戰

隨著CFD技術的迅猛發展及其在軍、民飛行器氣動力設計中的廣泛應用,預測給定外形繞流的無粘CFD流場技術已非常成熟併成功應用於先進戰鬥機的全機模擬中。一個典型的例子是,美國的F-22飛機在試飛時出現垂尾抖振現象,風洞試驗研究未能準確確定其產生的根源,而CFD卻準確預測出這是由於進氣道產生的第二個分離渦拖出後掃到了垂尾造成的抖振,進而使設計人員能據此採取相應措施予以解決。

CFD演算法在1970~1985年期間發展迅速,之後發展相對平緩,特別是工程應用進展比較緩慢,僅僅是在提高計算解的速度上有了一定改進。改善CFD演算法不僅要求提高計算速度還需要增加計算精度,從CFD發展歷史看,改善計算精度往往是以成倍增加計算時間為代價的。因此,必須均衡發展,提高計算精度而不增加時間是未來CFD演算法的挑戰。

CFD發展的最終目的是不用進行昂貴的地面試驗和飛行試驗就能驗證新的技術或新的飛機概念,能夠成為設計師在經濟可承受性範圍內精確預測氣動力、力矩和載荷的可靠工具。達到這一能力的主要障礙是對黏流流場物理現象的模擬能力,尤其是精確預測流動分離點和轉捩過程以及湍流流動。

隨著CFD在空氣動力設計中越來越重要的工具作用,出現了對風洞試驗不正確的認識,甚至有人認為,未來在氣動設計中CFD可以取代風洞試驗。但事實證明這種認識是錯誤的。

調查表明,在CFD應用於飛機設計前,隨著新型號飛機複雜程度的增加,需求的風洞試驗小時數增長很快,有了CFD後增長率趨於平緩,但仍不可能少於10000小時,而且對於高度複雜的先進軍用飛機來說,需要的風洞試驗小時數將更為可觀。

例如,美國在發展第四代先進戰鬥機F-22過程中,在1991年到1996年5年間,利用23種模型在15座不同型別的風洞進行了75項試驗,累積17689小時。此外在原型機YF-22的演示/驗證階段進行了19195小時的氣動佈局風洞試驗,在預先演示/驗證階段還進行了7005小時的風洞,合計共進行了43889小時的風洞試驗。

風洞試驗不可或缺的關鍵原因是由於現代飛機涉及多學科的綜合,一些複雜的干擾現象根本無法用CFD來模擬,所以CFD難以取代風洞的作用,但對於衍生型飛機設計,CFD則可以顯著降低風洞試驗小時。

2.方案

曙光公司作為國內頂尖的高效能運算系統供應商,多年來致力於為我國航空航天界提供優秀的高效能運算解決方案,推動國內空氣動力學數值模擬研究的發展,曙光高效能運算機在載人航天、衛星測控、天文觀測、導彈研發、航空發動機設計、軍用民用飛機設計等航空航天領域大量應用,為國家天文臺、紫金山天文臺、北京衛星控制指揮中心、酒泉衛星發射中心、西安衛星發射中心等提供專業服務。曙光超級計算機參與了“神舟五號”、“神舟六號”載人飛船從發射到回收的全過程,在目標軌道計算、空間碎片定軌計算、控制飛船入軌、發射氣象氣候監測、飛船發射視窗分析等方面發揮重要作用。

目前曙光公司的高效能運算解決方案包括天潮4000A、天潮4000L和天潮4000W,它們都採用叢集架構。毫無疑問,叢集技術極大的推動了高效能運算的發展,從2002年開始,無論是叢集的數量還是叢集的銷售額都獲得了快速增長,目前已經成為了高效能運算的主流體系結構,在國內TOP100中佔有90%以上的分額。然而叢集的發展正面臨著越來越多的挑戰,據IDC的一份統計報告指出,集群系統的東電和散熱已經成為制約其發展的首要問題,其次是系統可管理能力。不斷增長的計算需求使得高效能集群系統的佔地面積和功耗越來越大,以上海超算為例,500多個計算節點佔地面積達到一個籃球場大小,每年的電費也高達幾百萬元。實際上,國內大多數使用者正在面臨著買的起使用者不起的尷尬局面。

2007年5月份,曙光公司轉為百萬億次高效能運算機曙光5000研發的核心節點機系統TC2600刀片伺服器正式釋出,以TC2600為核心,結合曙光4000系列叢集技術的成為最符合“高效能計算”思想的解決方案。

2.1曙光TC2600刀片引領“高效能計算”

隨著高效能運算向高效能服務轉變,超級計算機系統追求的目標也將從“高效能”(High Performance)走向“高效能”(High Productivity)。即超級計算機的研發重視系統的實際效率,可靠性、可用性、好用性,努力提高單位面積的效能,降低單位面積的功耗和造價;更加重視高階計算的總體擁有成本(應用系統生命週期內的成本+擁有/獲得成本);愈來愈複雜的高端系統需要自動化、人性化的環境支撐(系統的自管理、自配置、自優化和自愈性等)。曙光刀鋒伺服器正是基於這一理念進行設計的。

2.1.1優異的系統平衡架構設計

TC2600刀片服務設計之初,充分分析了機架式機群系統以及市場十幾款廠家的刀鋒伺服器產品,對其架構的優缺點進行分析,進行了詳細的功率計算,對CPU、硬碟記憶體發展趨勢進行分析,對目前主流高速互連技術進行分析,採用7U10片的系統架構,同時保證計算密度同系統I/O頻寬、散熱能力等方面的平衡設計。

在背板頻寬和延遲方面,是刀鋒伺服器效能瓶頸。而在曙光刀鋒伺服器系統中,整個刀片背板總頻寬為950Gb,訊號延遲為納秒級,大大提高了計算系統頻寬並降低延遲,很好的實現了計算能力同I/O能力的平衡問題。同時,創新的把PCI-E匯流排引入背板。因為背板訊號為PCI-E,在背板的後端,可以根據系統需要靈活的設計各種高速交換裝置,比如InfiniBand交換、Myrinet交換、ASIC交換、FC交換等。

處理器計算能力上,目前推出的產品對每個刀片支援兩個雙核或四核心AMD Opteron處理器,在每個機櫃內可以實現最多80個處理器核心的計算能力,浮點峰值計算能力最高可以達到8000億次每秒/刀片機箱(採用2.5GHz主頻的四核Barcalona處理器)!

2.1.2節能設計提高能耗比

為降低功耗,曙光刀鋒伺服器採用先進的多渠道節能技術,主要體現在3個層面:

根據實時功耗確定工作電源個數,使電源工作在最佳效率曲線上。

結合AMD領先的“PowerNow”技術修改計算刀片作業系統核心,實現節能。

專用散熱通道和自適應的風扇設計降低散熱能耗需求,保證系統散熱和計算密度達到平衡。

2.1.3高效能的Infiniband模組設計

曙光TC2600刀片主要面向大規模叢集計算市場,除了內嵌的千兆交換機模組和PassThrough模組外,還可以提供對20G高速Infiniband網路的支援。曙光IB模組和IBM、HP等公司的做法不同,在該模組內集成了10個HCA卡晶片和1塊24口交換機晶片,無須為每個刀片再配置HCA子卡,整合度更高,由於全部自主設計,較傳統的利用HCA子卡+外接交換機的方式具有更低的成本。

2.1.4創新的IOE擴充套件模組

I/O擴充套件能力一直以來都是刀鋒伺服器的一大詬病,刀鋒伺服器產品在需要擴充套件其它外掛的時候,一般都藉助於主機板子卡的擴充套件形式,而且只能進行單一功能的擴充套件。曙光TC2600創新性的I/O擴充套件模組打破了一直以來刀鋒伺服器I/O擴充套件方式的限制。TC2600為每個刀片獨立配置了PCI-E擴充套件插槽,能夠相容網絡卡、FC HBA、iSCSI HBA、Infiniband HCA等業界絕大部分PCI-E板卡,為刀鋒伺服器系統的I/O擴充套件提供了更為靈活的選擇。

2.2方案選擇

曙光TC2600刀鋒伺服器單機櫃內典型配置可以支援80個平行計算核心和80GB記憶體,可以支援最多8000萬網格單元的空氣動力學CFD模擬(顯式求解或分離求解)。以Fluent軟體為例,下表給出了不同計算模式下計算模型對系統硬體資源主要是記憶體的需求:

在系統記憶體能夠容納計算模型的前提下,處理器的數量和效能影響到計算的快慢,如某計算模型耗用的記憶體為16GB,可以用1個16GB記憶體的雙路節點計算,也可以用2個8GB記憶體的雙路節點或4個4GB記憶體的雙路節點,多數情況下計算速度會隨著節點數量的增加而大幅度提高。如下圖所示,Fluent在TC2600刀鋒伺服器上有著很好的加速比。對於Fll1,從4-16CPU加速比達到線速;對於Fll2和Fll3,由於題目規模較大,從4-32CPU都保持線速(其中Fll3需要4GB以上記憶體,無法執行在1個節點上)。因此,應該從記憶體和處理器兩個層面來綜合考慮一個計算模型應該選用哪種規模的硬體配置。

我們以大、中、小三種規模準備了3套基於TC2600刀鋒伺服器的叢集方案供使用者選擇:

3.結論

CFD高效能運算技術正在成為航空航天飛行器空氣動力學設計過程中除風洞試驗以外最重要的方法,曙光公司在高效能運算領域的深厚積累能夠為使用者提供多種規模的集群系統解決方案。最新推出的TC2600刀片集群系統具有高效能、高可靠性、低能耗和低佔地面積的優勢、是符合“高效能計算”思想的最佳解決方案。