“地球大資料共享服務平臺” 已向全球開放三大系統 共享5PB資料
中國科學院昨日(1月15日)在北京正式釋出了A類戰略性先導科技專項“地球大資料科學工程”2018年度成果——地球大資料共享服務平臺,向全球公開了平臺的兩大核心繫統——資料共享服務系統和CASEarth“資料銀行”(Databank)系統,及一個區域系統——數字絲路地球大資料系統。
中科院副院長張亞平表示,科學資料的積累、開放、共享,已經成為世界科技發展的重要資源和推動力,中科院作為國家戰略科技力量,高度重視科學資料共享在科研和資訊化建設中的創新與應用。中科院設立“地球大資料科學工程”先導專項,將力求突破超大規模跨學科、跨領域、分散式資源技術瓶頸問題,建科學資料共享及其機制體制建設與實施的新模式,只要有終端和網際網路,任何人在任何地點都可以享受到地球大資料提供的多樣化便捷服務。
張亞平說,此次釋出的三項成果是地球大資料專項資料共享工作邁出的第一步,也是堅實的一步。未來,地球大資料共享服務平臺全面建成後,將有力地推動中科院乃至國家層面地球大資料實現從被動共享到主動共享的轉變,從專案資源驅動到平臺與服務驅動的轉變。
地球大資料共享服務平臺是整合多領域海量資料,服務資料驅動的科學發現與決策支援的科學平臺。該平臺以共享方式為全球使用者提供系統、多元、動態、連續並具有全球唯一標識規範化的地球大資料,通過建立資料、計算與服務為一體的資料共享系統,推動形成地球科學資料共享新模式。
目前,平臺共享資料總量約5PB,其中對地觀測資料1.8PB,生物生態資料2.6PB,大氣海洋資料0.4PB,基礎地理資料及地面觀測資料0.2PB;地層學與古生物資料庫 49萬條資料記錄、中國生物物種名錄360萬條、微生物資源資料庫42萬條、組學資料目前線上10億條。截至記者發稿日,使用者能夠線上檢索到40%資料,隨著硬體條件不斷完善,平臺數據將陸續上線,並且每年將以3PB的資料量進行更新。
專項負責人、中科院院士郭華東指出,科學資料開放共享意義重大,地球大資料專項通過整合中科院資源環境生物生態等領域基礎資料和科研成果,構建基於地球大資料的資訊共享平臺,將為驅動原創性科學發現和促進國家經濟社會發展提供技術支撐和決策依據。
資料共享服務系統是地球大資料專項資料資源釋出及共享服務的門戶視窗,可提供專案分類、關鍵詞檢索、標籤雲過濾、資料關聯推薦等多種資料發現模式,同時提供線上下載、應用程式程式設計介面訪問等多種資料獲取模式,支援可定製的多格式資料線上檢視、預覽和查詢,並能夠應對各種個性化需求,進行統計、收藏、推薦、下載和評價服務。
CASEarth Databank系統提供長時序的多源對地觀測資料即得即用產品集,包括1986年中國遙感衛星地面站建設以來20萬景、共計240萬個產品的長時序陸地衛星資料產品等。該系統自主研發了高效的對地觀測資料引擎,面向一般使用者、行業使用者和科學家使用者,提供不同層次的資料分析與資訊挖掘服務。中科院空天資訊研究院研究員何國金透露,未來使用者還可以上載多源資料,完成特定的專題資訊挖掘、知識發現和融合決策。
數字絲路地球大資料系統了包括“一帶一路”區域資源、環境、氣候、災害、遺產等專題資料集94套、自主智慧財產權資料產品57類、共享資料超過120萬億位元組。目前已具備千萬億位元組級的軟硬體環境,在國際上率先研發了通用大資料平臺下地球大資料提取、轉換與載入工具集,實現了6大類資料的檢索、共享、產品視覺化展現,並通過中、英、法等多語言版本在國際相關單位實施共享。
據瞭解,中科院“地球大資料科學工程”先導專項於2018年1月1日啟動實施,執行期5年,由中科院空天資訊研究院牽頭,致力於構建包含資源、環境、生物、生態等多個領域的大資料與雲服務共享平臺,最終目標是建成國際地球大資料科學中心。