資料標識與資料管理國際研討會召開 用標識管理科學資料,讓科學資訊保安共享
用標識管理科學資料,讓科學資訊保安共享
(國際RDA聯盟、歐盟持久標識聯合會、瑞士國家超級計算中心、國家科技基礎條件平臺中心、國家標準化管理委員會、中國科學院辦公廳網路安全與資訊化工作處、中國ISLI註冊中心、中國科學院文獻中心、中國科學院計算機網路資訊中心等單位領導和專家學者出席“資料標識與資料管理國際研討會”)
“資料共享是實現科學資料管理的關鍵”,在本週舉辦的“資料標識和資料管理國際研討會”上,這一觀點屢被提及。
“科學資料對於科學創新越來越重要。在實現資料管理的過程中,如何推進資料公開和共享,是我們必須攻克的難關”,中國科學院計算機網路資訊中心副主任遲學斌說,希望藉由此次研討會的碰撞,探討出物聯網標識技術在資料領域應用的更多可能性,為科學資料的標識化管理和應用發展提供借鑑。
科學資料,要開放更要共享
“我想和大家分享一個好訊息”,中國科學院計算機網路資訊中心大資料部主任黎建輝介紹說,3月17日,中國出臺了《科學資料管理辦法》,將科學資料管理提到了國家的層面,這也意味著在科學資料方面將有更多的投入,包括資金和研究資源。
在《科學資料管理辦法》的鼓勵下,許多科研機構積極響應,在自建平臺公開了研究資料。但對於需要使用資料的廣大使用者而言,當需要查詢某一個數據時,如果不知道這一個資料屬於哪個機構?又應該從哪個科研機構的平臺去獲取?可見只有開放仍然是個問題。
這些公開的科學資料並沒有得到充分共享。散落在四面八方的科學資料,就像散落在各個學科分領域的拼圖碎片,當你偶然間只看到一片的時候,很難知道這片拼圖屬於什麼地方,有什麼意義。但如果把這些散落在各處的拼圖編號,並給你看到拼圖的完整畫面,就會激勵更多人有動力、有指引地將這些散落的碎片聚攏起來,黏合成拼圖。由中國科學院計算機網路資訊中心負責運營的國家物聯網標識管理公共服務平臺通過標識建立資料之間的聯絡,為知識資訊編號,併為使用者提供一個統一的查詢平臺,讓所有的科學資訊在平臺上實現共享。
再舉個例子,當你準備研究中國人的閱讀習慣變遷時,想看看關於近十年我國國民借書、買書、下載電子書的資料,可能這些資料分別屬於各級圖書館、各家出版社、各個電子書購買平臺,但如果書籍都用了統一的標識,且銷售渠道資料在標識中公開的話,只要開啟國家平臺網頁,輸入關鍵詞搜尋,就可以得到相關的資料集合,和詳細資訊來源。
為科學資料建立一個“防火牆”
(來自國際RDA聯盟的Peter Wittenburg教授(右)和來自歐盟持久標識聯合會的Ulrich Schwardmann教授就“標識如何實現資料安全”與中國科學院計算機網路資訊中心的專家進行交流)
“科學資料越用越有價值,但安全始終是前提”,中國科學院計算機網路資訊中心副研究員田野表示,在推動大資料的開放共享時,國家平臺也始終把使用者和行業資料資訊的安全放在第一位。
首先,基於標識的開放來分享資料,本身就意味著資料分享者可以自主決定哪些資訊要通過標識公開,而不公開的資料都不會在公共領域裡分享。這樣既方便公眾查詢,又可以滿足資料安全和自主開放的需求。
同時,標識能夠實現對資料資訊的分層級公開。針對國內或者行業內保密資料的共享,可以通過為一個數據分配多類標識來保障資訊的安全。例如,一條我國科學儀器採集的資料可能帶有不適合分享到國際上的資訊內容,那麼用國際的通行標準handle碼攜帶的資訊,和用國內推行的CSTR編碼的資訊的分享程度的不同來實現。而國家標識管理公共服務平臺基於異構解析技術,能夠解析這兩種編碼,並對其資訊進行解析分類,公開不同的資訊。