國內外大資料標準化現狀及發展方向
大資料標準化工作意義重大
全球已步入大資料時代,作為繼雲端計算後的新一代資訊科技,大資料技術和產業的發展和應用已經對政府、企業決策和人們的生活方式產生深遠的影響。
當前,各種大資料存產品和麵向各行業的大資料應用層出不窮,急需通過標準化的途徑規範認知,整合資源,促進各方達成共識,為我國大資料產業的健康發展打下基礎,為資料安全應用提供保障,同時促進大資料交易等新興服務模式規範發展。加強大資料標準化研製工作,對推動我國大資料產業程序,加快技術與標準的相互融合,落實大資料國家戰略具有重要意義。
自2012年起,ITU-T、ISO/IEC、CCSA等國內外標準化組織相繼開展大資料標準化工作,目前已釋出了多項大資料標準。本文從大資料標準體系框架出發,介紹了當前國內外大資料標準化領域的重點方向及取得的成果,並分析了這些方向未來的標準化發展方向。
大資料標準化體系框架
標準化工作需要科學的頂層設計,大資料標準化也不例外。制定體現大資料技術特點的、完善的標準體系框架對制定高質量、體系化的大資料標準至關重要。基於這一認識,在工信部和國標委的領導下,我國在2014年成立了全國資訊科技標準化技術委員會大資料標準工作組(以下簡稱“信標委大資料標準工作組”),統籌開展我國大資料標準化工作。該工作組結合國內外大資料標準化情況、國內大資料技術發展現狀、大資料參考架構及標準化需求,提出了我國的大資料標準體系框架。
該大資料標準體系總體上由七個類別的標準組成,分別為:基礎標準、資料標準、技術標準、平臺和工具標準、管理標準、安全和隱私標準、行業應用標準。
在大資料不同的發展階段,有著不同的標準化需求與工作重點。總的來說,在標準化的起步階段,以術語、參考架構等基礎性標準為研究重點。而隨著大資料技術的發展和應用的普及深入,其它類別的標準的重要性也不斷顯現出來,同時不同國家的標準化重點也會有不同側重。例如,隨著“中國製造2025”規劃的提出,工業大資料相關應用在我國呈現出快速發展的勢頭,相應的與工業大資料相關的標準化工作也成為行業應用標準的熱點。
當前國內外大資料標準化熱點領域
(1)基礎標準
基礎標準為整個標準體系提供包括總則、術語、參考模型等基礎性標準,是整個標準體系的基石,其重要性不言而喻。在這一領域,ISO/IEC制定了ISO/IEC 20546—《資訊科技-大資料-概覽與術語》以及ISO/IEC 20547—《資訊科技-大資料-參考架構》系列標準,參考架構系列標準包括框架與應用、用例與需求、參考架構、安全和隱私、標準化路線圖等5個分冊,作為大資料基礎性標準考慮得相當全面。而ITU-T的SG13也釋出了ITU-T Y.3600—《基於雲端計算的大資料需求與能力》,作為該研究組大資料系列標準的基礎,該標準定義了大資料生態系統中的相關角色及其活動,並規範了基於雲端計算的大資料的需求和能力。遺憾的是,ISO/IEC與ITU-T這兩大國際標準化組織並沒有像當初制定雲端計算標準時那樣聯合制定術語和參考架構這樣的基礎性標準,聯合制定的標準無疑具備更大的影響力和更高的可參考性。在國內,信標委大資料標準工作組也釋出了《資訊科技大資料 術語》和《資訊科技 大資料技術參考模型》等基礎性標準。可以說,在基礎標準方面,國內外都已取得了相當多的成果,為大資料標準工作的進一步發展打下了良好的基礎。
(2)資料標準
資料標準主要針對底層資料相關要素進行規範。包括資料資源和資料交換共享兩部分,其中資料資源包括元資料、資料元素、資料字典和資料目錄等,資料交換共享包括資料交易和資料開放共享相關標準。
大資料的核心價值在於對多個不同來源的資料進行關聯分析,因此包括資料交易、資料開放共享在內的相關標準就顯得尤為重要。只有參與方遵循共同的標準,資料的交易與開放共享才能更為高效。在這一領域,ITU-T已釋出了Y.3601—《大資料-資料交換框架與需求》,同時以此為基礎正在制定《大資料-資料溯源需求》、《大資料-資料整合概覽和功能需求》、《大資料-資料保留概覽與需求》、《大資料-元資料框架與概念模型》等一系列資料標準。而在國內,由於政務資訊開放、貴陽大資料交易所成立等事件的驅動,資料資源和資料交換共享標準成為資料標準領域的熱點,包括《資訊科技大資料開放共享》系列標準(包括總則、政府資料開放共享基本技術要求、開放程度評價、政府資源目錄體系等多個分冊)、《資訊科技資料交易服務平臺》系列標準(包括通用功能要求、交易資料描述等)在內的多個標準正在研製,未來還將研製大資料開放資料集基本要求和標識管理,資料交易的交易流程、資料管理、風險評估及交易質量評估等方面的標準。
(3)管理標準
管理標準作為資料標準的支撐體系,貫穿於資料生命週期的各個階段,主要對資料管理、運維管理和評估三個層次進行規範。
資料是企業的寶貴資產已成為業內共識,但如何對資料資產進行有效管理目前還處在非常原始的階段,業界急需資料資產管理標準對相關工作進行規範指導。ITU-T SG16在今年7月剛剛立項了一個國際標準《資料資產管理框架》,該標準主要定義了資料資產的基本概念,梳理了資料資產管理的需求,提出了資料資產管理的框架。在國內,CCSA成立了大資料技術標準推進委員會(CCSA TC601),其中的資料資產管理工作組專門從事資料資產管理方面的標準化研究工作,已釋出了《資料資產管理實踐白皮書(2.0)》,目前正在編寫3.0版本。未來TC601將繼續進行主資料、資料標準和資料質量等標準制訂,並研究資料資產管理評估的模型。
(4)安全和隱私標準
資料安全和隱私保護作為資料標準體系的重要部分,貫穿於整個資料生命週期的各個階段。
大資料安全雖仍繼承了傳統資料安全保密性、完整性和可用性等特性,但也有其特殊性,主要表現在個人隱私保護、跨境資料流動等方面。歐盟於今年5月頒佈的《通用資料保護條例》(General Data Protection Regulation,簡稱GDPR),也進一步凸顯了大資料時代資料隱私保護的重要性。
在安全標準領域,ITU-T SG17正在制定多個大資料安全國際標準,包括《移動網際網路服務中大資料分析的安全需求與框架》、《大資料即服務的安全指南》、《大資料基礎設施及平臺的安全指南》、《電信大資料生命週期管理安全指南》等。而在國內,全國資訊保安標準化技術委員會下設了大資料安全標準特別工作組(SWG-BDS),專門進行大資料相關標準的研究,目前已釋出了《資訊保安技術個人資訊保安規範》、《資訊保安技術大資料服務安全能力要求》兩項國家標準,同時還在制定《大資料安全管理指南》、《個人資訊保安影響評估指南》、《個人資訊去標識化指南》、《資料安全能力成熟度模型》、《資料交易服務安全要求》、《資料出境安全評估指南》等多項國家標準。下一步,該工作組將重點開展大資料安全參考框架、個人資訊保安、資料交換共享相關安全以及大資料安全檢測評估相關標準的研製。
(5)行業應用標準
行業應用類標準主要是針對大資料為各個行業所能提供的服務角度出發制定的規範。該類標準指的是各領域根據其領域特性產生的專用資料標準,包括工業、政務、服務等領域。
由於這一領域的標準針對性較強,因此國際標準組織較少涉及這一領域,而同樣也由於其較強的針對性和指導作用,國內熱點行業的標準化工作則比較活躍。尤其是在工業大資料領域,信標委大資料標準工作組下設工業大資料專題組,制定中的國家標準包括《資訊科技大資料 工業應用參考架構》、《資訊科技 大資料 產品要素基本要求》、《智慧製造 物件標識要求》、《智慧製造製造物件標識解析體系應用指南》。CCSA TC601也成立了工業大資料工作組,進行相關標準的研究。其它比較活躍的行業還有政務領域,信標委大資料標準工作組同樣下設政務大資料專題組,CCSA TC601也成立了政務大資料工作組。
結語
中國信科集團旗下大唐電信科技股份有限公司(簡稱:大唐電信)作為業界領先的行業應用解決方案提供商,多年來一直積極參與國內外的標準化工作,提升了公司在行業的知名度和影響力。目前,在雲端計算、大資料領域,公司已成功主導釋出了4項國際標準和1項行業標準,同時還有4項國際標準和1項行業標準正在制定中。未來,大唐電信將持續加大在國際標準化尤其是大資料標準化工作的投入,與業內同仁通力合作,為大資料產業的健康發展貢獻自己的力量。

責任編輯:陳近梅