環保大資料如何邁出第一步
針對我國提出的大資料戰略,各行各業都躍躍欲試,就環境資訊化來說,環保大資料的第一步需要怎麼走?
這是我國環保產業目前面臨最迫切的問題。那麼,美國通過哪些資訊化手段將資料整合起來呢?
面臨同樣的問題,美國環保局(EPA)已經開始探索大資料的第一步——資料整合。對於EPA來說,內部業務應用階段(即辦公自動化和管理資訊系 統)早已經實現,EPA的資訊化已經走向更加複雜的與各聯邦政府間資料共享、業務協同的高階應用階段,將各個業務系統的資料整合整合到一起,成為EPA和 聯邦政府履職的必要組成部分。
建立設施登記系統Vol.01
實現EPA內部和聯邦政府的資料整合,是資料整合的基石為解決不同系統、資料庫之間的標準化和資料語意衝突的問題,方便資料的整合、共享,EPA建立了環境資料註冊(Environment Data Registry, EDR)機制,提供資訊系統和資料的標準資訊(包括名稱、格式、來源、位置等)。EDR分為系統程式及資料庫註冊、資料集合註冊、資料(元素)註冊、環境 詞彙註冊、開發元件註冊、化學物質註冊及設施登記(註冊)等。
其中,設施登記系統(Facility Registry System,FRS)是對包括企業、汙水處理廠、民用設施、甚至採礦作業等享有排汙權的設施進行登記,為每個排汙設施建立唯一、綜合的設施識別資訊,形成排汙設施登記資料庫。
通過為每個排汙設施賦予唯一的“設施標識碼”,使不同業務系統資料之間的關係得以明確,實現跨業務系統和跨庫檢索。通過設施標識碼建立排汙設施與EPA和各州業務資訊系統的連結,實現了EPA內部和聯邦政府範圍內的資料整合和共享。
FRS由OEI(環境資訊化辦公室)集中管理和維護,通過把各業務系統的設施資料鏈接起來, EPA可以做很多事情,比如搜尋某一行業的所有被監管設施;設施的準確位置,包括排汙口經緯度等;某設施所涉及的各種排汙許可和環境監管資訊;某企業的所有排汙設施例如某石油公司的所有分廠等。
自上世紀90年代FRS開始實施以來,已經登記了160萬個設施記錄,整合了28個州的汙染設施主資料;管理超過7800個聯邦管理的設施,5萬個部落領地設施和超過3000個國家環境行為跟蹤(NEPT)設施資料,成為EPA資料整合的基石。
EPA還通過汙染設施的資訊公開,收集公眾對設施資料質量的問題反饋,識別和糾正錯誤資料和重複記錄。3年內收到1。3萬個資料錯誤的反饋,更正了1。2萬個錯誤,大幅提高了設施資訊質量的準確性和有效性。
建立環境資料傳輸與交換系統Vol.02
使得EPA各部門、各州環保部門、環保團體、企業等快速地交換環境資料在資訊化建設之初,為滿足各項業務需求,EPA也分別建設了資訊系統和資料庫,這些系統大多互不相容,難於共享。
對於不同業務系統的資料傳輸和交換需求,EPA沒有分別建立傳輸網路和系統,而是依靠統一的中央資料交換系統(Central Data eXchange,CDX)實現。這一平臺提供單一資料申報及交換視窗,使EPA各部門、州政府環保部門、部落或環保團體、企業能夠快速傳輸、交換環境數 據。CDX目前已經延伸到加拿大及墨西哥,實現了跨境資料交換,是EPA資料採集、傳輸和交換重要的基礎設施。
目前已超過26萬個使用者在CDX上註冊,50個州和9個部落運用CDX所提供的空氣、水等相關環境資料,60個系統的資料在CDX上交換,每年的交易數量超過80萬筆,節省了大量的時間和經費。
建設環境資料倉庫Vol.01
形成綜合性的環境資訊,並有利於實現資料的實時智慧分析為整合、整合業務系統和資料以獲取綜合性的環境資訊,EPA的OEI還通過從不同業務系統中抽取資料,整合形成環境資料倉庫(EnviroFacts)。
目前,包括大氣環境質量、有害固體廢棄物、超級基金場地、有毒物質排放清單、飲用水等大部分業務資料已經整合到EnviroFacts中,分為大氣、水、土壤、固廢、有毒物質、設施、輻射、守法等專題。公眾只要登陸EPA網站,就可以方便地查詢到所需要的各類環境資訊。
在不久的將來,多智時代一定會徹底走入我們的生活,有興趣入行未來前沿產業的朋友,可以收藏 多智時代 ,及時獲取人工智慧、大資料、雲端計算和物聯網的前沿資訊和基礎知識,讓我們一起攜手,引領人工智慧的未來!