政府與開發者協同不足 制約資料應用落地
更多報道請掃碼
政府資料開放準備度之五企業應用篇
政府資料的價值在於通過開發利用,實現科學決策、精準治理、公共服務優化以及資料資源產業化。然而一直以來,在政府資料的開發與使用上,政府與開發者較難實現場景共享、協同共治,一方面是政府管理者無法掌握使用者需求,另一方面是企業或應用開發者不知道政府需要解決哪些問題。本期“政府資料開放準備度”以“資料應用”為視角,對開放資料創新應用大賽參賽團隊展開調研,看看他們的實踐路徑。
多地試水創新競賽推進資料應用
目前,我國政府資料的開放應用多以政府主導為主,即通過政府主動開放自身資料並吸引企業投資(資金、技術)的方式,來深化政府資料的創新應用,主要方式包括開展創新應用競賽、政企合作建立試點專案等。
上海、重慶、貴州等省市區近幾年紛紛試水政府資料創新大賽,SODA、CODA等嶄露頭角。由上海市經信委舉辦的開放資料創新應用(SODA)大賽始於2015年,以“資料眾籌、應用眾創、問題眾治”為模式,每年圍繞不同主題,均以開放資料為基礎,面向全社會徵集資料應用案例,迄今已舉辦四屆,先後吸引國內外1600多支團隊、超萬名選手參賽。
原本在規劃院系統工作的劉瀏2016年帶領團隊參加SODA大賽,獲獎作品“StreeT alk”是一個依託城市街道影像進行的城市慢行環境評估平臺,基於街道整治資料、街景照片資料庫實現城市步行指數地圖。
主要研究運營管理的上海對外經貿大學管理學院副教授陳瑤2016年帶領團隊首次參賽,基於1億多條上海一卡通乘客刷卡資料,研發地鐵在站人數、人群密度、人群智慧疏散路線優化等演算法,給上海地鐵做了一次“體檢”,診斷哪條線路最為擁堵,團隊最後呈現成果還包括上線微信小程式“優行地鐵”,並摘得“優秀獎”;2017年陳瑤團隊再次參賽,聚焦分析消費者投訴資料,旨在幫助上海工商舉報投訴系統進行智慧升級;2018年,陳瑤團隊依靠“數遊長三角旅遊大資料平臺”專案第三次摘得SODA大賽優勝獎。
來自上海大學上海美術學院資訊與互動設計工作室李謙升團隊針對上海市政府資料服務網站中所釋出的公共資料,設計製作“DataSH上海公共資料視覺化入口網站”平臺,2016至2018年期間,在城市交通、綠化、文化、汙染等公共資料領域推出一系列視覺化作品。
資料更新資料質量制約應用落地
賽後,這三個參賽團隊和他們的資料應用產品有了不同的走向。
李謙升介紹,他們以推廣公共資料為主,利用資料視覺化的直觀方式幫助建立公眾與公共資料之間的溝通渠道,通過空間、趨勢、故事和工具四個維度上的核心功能,讓市民瞭解從資料視角來觀察所生活城市的方式,為提升城市管理水平開啟暢通的資訊通道。
而劉瀏團隊開發的“StreeT alk”獲得了全新的業務合作,團隊成立公司開始創業,一方面延續SODA專案概念做獨立的產品研發,另一方面更多的是為城市規劃相關行業提供資料諮詢服務。
陳瑤團隊是賽後在主辦方的牽線搭橋下,通過“高校+企業”身份與上海多個政府主管部門開展合作,延續了SODA專案。比如,基於實際業務需求,陳瑤團隊對上海工商舉報投訴系統進行智慧化、大資料升級,並逐步開發功能模組,以進一步降低人工管理的壓力,達到精準監管的目的。同時,結合大量外部資料,讓政府部門更加主動監測市場熱點,防範風險。
SODA聯合發起人高豐在講述SODA參賽獲獎專案的延續時表示,賽事過程中大多數團隊都會針對政府開放的樣本資料去做一系列資料探勘、分析和視覺化,幫助資料提供單位更好理解自身業務,助力問題解決。從專案的創意到實施,需要打通資料資源,連線資料擁有方、業務需求方、資料創新方來共同推動完成。
也正是因為資料應用與政府資料開放仍然存在協同不足等問題,不少專案難以推廣,市場化落地困難。李謙升團隊談及其專案推進的最大問題可能還是定位:“我們目前還是以公益專案的方式來定位,最終目的是以推廣公共資料為主,它不像一些很具體的應用,可以很清晰地看到如何把資料變成有價值的資源。”
即便是有成功經驗的陳瑤也提到,純研究驅動的開放資料應用有較大的落地困難,開放資料不能及時更新,應用缺乏及時性;與實際主管部門合作機會較少,難以發揮社會價值,“例如我們的"優行地鐵"專案由於乘客刷卡資料只開放用於比賽,後期資料未能及時更新,未能找到成熟商業模式”。
陳瑤認為目前政府資料應用,應該以政府採購服務的方式來持續,“目前比較推崇的是政府主導的資料工作室模式,建立專案制。政府提出需求,拿出一部分資料由專門研發團隊去做集中的應用開發。但最後如何落地,在什麼平臺上使用,還需要政府部門來協調”。去年,陳瑤的“數遊北極星”團隊加入上海房屋土地資源資訊中心資料工作室,藉助大資料研究團隊進行趨勢和問題分析,解決上海郊野公園的規劃和運營問題。
同時,三支團隊都認為政府資料質量是制約其開發利用的原因之一,“資料開放不等於資料高質量”。針對資料質量,有學者提出“髒資料”概念,指的是那些不符合要求或標準規範的質量差的資料,如資料缺失、資料錯誤、亂碼等。陳瑤認為,不管是政府開放資料,還是政府內部資料、企業資料,都有資料質量問題,在資料錄入、採集過程中不可避免會出錯。如果出錯以後,沒有人、沒有專門的標準去研究、去監測,資料就儲存在那裡,後面做的研究分析就可能遇到各種問題。
代表建議政府資料應“授權運營”
除了資料創新應用競賽,政企合作也是一條有效路徑。復旦大學數字與移動治理實驗室主任、國際關係與公共事務學院副教授鄭磊認為,政府對資料價值的挖掘能力、創新力度不如市場,應把資料開放給社會,讓社會來挖掘價值。“他們會跟根據自己企業、產品以及服務特點、服務的使用者需求來利用。關鍵是政府把要原材料開放給別人去加工,要開放出去。”
今年全國兩會期間,全國人大代表、浪潮集團董事長孫丕恕提出“授權運營”路徑。他認為,資料既然是有價值的資產,就要把它運營好。如果僅僅是資料“託管”,只能算履行“保姆”的職責;想要晉升為“管家”,還需要很多政府資料授權運營的實踐案例,要求政府從資料的開放階段過渡到授權運營階段。
在其看來,政府部門不開放資料主要受制於流程、法規等因素,有兩方面疑慮:一是資料安全。管理好資料安全風險就要求資料運營者明確資料使用目的,明確商業底線,做到資料“可用不可見”;二是資質認證。政府應授權什麼企業做資料運營?建議應對資料運營者做認證,建立一套認證標準。
孫丕恕建議從授權區域性資料開始,“政府可以按照每階段開放哪些資料做個條例,最後統一形成黑白名單”。然後再解決怎麼授權的問題,“積累實踐經驗非常重要,要用有限的資料,產生很多的經驗”。
全國政協委員、搜狗公司CEO王小川也提出了對政府資料的需求,遞交了《開放公共資料,用人工智慧惠民生》提案。王小川認為,可用於人工智慧訓練的公共資料處於匱乏狀態,建議在保障國家安全、公民隱私的前提下,優先推動醫療、教育、養老、法律等民生迫切領域資料深度開放,並針對這些領域資料的開放全面性、時效性、規範性做出明確規定。同時,開展人工智慧民生應用試點,與業界探索資料開放合作,有序開放優質公共資料資源,釋放公共資料紅利。
課題說明“政府資料開放”對提高政府透明度及效率,創新驅動經濟發展的價值毋庸置疑,今年全國兩會已有多位代表委員為此建言獻策。為觀察研判現狀,南都大資料研究院聚焦“政府資料開放準備度”,從政策保障、社會認知、學術理論、人才儲備、企業應用等圍繞政府資料開放的“基礎條件”出發展開系列資料調研報道,探討準備度如何?改進空間在哪?助力各地政府資料開放向縱深發展。首期以31省份170份政策檔案為樣本觀察政府資料開放政策保障;第二期分析1053篇文獻探討學術理論熱點以及未來研究方向;第三期採訪16所高校相關學院的院長老師分析資料人才培養情況;第四期通過對廣東8所高校資料科學與大資料技術專業學生定向問卷調查,探究他們對政府資料的認知與應用實踐。
出品:
南都大資料研究院
統籌:鄒瑩
研究團隊:
張雨亭 袁炯賢 羅韻
南都記者娜迪婭 李玲 馬寧寧 蔣琳 唐孜孜 陳燕
實習生 席莉莉
李潤澤子