氪信CEO朱明傑:小資料思維無法解決大資料問題
上週五,氪信CEO朱明傑博士應邀出席首屆上海市大資料社會應用研究會年會,在由復旦大學大資料研究院承辦的“大資料智慧與金融創新”分論壇上,朱明傑博士發表了題為“AI攻克大資料難題”的主題演講。朱明傑博士表示,目前在大資料的應用中,應當注意“小資料思維”,即用個體或區域性資料及自上而下驗證假設的思維,去處理海量非結構化資料,並試圖從中得到結論。他以氪信在“AI+金融”領域的實踐為案例,分享了人工智慧是如何助力金融機構攻克大資料難題的經驗。

首先,面對金融領域PB級別日處理資料量,氪信將世界頂級網際網路AI引擎搭建經驗及ZB級別的日處理資料量能力“降維”使用在金融領域,為其賦能;區別於傳統的評分卡模型,氪信通過整合模型架構幫助金融機構處理非結構化資料,這也是氪信最初能夠和金融機構產生合作共鳴的關鍵因素。
其次,傳統金融領域,風控專家歷經數年形成風控經驗,在網際網路金融到來之際遇到了挑戰,面對移動網際網路層出不窮的“新狀況”,已超出人腦能夠總結的規則範疇,氪信基於深度學習的特徵工程,可為智慧風控提供行之有效的創造性解決方案,相應的成果也被收錄於知識發現與資料探勘國際頂級學術會議——KDD 2018,資料探勘和機器學習應用國際頂級會議——WSDM 2018等世界頂級學術會議中。
第三,通過全域金融知識圖譜構建精準使用者畫像,實現海量非結構資料價值的最大化。“大家經常提知識圖譜,在金融領域,知識圖譜更深層次的意義在於,它體現的是機器學習模型使用資料,而不是人去理解的規則,凡是人為表達的規則,就存在著安全隱患,相反,利用機器學習模型,資訊洩露的風險相應會小很多。”朱明傑博士表示。
與此對應,受金融監管合規要求,金融場景強調模型的可解釋性與可追溯性,網際網路“黑盒進,黑盒出”的方法不適用金融場景,因為該方法導致人的經驗無法介入;同時,金融行業的樣本非常稀缺,每筆壞賬都意味著一筆巨大的損失,因此機器學習結合專家經驗必不可少。氪信的做法是用專家經驗“教會”AI模型和演算法,增加模型直譯器,讓風控專家可對模型結果進行解釋,並能回溯倒具體特徵進行調整,在模型自迭代的基礎上進一步優化模型;另一方面是採用半監督學習方法,結合專家經驗進行樣本輸出。
據悉,這是上海大資料社會應用研究會成立以來的首次年會。其中,“大資料智慧與金融創新”平行論壇由上海市大資料社會應用研究會副會長,復旦大學大資料研究院副院長、教授吳立波主持,與會嘉賓還包括上海交通大學中國普惠金融創新中心主任、英凡研究院院長費方域,上海財經大學資訊管理與工程學院常務副院長,講席教授、博導黃海量,交通銀行總行風險部副總經理孫榮俊,中國電信上海理想資訊產業(集團)有限公司副總經理胡忠順,復旦大學大資料學院青年副研究員魏忠鈺,國泰君安證券資訊科技部規劃主管梅繼雄等。
與會嘉賓們結合各自研究領域均作了深入淺出的分享,如胡忠順總經理主要分享了基於資料沙箱的金融科技與監管科技聯合創新平臺,魏忠鈺副研究員主要介紹了研究團隊使用深度學習模型進行金融事件預測和對金融實體網路進行表示學習的研究工作,梅繼雄主管則主要介紹了國泰君安數字化戰略工作,並分享了一些大資料和人工智慧在金融中的應用場景。
