1. 程式人生 > >【案例】重慶市金融工作辦公室:大資料監測預警非法集資平臺

【案例】重慶市金融工作辦公室:大資料監測預警非法集資平臺

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

近年來,隨著國家對金融市場管控政策的不斷調整以及網際網路金融的快速發展,非法集資的犯罪手段和形勢發生了很大變化。僅在2016年,全國檢察機關公訴部門受理非法集資案件9500餘件

作者 | 金信網銀

官網 | www.datayuan.cn

微信公眾號ID | datayuancn

本篇案例為資料猿推出的“金融科技價值—資料驅動金融商業裂變”大型主題策劃活動第一部分的文章/案例/產品徵集部分;感謝 金信網銀 的投遞

1、企業名稱

重慶市金融工作辦公室

2、所屬分類

金融科技·徵信

3、案例背景

近年來,隨著國家對金融市場管控政策的不斷調整以及網際網路金融的快速發展,非法集資的犯罪手段和形勢發生了很大變化。僅在2016年,全國檢察機關公訴部門受理非法集資案件9500餘件,其中,非法吸收公眾存款案8200餘件、集資詐騙案1200餘件。受理金融犯罪案件30900餘件48700餘人,起訴23700餘件36300餘人。從以上資料來看全國打非形勢依然非常嚴峻。同時,伴隨著網際網路大環境下網路非法集資的規模大比例增加,作案手段更趨隱蔽化、多樣化給金融監管工作帶來了更大的困難。

在當前金融市場和網際網路的大環境下,政府想要更有效地打擊非法集資,就需要運用到新的手段和方式。通過技術創新和模式創新,凝聚大資料處理領域的優勢力量,做到“用資料說話、用資料決策、用資料管理、用資料創新”,並且藉助大資料實現智慧治理、資料決策、風險預警、智慧城市、智慧公安、輿情監測等。因此,儘快建立實用有效的網上監控體系,是實現非法集資事件早期發現與預警的最有效手段和方式。

4、實施時間

2017年5月31日至2018年5月30日

5、應用場景

0?wx_fmt=png

(1)打擊非法集資迫切需要

近年來,重慶市非法集資案件多發頻發勢頭雖得到扼制,陳案積案處置取得積極進展,規範、流程等基礎性制度初步建立,但受經濟下行、商事制度改革過渡期、群眾金融知識普遍缺乏等因素影響,各類不規範民間融資行業領域有集中暴露風險。值得注意的是,非法集資正不斷向新的行業、領域蔓延。

很多非融資性擔保公司、投資諮詢等中介機構公開“代人理財”大肆非法集資;許多小額貸款公司、私募股權投資等融資性機構超範圍經營涉嫌非法集資;一些農業專業合作社以入股分紅為誘餌吸收農民資金投資異地或放高利貸;網路平臺打著“民間借貸”旗號非法集資風險也日見凸顯。

且隨著網際網路金融的不斷髮展,當前,網際網路金融的內部運作和外部監管在具體合規操作和法規體系上凸現出相關漏洞,區域性領域風險不斷積累,迫切需要實現非法集資的事前監測,實現“打早打小”,防止演變成較大的非集事件,及時挽回群眾的資產損失。

(2)落實市政府關於防範和處置非法集資工作需要

重慶市大資料監測預警非法集資平臺建設是按照《國務院關於進一步做好防範和處置非法集資工作的意見》,紮實有效做好本市防範和處置非法集資工作,防範系統性區域性金融風險的重要組成部分。

在今年4月25日,桂平同志在全市打擊非法金融活動領導小組(擴大)會議上強調:強化網路監測、行政處置、督查考核“三種手段”,加快建設全市大資料監測預警非法集資平臺,採取差別化處置策略積極穩妥化解風險。因而,建立立體化、社會化、資訊化的監測預警體系,是遏制非法集資高發勢頭,及早引導、規範、處置非法集資苗頭的有效保證。

(3)建設智慧型服務型政府的需要

從全球範圍來看,隨著大資料、雲端計算和智慧挖掘等新一代資訊科技商業模式的不斷成熟,重慶市政府決力向智慧化、精準化、主動化的方向發展,打造智慧型政府形象。

6、面臨挑戰

(1)政府人員有限

面對網際網路時代,非法集資出現的新特點、新趨勢、新手段,傳統的防範監管模式已經不能完全適應新形勢變化,且市政府人員編制較少造成個人工作量增加而效率降低的情況。

(2)事前監測預警難

面對目前非法集資手段的電子化、網路化、傳播途徑多樣化、行業分佈的廣泛化等特點,想要實現對非法集資犯罪活動的事前預測、事中預警,是重慶市金融監管部門面臨的一大挑戰。

(3)資料協調困難

隨著我國政務資訊化取得巨大進展,很多不同的資料分別隸屬於政府的不同部門,相關資料資訊相互隔離,缺乏關聯分析與深度挖掘,容易形成資訊孤島,從而導致獲取非法集資相關資訊和證據困難。

例如:非法集資風險監測預警的核心是賬戶資金異動情況,涉及賬戶資訊異動是由各金融機構依據《反洗錢法》和《大額交易和可疑交易報告辦法》向人民銀行報送,具體資訊由人民銀行反洗錢部門掌握。非法集資民事、刑事案件審判資訊和犯罪記錄由法院和公安機關掌握。此類資訊因涉密和保護隱私,難以向其他部門實現共享。中央條管金融機構合法產品資訊由銀監、證監、保監等中央金融監管部門掌握。農民專業合作社管理資訊由農業部門掌握,要實現資料共享還需要進一步協調。

(4)非法集資處置困難

傳統監管模式對非法集資行為不能及早發現,只能在非法集資案件發生後被動地去處置,很難做到“打早打小”,在苗頭時期、涉眾範圍較小時解決問題。

7、資料支援

圍繞非法集資的監測預警,建設金融風險大資料中心,每日資料量更新達5000萬條。截止目前,新聞資料12.08億條,論壇8.6億條,微博163.1億條,微信公眾號資料2.96億條;工商資料覆蓋4500萬家企業和1億家工商個體戶;法院資料15億條,覆蓋1000萬家涉訴企業;招聘資料覆蓋主流招聘網站;金融行業資料覆蓋了網貸、私募、眾籌、小額貸款公司、交易中心、融資租賃等行業。此外,該大資料中心還對接了相關脫敏資料,採集了ICP備案資料,同時建立了一套非法集資高風險庫。

8、應用技術/實施過程

(一)實施過程

(1)搭建平臺架構

重慶市大資料監測預警非法集資平臺的資料支撐為金融大資料系統,通過系統對多個數據源的採集,在記憶體式計算系統上進行分散式計算,經過資料清洗、資料整合、資料變換、資料規約等一系列預處理過程,把資料集合統一轉換成可供分析的結構化資料。

其次,針對重慶市私募、網貸、投資諮詢、融資擔保等行業分別建設預警模型,應用大資料處理技術實時運算,得出衡量企業非法集資潛在風險的指標“冒煙指數”。

最終,基於重慶市企業的原始資料和“冒煙指數”分析結果,設計視覺化系統,輔助使用者直觀瞭解重慶市非法集資風險情況和個別企業風險詳情。

(2)設計研發產品

從需求出發,金信網銀輔助重慶市金融辦實時掃描重慶2萬餘家類金融企業的輿情負面資訊、工商處罰資訊、法院涉訴資訊等資料,一旦出現企業涉嫌非法集資的行為,及時發出預警訊號。

同時,結合重慶市區域金融風險情況,應用“冒煙指數”模型作為研判依據。“冒煙指數”一詞的取名,靈感來自於森林火災前的冒煙場景。因為森林要著火首先要冒煙,煙越大火勢越旺,同樣非法集資案件爆發前總會有苗頭,因此衡量企業非法集資潛在風險大小的指標叫“冒煙指數”。

0?wx_fmt=png

“冒煙指數”從合規性、收益率、傳播力、投訴舉報情況和特徵詞命中情況五個維度深度挖掘重點監控企業的風險。合規性指數從企業資質、企業管理人資質、是否涉嫌超範圍經營、是否存在虛假宣傳等幾個因素來考量;收益率偏離指數從企業承諾的收益率和市場平均收益率之間的差值來考量;傳播力指數從企業或產品宣傳的途徑、企業經營覆蓋範圍等幾個因素來考量;投訴舉報指數從投訴資訊的來源渠道和投訴內容來考量;特徵詞命中指數從企業輿情出現非法集資風險關鍵詞的頻率來考量。

“冒煙指數”位於0~100之間,分數越高,該企業非集風險就越高。當冒煙指數高於60分時,說明該企業的非法集資風險很高,建議約談整改。

為確保“冒煙指數”模型的精準性和客觀性,金信網銀在利用跨部門資料資源的基礎上,以大資料和雲端計算為技術支撐,綜合應用了機器學習演算法、自然語言處理及複雜網路分析等前沿技術,並對歷史非法集資案件的資料進行剖析,梳理出近千個細分資料項,然後對海量資料進行反覆訓練,不斷的優化模型的準確性。

(3)資料計算雲平臺服務方案

最終,產品以Saas雲平臺的模式交付給重慶市金融辦。Saas雲平臺具有資料同步便捷、運維成本低等優點。在資料同步方面,金信網銀不斷積累的新資料和模型優化後的計算結果能夠第一時間同步到重慶市大資料監測預警非法集資平臺中。在後期運維過程中,一旦出現軟硬體等運營故障,金信網銀可以第一時間核查原因,降低時間成本。

(二)應用技術

(1)大資料採集技術

應用TRS海量異構資料採集技術對網路新聞、財經媒體報道、百度貼吧、社交網路資訊、經授權的工商、稅務、法院訴訟資料等資料實時監控和採集,對採集到的資訊進行過濾和自動分類處理,最終將最新內容及時釋出出來,實現統一的資訊導航功能,同時提供包括全文檢索、日期(範圍)檢索、標題檢索、URL檢索等在內的全方位資訊查詢手段。

(2)大資料管理技術

金融風險大資料中心每日資料更新量達5000萬條,融合多源結構化和非結構化的海量資料。作為大資料架構的底層,大資料中心應用分散式儲存技術和整合技術實現資料的海量儲存,應用索引分片、對等節點機制(去中心化)、新型列資料庫儲存機制等技術實現資料的有效管理,應用全文檢索技術實現資料的精準檢索,提供了大資料高效管理和智慧檢索的平臺支撐。

(3)大資料分析技術

高效、迅速、精準的挖掘海量資料中的風險資訊是重慶市大資料監測預警非法集資平臺的關鍵。金信網銀利用大資料、雲端計算和機器學習等進行決策,融合了文字挖掘、自然語言處理技術、複雜網路分析、LBS分析等技術,並結合機器學習、深度學習等演算法,實現從大資料監測預警非法集資分析方法的突破。

文字挖掘也稱為文字資料探勘,是以文字型資訊源為分析物件,利用智慧演算法,如神經網路、基於案例的推理等,融合文字分詞、文字分類、文字過濾、文字抽取、關係挖掘等功能,從非結構化文字文件中提取有用的、重要的模式,知識和規律。

文字分詞融合規則和統計兩方面技術,可有效解決切分歧義問題;文字分類可對資訊的行業、地區、褒貶義等進行分類,是建模中的一項重要指標;文字過濾有效識別和過濾各種有害垃圾文字資訊,降低後期模型計算的誤差;文字抽取使用機器學習和統計的方法實現各類實體資訊的抽取;關係挖掘可從海量資料中快速分析挖掘實體間關係,用於分析企業的關聯擔保風險。

複雜網路是由數量巨大的節點和節點之間錯綜複雜的關係共同構成的網路結構。結合工商資料的投資關聯資料、法院資料的原被告利益資料等資料,複雜網路分析方法可用於核心企業/人員的鎖定、關聯風險的識別及關聯結構異常的挖掘等。

基於LBS分析,視覺化呈現目標企業與其關聯企業的地理分佈,並從其動態演變特徵挖掘風險異常。

機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。它是一門研究機器以獲取新知識和新技能,並識別現有知識的學問,是將無序資料轉化為有用資訊的方法,價值在於從資料中抽取規律,並用於解釋資料或預知未來。機器學習分為四大塊:降維、分類、聚類和迴歸。從技術角度看,谷歌雲機器學習與人工智慧首席科學家李飛飛表示:機器學習正在信用卡風險檢測、反詐騙和洗錢等方面發揮越來越大的作用。

9、外部合作

為完成重慶市大資料監測預警非法集資平臺的建設,金信網銀從資料合作、技術合作、專家合作等方面整合了各方資源,共同做好此專案。

資料是大資料平臺的生產資料。整合多方海量的資料,才能豐富模型的指標體系,提升資料分析的準確性。金信網銀一方面建立自己的獨家資料資源庫,另一方面一直尋找市場上最優質資料供應商,用最準確的資料給使用者提供服務。與好公司合作,可降低自己的資料成本和時間成本,也會更好的服務使用者。目前,金信網銀整合的輿情資料、工商資料等資料都與業界最好的資料供應商建立起合作關係,真正實現“1+1>2”的效果。

技術合作是金信網銀提高產品研發速度的重要途徑。開源軟體的普及打破了傳統科技公司的桎梏,促進了多方之間的交流和合作。金信網銀的產品設計借鑑了合作伙伴和開源軟體的自然語言處理技術、知識圖譜分析等,大大提高了工作效率。

專家合作是金信網銀迅速發展的一大法寶。對市場需求的理解,一方面需要從實踐中總結學習提升,另一方面需要理論層面的引導,加深對業務邏輯的分析。金信網銀建立自己的專家智庫,一起探索非法集資監測預警工作的方向,輔助監管層更有效地降低區域金融風險。

此外,金信網銀還加強和市場合作、媒體合作、高校資源合作,以及未來資本運作等方面的合作。

10、商業變化

重慶市大資料監測預警非法集資平臺建設是按照《關於促進網際網路金融健康發展的指導意見》以及近期國務院關於啟動網際網路金融領域的專項整治系列部署,落實屬地監管責任,推進本行政區域範圍內的風險排查、監測預警、案件查處、善後處置、宣傳教育和維護穩定等工作。具體有以下社會效益:

第一,平臺建設是推進金融治理創新的必要手段,將金融風險化解在萌芽階段,維護重慶市本地金融穩定和人民群眾財產安全,促進本地新興金融業態的健康發展。

第二,平臺建設加強了重慶市政府對於網際網路金融的監管,促進了網際網路金融健康的發展,更好地服務於實體經濟。

第三,平臺建設有利於及時發現和處置重慶市非法集資行為,對已經出現的違法案件,有利於形成完整的線索鏈條,加快公安部門偵破案件,為人民群眾挽回損失。

第四,平臺採集到的新興金融業態各方參與主體大資料資訊,也有利於充實和完善重慶市公共基礎資訊資源庫和信用資訊主題庫,依託該系統可為有關部門和領導提供巨集觀經濟金融形勢、金融執行狀況、行業發展的統計、分析等,為決策參考。

關於企業 -

北京金信網銀金融資訊服務有限公司(以下簡稱金信網銀),成立於2014年,是一家專門從事金融大資料分析挖掘系統、風險管理綜合服務平臺的研發和服務公司,能夠滿足金融監管部門多角度金融風險預防和監管的需求。公司致力於大資料監測預警金融風險,技術驅動創新社會治理,打通政府資訊壁壘,用“冒煙指數”輔助地方金融監管部門守住不發生系統性金融風險,促進社會和諧穩定,為中國金融體系完善和信用體系建設注入正能量!

目前,金信網銀已服務公安部建設非法集資犯罪監測預警平臺,利用大資料技術輔助研判分析經濟犯罪;服務北京市金融局建設全國第一個打擊非法集資監測預警平臺,應用於打擊非法集資專項整治行動和網際網路金融風險專項整治,及時監測預警非法集資等金融風險;服務中國網際網路金融行業協會監測預警會員風險;服務深圳市金融辦建設類金融行業監管平臺;服務廣東省金融辦、重慶市金融辦、北京市東城區金融辦、北京市海淀區金融辦、貴州省金融辦、湖北襄陽金融辦等做好類金融行業風險排查工作。此外,還服務於“一行三會”、珠海市金融辦內蒙古自治區金融辦等金融監管部門。

0?wx_fmt=gif

作為整體活動的第二部分,2017年10月25日,資料猿還將在北京舉辦千人規模的“2017金融科技價值——資料驅動金融商業裂變”峰會並將在現場舉行文章、案例、產品的頒獎典禮

更多精彩內容

(點選關鍵詞檢視)

· 觀 點 ·

· 案 例 ·

0?wx_fmt=jpeg

0?wx_fmt=jpeg