個人金融借貸場景下,大資料風控的行業分析及應用分析
大資料風控是現在金融科技公司白熱化競爭的業務場景,那大資料風控到底是什麼?這個行業前景如何?有哪些機構在佈局競爭?有哪些產品形態?本文將圍繞個人借貸場景,為你一一揭曉。
一、大資料風控是什麼?
大資料風控按照通俗的概念解析:通過運用大資料構建模型的方法對借款人進行風險控制和風險提示。
這句話涵蓋大資料風控必要的4個要素:
1. 原材料:大資料
2. 實現方式:技術模型
3. 目標人群:場景中的群體。
由於本文主要指個人借貸場景,則目標人群是借款人。還有其他場景,例如信用卡場景對於信用卡申請人、購物場景針對分期使用者、租房場景針對租金分期使用者、投保場景針對投保人、投資理財針對投資人等。
4. 目的:風險控制和風險提示。一般機構主要有2個目的:
潛在的特點是可以大批量實時實現風險控制和風險提示。
二、傳統風控與大資料風控的區別
大資料風控的叫法其實就是為了與傳統風控做區分。
傳統風控在2016年之前相對比較普遍,其特點是線下風控場景為主,需要使用者填寫一大堆個人資訊及提供工作證明、流水證明、住址證明等,稽核時間一般為1-3天,銀行體系會更長3-7天左右。
正常情況,一份使用者資料表需要填寫包括以下這些資訊:姓名、性別、年齡、身份證號、家庭地址、學歷、家庭人數、婚姻狀態、單位名稱、單位電話、工作職務、單位性質、收入來源、收入水平、配偶詳情、經營企業詳情、其他資質等資訊。
除了這些資訊,還需要提供紙質的身份證影印件、工作收入證明(蓋章)、半年銀行流水、水電費或房屋租賃合同等。
另外,銀行等持牌機構還會查詢使用者在央行的徵信報告,用於輔助風控。
這些資料潛在的意義可以這樣解讀:除了年齡代表准入門檻,一般的借貸產品要求借款人需要有22歲以上才可以申請,現金貸產品會把年齡門檻放到18-20歲及以上。部分產品要求學歷是高中及以上,或者要求非在校生。其他的分組後分別代表借款使用者的還款能力,負債情況及信用情況(這裡不細分還款意願)。
直接體現或者間接體現還款能力的:
體現負債情況和信用情況的:央行徵信報告
拿到這些資訊及材料後,由風控專員憑藉經驗及按照標準化流程稽核材料真實性。例如工作收入證明通過撥打公司電話核查有無本人及職位情況、其他資質材料看印章判斷真實性,流水會打銀行電話抽查真實性等。
傳統風控的模式及節奏是不符合網際網路金融高速發展的節奏的,網際網路金融時代都是按秒級幾百上千使用者群同時發起貸款申請,如果按照人工稽核,從進件到批核整個流程可能要1個月時間都沒法完成。
傳統風控向大資料風控的升級,即是行業發展的需要,也受益於各類使用者資料被標準化對外,也就是API的形式對外輸出,金融機構可以直接接入各種必須的資料介面,用於獲取使用者的資料。
整個流程從使用者填寫將近所有的資訊,變成只要提供姓名、身份證、銀行卡號、手機號這個4個要素就可以獲得全部或大部分風控必需的使用者資訊。
大資料風控的快捷得益於各種標準化的資料介面,但由於代表使用者的各種資料是分別存在與不同的機構中,這些資料原則上需要使用者授權才能對外,而且資料輸出需要進行合規脫敏的處理。
所以,大資料風控需要獲取到與傳統風控要求使用者填寫的所有資訊、或者直接或間接證明使用者還款能力、還款意願、負債情況及信用情況必須的資料,每個型別需要接入幾個資料來源,缺失的型別還需要找到能夠替代的資料介面。
大資料風控需要的資料型別,在後面章節再詳解。
三、哪些行業及場景需要大資料風控
除了借貸場景,還有哪些場景需要用到大資料風控?
這裡,獵人簡單舉幾個例子:
金融行業最常見就是投融資板塊,投資板塊,需要對非法集資、洗錢、資金盜刷等風險進行防控。
借貸板塊,需要進行貸前進行反欺詐及使用者風險識別、授信風險評估、貸中風險評估及貸後風險預警。
電商行業需要在使用者註冊環節進行防薅羊毛、對已註冊充值使用者需要防止其資金被盜刷、賬戶被盜及發生交易後對經常拒付的情況需要識別。
保險行業特別是壽險產品,需要對投保人身份進行核實,防止有不良行為投保使用者過審發生騙保。
除了這些常見的行業場景,其實各行各業只要涉及到個人資訊及資金交易的,都會用到大資料風控,唯一的區別就是針對不同場景的需要的資料及策略是不一樣的。
四、大資料風控行業有哪些機構參與
傳統風控基本都是由金融機構內部的風險部門及門店經理組成,大資料風控更多是由第三方機構提供。
大資料風控行業主要有以下7大型別機構參與:
這些機構擁有場景、資金、放貸業務三者全部或者其中一塊要素,這些要素決定了其在大資料風控的競爭壁壘。
場景代表有源源不斷的資料,及精準的客群畫像,可以無成本或低成本用於風控業務;
資金代表了可以隨意切進任一借貸場景,獲取資料及影響產品形態;
放貸業務表示在特定場景有一定的使用者借貸表現的資料及基礎的風控能力,部分機構的成熟風控能力還可以直接對外輸出變現,切入到體系外的場景獲取更多的資料。
因此,資料量級、資料成本、風控經驗、資金風險承受能力綜合決定了一家機構在大資料風控是否有足夠的競爭力。
五、大資料風控機構存在的意義
個人借貸金融板塊的大資料風控行業的前景,主要可以看2方面:
一個是不含房貸的國內消費金融市場規模及滲透情況。只要消費金融市場的存量客戶,有復貸需求,且增量客群還有轉化空間,代表著借貸業務是持續發生的,則這裡對風控的需求是持續不斷的。
我國個人消費金融的市場規模從2013年的12億到2018年的將近38億,翻了3倍有多;而不含房貸的規模到2018年則到了8億,滲透率為22.36%。如果到2020年滲透率可以提升2.5%,則市場規模有個3.5萬億的提升。這個空間足夠眾多公司在此競爭。
大資料風控機構其中的一個收入來源就是資料介面的呼叫次數計費,這個呼叫次數息息相關的是借貸使用者數量。
而央行內收錄的大部分信貸記錄使用者都是屬於銀行等相對高質量使用者群體,這些群體都有可能下沉到非銀系的網際網路金融中發生貸款行為,同時不在央行體系的信貸使用者,都是網際網路消費金融機構的潛在客戶。
通過央行查詢量,可以側面知道在銀行體系信貸需求的使用者數量,這部分使用者80%以上是無法獲取銀行體系的貸款的,因此理論上是可以成為消費金融機構的潛在客群。
2015年的6.3億次查詢到2018的17.6億次查詢,說明需要信貸的使用者非常多,但這麼大的查詢量,有信貸記錄人數才增加了1億,說明大部分使用者都無法獲得貸款或者非常需要貸款,會同時在多個機構申請貸款,才會每人產生近10次的查詢次數。
六、處於消費金融產業鏈什麼位置
已知大資料風控機構在消費金融場景中是非常有前景的,我們瞭解下其在消費金融產業鏈中的角色及功能,消費金融產業鏈的角色包括:
除了消費者外,產業鏈中的各個角色都有附加風控及徵信機構角色的可能,對外輸出大資料風控能力。
七、個貸風控場景及解決方案
獵人將消費金融大資料風控場景分為5個環節6個應用場景:5個環節包括反欺詐、身份核驗、貸前稽核、貸中監控及貸後催收;6個應用場景分別對應不同的環節。
反欺詐環節:
對申請借貸的使用者群體進行反欺詐識別,識別能力主要依賴於風險名單,高危名單(在逃、黃賭毒、涉案)、法院失信被執行人等名單,另外還有虛擬手機號、風險IP、風險地區等名單,通過名單進行反欺詐識別。
再深入點,可以在使用者使用的裝置端進行反欺詐識別,檢視是否是風險裝置;還可以通過群體關聯,找出是否團伙欺詐行為。例如申請集中在一個IP地址,一個戶籍地,通訊錄都有同一個人聯絡方式等。
身份核驗環節:
進行借貸同行業身份核驗。在反欺詐識別過程中,無風險使用者來到身份核驗環節,這裡可以通過身份證2要素介面,核驗使用者的姓名身份證號是否正真實;通過活體識別判斷是否使用者本人在操作;通過運營商核驗介面,核驗使用者的姓名身份證手機號是否一致,手機號是否本人實名使用;通過銀行卡核驗,核驗使用者的提供的銀行卡是否本人,防止貸款成功後,貸款資金到他人賬戶被冒用。
貸前稽核環節:
授權資訊獲取,針對身份核驗通過的使用者,進行有感知或無感知的必要資訊獲取,為後續模型評分準備好資料。無感知獲取的包括多頭借貸資料、消費金融畫像資料、手機號狀態和時長資料等;有感知(需要使用者提供相關賬戶密碼)獲取的資料有:運營商報告、社保公積金、職業資訊、學歷資訊、央行徵信等。
借貸使用者的分層及授信,針對以獲取的使用者相關資料,根據不同的演算法模型輸出針對使用者申請環節的評分卡、借貸過程的行為評分卡、授信額度模型、資質分層等模型。不同機構對於不同環節的模型評分叫法不一樣,目的都是圍繞風險識別及使用者資質評估。
貸中監控:
之前環節獲取的資料大部分還可以用於貸後監控,監控各項正常指標是否往不良轉變,例如本來無多頭借貸情況的,申請成功貸款後發現該使用者在別的地方有多筆借貸情況,這時可以將該使用者列為重點關注物件,防止逾期。
貸後催收:
此時需要催收的主要針對失聯部分客戶,這部分客戶在貸款時填寫的號碼已經不可用,需要通過大資料風控公司通過某些手段獲得該客戶實名或非實名在用的其他號碼,提高催收人員的觸達機率。
八、大資料風控常用的資料型別
大資料風控離不開資料,這些資料獵人將主要的7大型別,這7大型別的存在主要有2大原因:
一是這些資料維度基本可以直接或間接體現使用者的還款能力、負債情況、信用情況及其他潛在風險,大部分資料維度都已在金融信貸風控環節得到有效的驗證,除了個別場景對於少部分型別資料不太合適外。
二是這些資料都經過標準化的處理,且在其體系內與合作的借貸機構客群最低的交叉比例超過40%以上,也就是借貸機構的100個使用者中可以在這個資料介面中查到其中40人及以上的資料。
還有一些原因是這些資料來源的更新頻率足夠滿足風控公司的要求,特別是高風險名單這些要求是實時的,而身份證要素這些則無需更新實時問題也不大。
資料型別主要有:
大資料風控需要的資料型別這麼多,那來源是哪裡,或者說這些資料掌握在哪些機構中?
其實以上源頭直接從事資料輸出業務的只是一小部分,原因是大部分源頭公司對資料合規輸出及場景管理無專門部分負責,而且資料業務盈利不是其主要的業務。
因此活躍在大資料風控行業,提供資料業務的是一些通過相關關係獲得代理權的資料代理商,及為這些源頭公司提供系統服務的系統商。
十、人工規則及機器模型
大資料風控的實現方式是傳統風控的專家經驗模型、及現今依賴演算法模型兩種方式結合較多。原因是演算法模型在大多數常規情況是可以準確識別風險情況,但少部分特殊情況需要人工參與干涉修正及調優的。
專家經驗模型的流程是將遇到的新問題(新申請使用者的資料)作為入參,風控專家根據歷史出現的情況(不同客群的好壞表現)歸納起來,從中找出相關規律(A客群對應好的,B客群對應壞的,C客群沒遇到過,但可能是好的等),從而判斷新問題可能發展的路徑情況(新客戶貸後是好的或者壞的)。
演算法模型,主要依賴統計學公式,流程是將新資料(新申請使用者的資料)作為入參,演算法模型(隨機森林、決策樹、邏輯迴歸等)在大量的歷史客戶樣本餵養後,已經可以區分出不同客群的好壞表現,從中而判斷新使用者在模型結果中對應的是好還是壞客戶分類。這其中會引入第三方的資料來源(KS 、IV、AUC等都是判斷第三方資料有效性的指標),看哪些資料能夠提升演算法模型的識別準確率。
其實從流程看出,演算法模型無非把人工經驗環節換成了演算法模型替代,以此實現批量找出能夠判斷好壞客戶的規律,並將其標準化。但遇到一些不在歷史資料中的情況時,演算法模型就可能無效,需要人工參與調優,為了解決新問題演算法模型表現不太好的情況,現在有機構嘗試用新的演算法或邏輯去模仿人工調優這個工作。
十一、大資料風控的產品形態
大資料風控行業中最常見的產品形態有4種:
API介面及SDK一般是有風控模型團隊機構需求較大,需要詳細欄位入參來餵養模型;部分無模型團隊的機構,但有技術部門支援開發的,一般喜歡直接採用API的評分或H5報告;而機器模型及決策引擎主要是有錢但不熟悉風控行業或者現有技術團隊不熟悉大資料風控的,會直接購買模型及決策引擎直接啟動信貸業務。
以上的產品形態主要還是針對B端客戶,有些大資料風控機構開拓C端業務的推出APP內建報告的產品形態。
最後
大資料風控是個很複雜的體系,其在個貸風控領域的應用已相對成熟,這個場景的競爭現處於白熱化階段,已知這個細分市場的風控產品的創新已經到了一個瓶頸,無論機構大小隻能圍繞資料覆蓋率及風控識別能力兩個維度進行優化。
同時由於有消費金融需求的個體基本都得到了剛好甚至超出其還款能力的信貸服務,因此開拓新客群的獲客成本明顯高於前兩年,這是大多金融機構合規產品獲利能力無法覆蓋的,規模維穩甚至緊縮的情況導致提供個人風控的大資料風控機構的收入水平其實在下降。
另一個狀況是針對小微企業端的風控服務重新被大資料風控機構重視並逐漸加大研發力度,望在小微企業風控的白熱化到來前,先佔據一定的市場規模,形成有力的壁壘活下去。
#專欄作家#
大資料獵人,微信公眾號:date-hunter,人人都是產品經理專欄作家。多年金融行業(基金、理財、保險、信貸等行業)相關戰略研究、行業分析、商業模式搭建經驗,熟悉金融+大資料+風控+營銷領域。