1. 程式人生 > >金融領域如何基於大資料做風控

金融領域如何基於大資料做風控

金融主要分為資產、負債和非息業務。現在的很多網際網路金融產品也都是基於這些業務衍生出來的,例如三方支付、投資理財、P2P、消費信貸、分期、白條等等,而在這其中P2P、消費信貸、分期、白條等都屬於信貸類業務,對於信貸類業務,其核心就是風險控制。

貸款的風險控制分為貸前,貸中,貸後三個階段貸前調查是指貸款發放前銀行對貸款申請人基本情況的調查,並對其是否符合貸款條件和可發放的貸款額度做出初步判斷;貸中主要是貸款人的資訊審查以及在貸款調查、審查意見的基礎上,按授權許可權進行審批,決定貸與不貸,貸多貸少以及貸款方式、期限和利率;貸後管理是指從貸款發放或其他信貸業務發生後直到本息收回或信用結束的全過程的信貸管理,包括貸款發放後,貸款人

對借款人執行借款合同情況及借款人的經營情況進行追蹤調查和檢查,如果發現借款人未按規定用途使用貸款等造成貸款風險加大的情形,可提前收回貸款或採取相關保全措施。

貸前檢查決定使用者可以得到多少的授信以及是否具備貸款的償還能力,包括使用者的基本情況、財務狀況、信用狀況、經營情況、自身素質、擔保情況等等,可以說貸前是大資料可以施展的重要環節,可以通過大資料獲取使用者更完善的徵信資訊,為授信提供依據。


通過大資料,可以對使用者的每項調查進行打分,最後通過相關的運算得到使用者總的信用得分,得分越高的使用者越容易獲取貸款。其實這也就是貸前檢查中常用的打分卡技術(另外一個常用的方法是德國IPC技術)。


打分卡使用場合很多,包括營銷評分、申請評分、行為評分、回款催收評分等等,按照具體的產品還可以分為信用卡、車貸、房貸、經營性貸款評分等等,還有按照不同地域的評分等等。根據不同的業務戰略,打分卡的各項引數要做設定。

打分卡開發方法,包括邏輯迴歸、神經網路、決策樹、馬爾科夫鏈、生存分析等等,用的最多的,還是傳統的邏輯迴歸,採用邏輯迴歸的打分卡開發基本流程大致為選取樣本、定義好壞標準、尋找可用變數、選擇變數、評分模型開發、設定取捨點(cutoff)六個過程,其主要工作量在前面幾部。打分卡模型一般包含15個左右變數,這是由於變數之間一般都會有耦合,比如職務和職稱,職務高的人一般職稱也高,但不應該重複計算。如果變數太多,去掉變數間耦合會比較困難,也會使模型不穩定,某個變數的小小變化可能導致分值變化很大。

打分卡技術相對於其他技術,可以有效的減少人工干預,甚至做到自動放款,因此也是網際網路金融中使用的比較多的方法。

大資料做徵信,關鍵的一點還是資料要全、要廣泛、要有深度,並通過相應的規則將分散的結構化和非結構化的資料轉化為可用的授信評分。在此過程中,需要對不同的資訊採用不同的模型進行計算,並在實際執行過程中不斷的對徵信模型進行優化


大資料在貸中和貸後主要是側重於動態的進行授信再評估,對已經放款的貸款進行監控,當發現對貸款償還產生影響時可以及時進行預警。對於銀行而言,將貸款的還款能力分為五個等級,分別為正常、關注、次級、可疑、損失:

正常:正常是指借款人申請了貸款後,一直能夠正常的還本付息,銀行對借款人可以按期償還貸款有充分的把握,貸款的損失率為零;

關注:關注類是指借款人目前有能力償還本息,但有一些因素可能會干擾償還貸款,銀行判別貸款的損失率為百分之五;

次級:次級表示借款人的還款能力出現了明顯的問題,依靠其目前的收入情況無法正行還款,需要通過抵押或者融資的方式才能還清貸款。貸款損失率在百分之三十到百分之五十之間;

可疑:可疑表示借款人已無法償還貸款,就算是通過抵押或者擔保的方式還款也會造成一定的損失。貸款的損失率在百分之五十到百分之七十五之間;

損失:損失是指借款人無論採取何種方式都無法償還貸款。貸款損失率達到了百分之七十五到百分之一百之間。


大資料風控是一個廣義詞和一個時代的熱詞,量化風險控 制就是利用資料分析和模型進行風險評估,依據評估分數,預測還款人的還款能力、還款意願、以及欺詐風險。

大資料主要是指全量資料和使用者行為資料,目前領先的資料風控或者大資料風控使用的還是小資料,使用的是圍繞客戶周圍的信用資料,這些資料的特點是和使用者的信用情況高度相關。之所以叫做大資料風控,完全是一個是時代用語,確切地說就是利用資料實施科學風控。

(關注微信公眾號,獲取更多內容)