1. 程式人生 > >三分鐘看懂大資料風控中使用者行為資料的採集、分析及應用( 轉 )

三分鐘看懂大資料風控中使用者行為資料的採集、分析及應用( 轉 )

據統計,目前銀行傳統的風控模型對市場上70%的客戶是有效的,

但是對另外30%的使用者,其風控模型有效性將大打折扣。

大資料風控作為傳統風控方式補充,主要利用行為資料來實施風險控制,

使用者行為資料可以作為另外的30%客戶風控的有效補充。

那麼,大資料風控運營中,會主要分析使用者的哪些行為資料,怎麼分析?

1.行為資料的採集和分析

使用者行為資料:主要包含使用者在網站和移動App中的瀏覽/點選/發帖等行為,行為資料其實有很大的商業價值,

只是很多企業不知懂如何進行應用。

使用者行為資料採集基本上採用SDK方式,採集使用者在頁面的點選行為,同時也可進行引數回傳。

SDK就是幾行輕量級程式碼,採集資料的型別取決於埋點。SDK在資料採集上沒有技術壁壘,

行為資料應用的主要技術壁壘在於海量行為資料的處理和分析。

(1)SDK採集資料的私密性?

很多企業總認為SDK採集資料會涉及個人隱私,這主要還是不瞭解SDK資料採集的技術原理。

SDK,Software Development Kit,直譯過來就是軟體開發包,用N行軟體程式碼採集資料。

SDK採集的任何資料都來自使用者的主觀行為,企業在正常商業活動中獲取的個人隱私資料並不違反法規,

在沒有得到使用者授權的情況下,個人隱私資料被企業和第三方使用才是違法行為。

(2)資料處理與分析,有多難?

使用者行為資料的處理和分析具有較高的技術門檻:

SDK會採集到大量的“髒資料”,包含一些空白區域和特殊符號,甚至根本沒有見過的資料型別,

這些髒資料的處理和分析具有較大的技術挑戰,特別是資料的實時採集和處理。

通常技術人員只有經歷了海量資料採集和處理,填平了大量“技術坑”之後,才能形成成熟的技術架構。

資料的採集和處理是個髒活累活,需要在真實資料環境進行實戰,具有較高的技術壁壘和門檻。

2.個人信用評分

風控最好的資料還是金融資料,例如年齡、收入、職業、學歷、資產、負債等信用資料,

這些資料同信用相關度高,可以反映使用者的還款能力和還款意願。 但是除了這些強相關的資料,

一些使用者行為資料對信用風險評估也具有較大的影響,

在某些條件下這些因素會成為決定信用風險事件的強相關資料。

過去這些使用者行為資料,並沒有放到信用風險評估模型中,沒有參與客戶的信用風險評估。

金融企業和網際網路金融企業在分析已經發生的信用風險事件之後,

發現的這些使用者行為資訊在很多風險事件中起到了很關鍵的作用。

小概率風險事件會導致很嚴重的後果,同信用風險事件的發生具有較強的關聯性。

使用者行為資料可以作用於互金的各個環節。雖然這個資料你看著跟金融業務沒有那麼相關,

但是物以類聚、人以群分這個事是沒有錯的,這些人的行為確實是有一定規律的,

所以如果我們有一些標識的資料通過對他的行為相近性進行判斷,效果還是不錯的。

 

第一方面:完善客戶畫像

客戶畫像就是對使用者打標籤,以表示不同屬性的使用者。例如打上性別標籤、年齡標籤、消費偏好標籤。

這點在電商行業已被廣泛運用。

客戶畫像的原理是,通過樣本資料學習不同標籤使用者的行為特徵,

再根據學習到的知識來將未知標籤的使用者進行分類。

 客戶畫像的應用面非常廣泛。在網際網路金融的風險控制上可用於徵信評級,

反欺詐風險控制以及動態調整級別和監控(增收和降低壞賬率)、快速放貸和提升金融服務水平。

客戶畫像包括人口統計學特徵、消費能力資料、興趣資料、風險偏好等;

企業客戶畫像包括企業的生產、流通、運營、財務、銷售和客戶資料、相關產業鏈上下游等資料。

值得注意的是,金融機構擁有的客戶資訊並不全面,基於平臺自身擁有的資料有時候難以得出理想的結果甚至可能得出錯誤的結論。

所以金融機構不僅僅要考慮自身業務所採集到的資料,更應考慮整合更多的行為資料,

以擴充套件對客戶的瞭解。包括:客戶在社交媒體上的行為資料(如光大銀行建立了社交網路資訊資料庫)。

通過打通銀行內部資料和外部社會化的資料可以獲得更為完整的客戶拼圖,從而進行更為精準的營銷和管理;

客戶在電商網站的交易資料,如建設銀行則將自己的電子商務平臺和信貸業務結合起來,

阿里金融為阿里巴巴使用者提供無抵押貸款,使用者只需要憑藉過去的信用即可;

企業客戶的產業鏈上下游資料。如果銀行掌握了企業所在的產業鏈上下游的資料,

可以更好掌握企業的外部環境發展情況,從而可以預測企業未來的狀況;

其他有利於擴充套件銀行對客戶興趣愛好的資料,如網路廣告界目前正在興起的DMP資料平臺的網際網路使用者行為資料。

第二方面:欺詐行為分析

風險管理的核心應用在反欺詐上,金融行業的反欺詐驗證。

第一點:可以通過分析使用者的社保資料、運營商資料、網路行為資料(職業、收入等預測畫像…)來進行規避。

第二點和第三點:實時分析資料進而監測潛在風險並預警,實時監控系統內的各類資料。

例如:使用者操作、交易流水、訪問記錄等如某內部工作人員在某段時間內操作存貸/匯交易的時間大幅度快於其歷史水平;

比銀行平均水平也要快出很多;內部員工每個月由其自己賬戶向幾家銀行匯款或支付好幾家信用卡;

美國這2-3年留學生臨到畢業之前的2-3個月,信用卡消費是歷史平均的好幾倍甚至更多

(如果能結合網路行為資訊:查詢來源國工作,航旅公司機票那確定性…)美國留學生這個是個很經典的案例。

簡言之,通過對使用者行為資料的採集和分析,找出欺詐者留下的蛛絲馬跡,從而預防欺詐行為的發生。

其現實意義在於提升壞人的欺詐成本,在欺詐行為發生之前就將其制止,進而淨化誠信體系。