AI入局,一把揪出 “畫風異常”的金融交易
在近日結束的“黑色星期五”搶購大戰中,你用信用卡在境外網站為自己買下一個心儀已久的包。
幾秒後,信用卡開戶銀行給你打來電話。“剛剛您的信用卡有一筆××美元的消費,請問是您本人嗎?”
你可能覺得貼心,也可能感到不耐煩。此時,起作用的就是銀行的反欺詐監測系統。更多時候,它進行事後確認。
但在一些金融機構,你的賬戶安全正在由機器守護,它更加敏銳。此時,你可能會接到這樣的電話:“剛剛,有人試圖盜刷您的信用卡,請您注意賬戶安全。”
一切在你未察覺時就已被終止。
特徵總結高手,兼顧效率和準確率
“欺詐和反欺詐的攻防戰是長期存在的,有貓就會有老鼠。”智慧金融企業騰梭智慧首席風控官郭曦表示,欺詐是一個長期存在的黑色產業鏈,也是金融行業一直為之頭疼的問題。
對業務交易階段的欺詐風險,金融機構通常採取的方法是設定專家規則。專家規則主要針對新發生的、共性明顯、風險特徵突出的欺詐行為進行攔截。專家規則不依賴於長期歷史資料,更多依靠專家經驗指導。
無論是專家規則,還是現在人工智慧企業採用的機器學習,都是要識別特徵,總結規律。比如說,盜用賬戶的人可能會大量使用不同的賬號和密碼組合來嘗試登入,那麼,同一臺裝置短期內登入過多賬號就會被定義為一種異常行為,這就成了金融機構反欺詐系統中的一條規則。
“如果使用傳統反欺詐手段,這些規則很容易被繞過去,畢竟人能處理的資訊有限。”郭曦說。
現在擺在你面前的是成堆的欺詐事件,每個事件又關聯著它發生的時間、地點和使用者行為。你可以手動分析,但也可以將這些資料交給機器。畢竟,人工智慧是特徵總結的高手,效率和準確率兼顧。
從本質上來說,這也是一個找不同和分析不同的過程——一樁交易如果看起來“骨骼清奇”,和其他本本分分的交易並不一樣,機器就能將它一把揪出。
無監督還是有監督?適用最重要
人工智慧做風控,目前主流的訓練方法,還是有監督學習。
有監督學習,顧名思義,就是“有人盯著”。人工智慧被“投喂”的,是金融機構已經標註好的“正常”和“異常”事件。
通常情況下,如果使用者賬號被盜用,只要他有所察覺,都會向銀行反映。因此,銀行能夠積累起一定數量的標註好的資料集,這些也就是人工智慧進行訓練時的“標準答案”。要是機器判斷對了,就給它獎勵,讓它記得更牢一點。
最近,也有科技金融領域的公司表示,無監督學習可以在沒有標註的情況下,提前阻止未知欺詐。還有人指出,在安全領域的反欺詐中,無監督機器學習技術能表現得比有監督學習更好。
無監督學習真有這麼神奇?
“簡單來講,無監督學習就是‘聚類’。”郭曦告訴科技日報記者,機器可以根據使用者交易過程中的各類資料特徵,將相似的聚集在一起,分成不同型別。但無監督學習並非完全脫離“人工”,其效果的好壞很大程度上依賴於人對業務場景的理解和資料特徵衍生的經驗。簡單暴力的聚類,很容易出現“尷尬”——“你希望機器按照‘正常’和‘異常’來分類,但可能機器最後分出來的,是賬戶本身‘有錢’和‘沒錢’,是使用者為‘女性’還是‘男性’,那這種分類的參考價值就不高。”
第四正規化反欺詐業務負責人王明向科技日報記者進一步解釋,無監督學習主要是檢測“異常”,但“異常”只是“和其他不一樣”,它本身沒有直接對應的實際業務含義。欺詐團伙相對其他人是“不一樣”,某個暴發戶相對其他人還是“不一樣”。所以,非監督學習應用抓的是“不一樣”,而不一定是“欺詐”或者某一個確定的業務目標。
無監督學習聽起來有種“我們不一樣”的豪情,但它在工業上的應用比較有限,主要用於行為異常檢測和CRM客群劃分。在郭曦看來,採用無監督學習,有時是“巧婦難為無米之炊”情況下的無奈之舉。“在有些應用場景中,有標籤的資料確實比較寶貴,此時就只能用無監督學習”。
以反欺詐領域為例,已有的欺詐樣本就未必完全準確。有些時候,欺詐在業務開展中已不知不覺發生,被標註為“正常”的事件,其實可能就是一次欺詐事件。“資料集不夠乾淨,好樣本和壞樣本分不清楚,就會影響學習的準確度。”郭曦坦言,在有些銀行,確實缺少有標註的欺詐案例,因為他們用繁複的驗證手段提高了欺詐門檻。這也是雙刃劍——保護賬戶安全的同時,也犧牲了一部分使用者體驗。
在業務的冷啟動階段,無監督學習是一種不錯的選擇,可以幫助業務找出沒有指向性的“不一樣”的集合。當系統運行了足夠長時間,積累了足夠多業務標籤之後,就需要基於業務標籤來進行有監督學習,來進一步提高直接決策的效率。
所以,無監督學習沒有那麼厲害,有監督學習也並不“out”。“技術不在於好壞,關鍵在於適用。”王明說,合適的方案是基於無監督學習做初步篩選,基於有監督學習做整體的決策。
道高一尺,魔高一丈,一直都在較量
欺詐手段一直在“升級換代”。有文章分析,其精準化和高科技化趨勢明顯,欺詐行為已向產業化發展,在網路詐騙、虛假申請、釣魚、偽卡等領域形成了上、中、下游結構完整的黑色產業鏈。產業鏈上端為“技術工程”派,竊取資訊;產業鏈下端是“社會工程”派,購買資料資訊後,利用消費者心理弱點,進行盜竊、詐騙或敲詐。
同時,想要盜用賬戶的人,肯定會不斷嘗試,來摸清並想辦法繞過你的規則設定。所以,系統收集的資料越全面,維度越豐富,欺詐者留下的蛛絲馬跡越多,它就能判斷得越準確。“我們可以做到每天甚至更短的時間更新一遍模型;所以,即使是昨天出現的欺詐手段,人工智慧都能辨別。”王明強調。
根據艾瑞諮詢釋出的《2018年中國人工智慧+金融行業研究報告》,資本方對人工智慧+金融行業的投資熱度也在持續升溫,從2016年起,每年的融資時間數量均超過30起,其中,智慧風投和智慧投顧領域最受追捧。
行業有需求,自然會有越來越多的公司進入。但有金剛鑽才能攬下瓷器活。“反欺詐領域有自己的特點,金融機構交易量龐大,重視使用者體驗,對整個系統的響應時間以及效果要求非常高。”王明也能感到,“從真正整體落地能力上看,實際能在這一領域‘一起玩’的公司並不多。”