矽谷AI創業者謝映蓮:5G對AI反欺詐行業提出更高要求
“人工智慧的本質是一項技術或者手段,並非有了它就可以解決所有問題。”近日,人工智慧反欺詐公司DataVisor CEO、卡耐基梅隆大學電腦科學博士謝映蓮在上海接受了澎湃新聞的專訪。謝映蓮是AI行業為數不多的女性創業者,在創業之前,她是微軟矽谷研究院的資深研究員。專訪中,謝映蓮與澎湃新聞分享了離職創業的經歷和她對無監督學習技術的理解。談到正在加速落地的5G技術,謝映蓮認為,5G將帶來更高的頻寬速度和更多的IoT裝置,為欺詐者提供更多的資源和可能性,也對反欺詐行業裡的AI公司提出更高技術要求。
謝映蓮 創業邦 圖
謝映蓮於1999年從北京大學計算機科學系畢業,後赴美國卡耐基梅隆大學深造,先後獲得電腦科學碩士和博士學位。2006年8月,在擔任博士後研究員一年之後,謝映蓮加入了微軟矽谷研究院。在微軟的七年,謝映蓮參與開發了一系列基於微軟Hotmail社交圖以對使用者進行認證的系統架構,以及降低信用卡實時交易風險演算法等產品。
2013年底,謝映蓮離職創業。她和同事俞舫創立了一家運用人工智慧無監督機器學習技術捕捉欺詐和洗錢攻擊的人工智慧公司DataVisor維擇科技,主要從事金融、社交、電商、移動應用的反欺詐和反洗錢等業務。該公司於2013年底初創於美國矽谷,2016年進入中國,在加州山景城和北京朝陽區設立雙總部。據謝映蓮介紹,目前,DataVisor的中國團隊和矽谷團隊各有70餘人。除了中國和美國,公司客戶還分佈在東南亞、德國、英國、法國、西班牙等地。該公司在中國的主要客戶包括阿里巴巴、京東、平安銀行、財付通、獵豹移動、餓了麼、微店、陌陌和大眾點評等。
2018年6月,DataVisor被《華爾街日報》評選為 “2018年最值得關注科技公司Top25”。
出走微軟,我沒準備好
在微軟的7年時間裡,謝映蓮觀察到,隨著各行各業的數字化和移動網際網路的普及,欺詐產業鏈逐漸形成。在這條產業鏈上,有提供IP地址的供應商,出售手機外掛的小販,專業“養號”和提供“薅羊毛”攻略的人士,還有人提供可供隨時修改的郵箱地址……欺詐產業鏈上的人們就像一支建築施工隊,以電商“薅羊毛”行為為例,這些人四處尋找首單優惠或是高額優惠券,哪裡有需要就往哪鑽。
資料科學家的敏銳觀察力讓謝映蓮發現了社會對反欺詐的需求,而她剛好有這樣的技術。身處工業界的研究院,謝映蓮希望自己能把創新快速落地轉化成生產力。但現實中的各種限制讓她看到了學術和工業的鴻溝,也使她產生了離職創業,把技術轉化成產品的念頭。
在決定離職創業之前,與部門領導的兩次對話讓如今的謝映蓮記憶猶新。
“你們倆知道創業是怎麼回事嗎?是不是應該先搞清楚創業是什麼,然後再看看自己準備好了沒有?”聽罷謝映蓮和同事俞舫的創業想法,部門領導問出的一連串問題考住了這兩位博士。在部門領導的牽線下,兩人拜訪了一些創業人士。兩週後,她們回到部門領導的辦公室,向領導彙報說:“根據瞭解的情況,我們沒有準備好,但萬事總有個開頭,我們還是決定去創業”。
五年後再次回想起當時的心境,謝映蓮對澎湃新聞記者說,“雖然當時沒能做到最好的準備,但我們都覺得做這件事情的第一要素是全身心投入到事情本身。”
面對兩人的離職,微軟的同事們給出了截然不同的反應。有人覺得她們不可思議甚至有點魯莽,也有人鼓勵說,我一點都不驚訝,你們就該創業。
2013年感恩節前夕,帶著不解和鼓勵,謝映蓮和俞舫在微軟研究院合影留念,與同事告別,從此開始了兩位女性AI科學家的創業之路。
資料貼標人與無監督學習
近幾年,人工智慧產業的快速發展催生出一個新的職業——“資料貼標人”。這些人的工作是坐在電腦前,點選幾十、上百張圖片,為圖中的特定物品打上標籤。這項簡單的重複性勞動為不少人工智慧公司的演算法提供訓練資料集。
在機器學習領域,其中一種常見的學習方式是監督學習(supervised learning),即為每個樣本提供預測量的真實值,這在有些應用場合是有困難的。比如醫療,如果要通過監督學習來獲得診斷模型,則需要請專業的醫生對大量的病例及它們的醫療影像資料進行精確標註。這需要耗費大量的人力,代價高昂且難以保證質量。職業資料貼標人的工作就是如此。
謝映蓮希望採用一種更為智慧的方式,她想到了無監督學習。在反欺詐領域,所謂“無監督學習”指的是在沒有訓練標籤和歷史欺詐樣本的情況下自動檢測各類新型攻擊,發掘未知的系統性和規模性風險,並在攻擊者發起破壞前阻止他們。
除了減少對標籤的需求,無監督學習還可以抓取到人們想象不到的欺詐行為。通過多年的觀察,謝映蓮發現,欺詐者的行為總是不斷地變化,事先設計好的檢測規則總有一天會被攻破。她認為,面對處於變化中的欺詐行為,只有運用無監督學習,“以不變應萬變”,把欺詐行為的變換特徵抓出來,才能起到智慧的防範作用,而不至於總是追著欺詐者跑。
謝映蓮最終選擇了無監督學習作為公司的技術路徑。最近,她和團隊推出了一款平臺型反欺詐產品“DCube”。結合無監督學習和傳統機器學習方法,該平臺允許使用者主動實時監測和阻止欺詐行為。謝映蓮稱,這款產品不僅讓客戶先於惡意攻擊者一步,同時也賦予他們更多掌控權。
不再是少數群體
麥肯錫全球研究院2018年4月釋出的《平等的力量:亞太地區》報告顯示,在東亞的一些國家中,對應於每100名男性,女性領導者的人數僅為12至20名。
同樣的情況也發生在美國。2017年,一位谷歌工程師在內部論壇發文稱,由於生理差異,女性不如男性適合程式設計和領導,並表示既然女性不如男性,谷歌就不應該推行員工性別均衡,否則對男性不公。這番言論鮮活地詮釋了人們對女性的偏見——不善領導、不善程式設計等理工科職業。
對於這些偏見,謝映蓮表示,兩性在科學和工程領域的表現差異正在縮小,而且,女性具有細緻鑽研的精神,在資料科學領域具有一定的優勢。
謝映蓮介紹,在她曾經就讀的卡耐基梅隆大學計算機系,出現過一屆畢業生中沒有一位女性的情況。但目前,卡耐基梅隆大學計算機系的本科入學比例已經達到男女比1:1,學校為此做了許多努力。
作為一位女性人工智慧企業CEO,謝映蓮希望能夠推進女性在電腦科學領域的發展。她在母校卡耐基梅隆大學設立獎學金,鼓勵女博士去參加各類學術會議,還去高中演講,鼓勵女中學生學習電腦科學。謝映蓮所在的公司就是由她和另一位女性電腦科學家俞舫共同創立的。
2019年3月4日,謝映蓮在斯坦福大學舉辦的全球女性資料科學會議上發表演講。她對澎湃新聞記者說,面對在場的數百位女性資料科學家,她感到十分鼓舞,“我們女性資料科學家不再是少數群體了,會逐漸壯大起來”。在結束斯坦福演講後不久,謝映蓮被評選為網路安全北美“年度女性”金獎,這是該獎項設立以來首次由一位人工智慧公司的華裔女性CEO獲此榮譽。