1. 程式人生 > >人工智能與金融

人工智能與金融

結構化 網站 通過 答復 聯網 人員 這一 商品 提升

目前金融機構的主流玩法有四種: 1. 投資銀行和賣方研究嘗試自動報告生成,2. 金融智能搜索;3. 公募、私募基金在通過人工智能輔助量化交易;4. 財富管理公司在探索智能投顧方向。

昨天我們重點討論了 自動報告生成和人工智能輔助交易,戳這裏回到昨天主題

今天我們再聊聊金融智能搜索和智能投顧這兩個話題。

#人工智能與金融結合的思考#

| 文因新三板、維基百科、上市公司公告

編輯:對沖研投 轉載請註明出處

3

金融搜索引擎

券商/私募基金研究員在進行研究工作的時候需要搜集海量信息,再整理和分析其中內容,如上下遊分析,對標企業研究,競爭對手研究,企業亮點/風險點分析等等。

然而目前絕大多數證券分析師所運用的輔助研究軟件如Bloomberg數據終端只解決了基礎數據問題,而沒要考慮到信息量過載的問題。這使得研究員在面對大量基礎數據與爆炸的信息時無法尋找到最有準確有價值的信息,也無從提高其工作效率。

金融搜索引擎的背後核心技術是高質量的知識圖譜和大量的業務規則,幫助實現聯想、屬性查找、短程關系發現。探索引擎,如分面瀏覽器,也是在知識圖譜的基礎上,則提供了人機協作的界面,讓人對數據的探索過程可以很方便地被記錄、叠代、重用。此外推薦系統和推送系統也非常有用,幫助金融用戶聚焦在關鍵數據上,更省時省力地做投前發現和投後跟蹤。

其中語義搜索就是提供不同類型的查詢(比如企業、基金、事件等),如智利地震對銅期貨的影響,中東危機對整體貨幣市場的影響等。再將信息切片後再聚合,提供縱覽的可視化元素,比如影視傳媒相關定增的平均市值和融資市盈率。

語義搜索將復雜查詢交給用戶完成,如尋找VR的上遊企業,當搜索提供不了準確上遊的信息時,會推薦攝像頭的企業給用戶,並提供一個方便的交互界面,交給用戶去進行一些復雜的過濾。Alphasense就是這樣一個在數據層面上輕量級,將復雜邏輯判斷交給用戶去完成,專註於解決專業信息獲取和碎片問題的金融搜索引擎。Alphasense面向金融投資領域,從文件/新聞和研究中集合所有投資信息並進行語義分析,在全球公司數據中進行趨勢分析。其使命願景是從大量噪音中尋找有價值的信息,專註信息豐富度和碎片化基本問題,從而大大提高金融人士的工作效率,節省工作時間。

4

智能投資顧問

傳統投資顧問需要站在投資者的角度,幫助投資者進行符合其風險偏好特征、適應某一特定時期市場表現的投資組合管理。而這些工作都需要以大量昂貴的人工方式完成,所以財富管理服務也因此無形的提高了進入門檻,只面向高凈值人士開設。

但是現在,智能投資顧問(robot advisor)正在以最少人工幹涉的方式進行投資組合管理,管理你的資產的可以是一排計算機,而你也不用是高凈值人士。並且智能投顧在以更強大的計算機模型運用人工智能的技術對大量客戶進行財富畫像,以人工智能算法為每一位客戶提供量身定制的資產管理投資方案。

Wealthfront就是一家非常具有代表性的智能投顧平臺,借助於機器與量化技術,為經過調查問卷評估的客戶提供量身定制的資產投資組合建議,包括股票配置、股票期權操作、債權配置、地產資產配置,旨在提供一個自動化的投資管理服務最大化投資回報。Wealthfront在進行自動化投資管理時一共有5個步驟:

確定當前投資環境的理想資產類別

以最低成本的ETF(交易型開放式指數基金)代表每一資產類別

確定風險承受能力並創建合適的投資組合

將現代投資組合理論(MPT)分散風險

定期監控並重新調整平衡投資組合

而這一投資方法也受到市場的肯定,Wealthfront管理資金規模在2015年至2016年終增長將近64%,截至20162月底,Wealthfront的資產管理規模已達近30億美元。

在獲得市場肯定的背後,是對智能投顧的信心。智能投顧能夠戰勝人性,避免投資人受市場變化而產生不理性的情緒化影響,使機器嚴格執行事先設定好的策略。並且智能投顧擁有比傳統財富管理機構、私人銀行更為透明開放的信息披露,及時提供風險提示,極大的減少了資產托管人與管理人之間的信息溝通壁壘

Betterment也是一家專註於智能投資管理的金融科技公司,通過Markowitz 資產組合理論和各種金融衍生模型們應用到產品中,在雲端低成本、快速、批量化地解決各種數據運算,再根據用戶的傾向和設定的風險偏好,個性化地提供資產配置組合方案。其創始人Jon Stein曾在華爾街某金融機構任職高級投資顧問,致力於打造Betterment成為一款讓投資更方便,更準確的智能投顧。20163月,Betterment獲得E輪融資1億美金。而由兩名微軟前員工創立的FutureAdvisor是一家專註於養老金理財市場的智能投顧公司。FutureAdvisor為面對有很多不同的財務賬目,退休金,儲蓄,股票,甚至一些CDs或債券但卻不知道如何做出正確的選擇的客戶服務。 FutureAdvisor利用智能算法實時監測理財賬戶,尋找節稅機會並調整多個賬戶。除了提供免費的投資組合優化以及投資數據的同源整合, FutureAdvisor也提供收費版投資代理服務。目前 FutureAdvisor2億美元估值被全球最大基金管理公司BlackRock收購。(schwab intelligent portfolios投資組合收益圖)

在面對變化莫測的金融市場時,Charles Schwab(嘉信理財)旗下推出的智能投顧產品schwab intelligent portfolios則能以蒙特卡洛模擬動態市場上的投資組合表現進行投後跟蹤。同時在投資組合虧損的同時,機器會自動進行稅收虧損收割,即將賣出虧損的證券遞減一部分資本利得稅。而當投資組合偏離預先設定的風險容忍度與資產配置建構時,機器會自動通過一系列買進與賣出的行為進行資產平衡的調整

智能投顧使人工智能技術不再遠離人群,真正使得每一位普通人都能享受到智能金融科技公司所帶來的好處,也讓許多曾經認為“人工智能是遙不可及”的人認識到智能金融公司不僅僅只服務於金融行業的專業人士,而是可以為整個商業社會相關的群眾創造價值。

當人工智能不再是新鮮事的時候,投資銀行與證券研究自動生成報告、人工智能輔助量化交易、金融搜索引擎證券研究和智能投資顧問財富管理這四種人工智能和金融結合的主流玩法讓我們看到在未來,金融和人工智能結合成為智能金融的無限可能。

而智能金融正在以一種人機結合的方式去提供大量的輔助決策工具,讓投資人在形成邏輯鏈條的過程中,更容易地獲得數據和分析層面的支持,才能以更多的精力去發現機器不善於完成的工作,從而大大提高工作效率。

5.概括:人工智能步入金融領域深度專題報告。一:自動報告生成主要運用自然語言處理(NLP)中的兩種技術。真正生成報告還需要利用以上技術完成3個步驟:1.處理海量異構數據,2.分析數據3.文章生成。二:人工智能如何輔助量化交易 1. 機器學習:從數字推測模型 , 2.自然語言處理:把握市場動態, 3. 知識圖譜:減少黑天鵝事件對預測的幹擾。

文本:關於人工智能如何結合金融的話題,研投菌早就想做一次專門討論,趁著國慶假日,我們花點時間做一次全面的透視如何?

目前金融機構的主流玩法有四種: 1. 投資銀行和賣方研究嘗試自動報告生成,2. 金融智能搜索;3. 公募、私募基金在通過人工智能輔助量化交易;4. 財富管理公司在探索智能投顧方向。

由於篇幅所限,本文重點討論自動報告生成和人工智能輔助交易,明日將對後兩個話題進行交流。文章或許有些專業,但保證不無聊。

#人工智能與金融結合的思考#

自動生成投研報告靠譜嗎?

在投資銀行的投行業務與證券研究業務中涉及大量的固定格式的報告撰寫工作,如招股說明書中的部分章節,研報,以及投資意向書。這些報告撰寫需要大量的投行初級員工進行長時間枯燥繁瑣的數據羅列、整理、反復Copy-Paste工作。

目前,自動報告生成主要運用自然語言處理(NLP)中的兩種技術:

自然語言理解(NLU):將日常話語消化理解,並轉化為機器可後續處理的結構;

自然語言生成(NLG):將由機器拆分好的結構化數據以人們能看懂的自然語句表達出來。

我們可以將這兩種技術理解看成對日常對話這一原料的拆分加工和整裝成可理解的自然語句——最終產品。

然而真正生成報告還需要利用以上技術完成3個步驟:

1.處理海量異構數據將投行分析師需要閱讀的年報,彭博新聞社的實時新聞以及數據,行業分析報告,以及法律公告等資源進行消化。其中對於文本中的圖片和表格需要OCR(光學字符識別)等技術解析。

2.分析數據

這一過程涉及運用知識圖譜中常用的知識提取與實體關聯將其關鍵邏輯主幹抽出,結合事件地點等因素,將關鍵信息嵌入預先設計好的報告模板中。

3.文章生成

經過處理海量異構數據與分析數據的過程後,即可生產新聞,券商分析研報,上市招股書,企業年報,定增公告,甚至基金研究員開每日晨會所需的投資建議書也都可以用類似方式生成。用戶只需選擇符合其需求的模板確定主題與關鍵信息,以及報告呈現形式,便可生成基本內容。而且投行分析師可以進行校對與人工二次編輯,加入有價值的觀點與結論,並提升報告精準度。

自動報告生成已經被廣泛的運用到新聞行業中,代表的科技公司有美聯社投資的Automated Insights已為美聯社自動生成出10多億篇文章與報告。法國公司Yseop可以每秒生產3000頁內容,支持英語,法語,德語等多種語言,產品廣泛用於銀行、電信公司的客戶服務部門以及財經新聞網站。但是一些科技公司已經不僅僅滿足於為新聞行業提供自動報告生成的服務。

Narrative Science由西北大學的新聞系和計算機科學系的聯合創立,旨在通過給定主題的數據分析,自動生成文章報告。該公司的著名數據分析平臺Quill可以分析結構化數據,將人工智能與大數據進行技術融合,理解這些數據的重要性,從而產生簡短的文字表述或結構化的報告內容。Quill的主要面向對象為——金融服務提供商。

Narrative ScienceCEO Frankel 表示“我們的目標是替代人工做絕大部分基礎工作,讓機器來處理數據和信息”。

2

人工智能如何輔助量化交易

量化交易從很早開始就運用機器進行輔助工作,分析師通過編寫簡單函數,設計一些指標,觀察數據分布,而這些僅僅把機器當做一個運算器來使用。直到近些年機器學習的崛起,數據可以快速海量地進行分析、擬合、預測,人們逐漸把人工智能與量化交易聯系得愈發緊密,甚至可以說人工智能的3個子領域(機器學習,自然語言處理,知識圖譜)貫穿量化交易的始終。

1. 機器學習:從數字推測模型量化交易分析師們對財務、交易數據進行建模,分析其中顯著特征,利用回歸分析等傳統機器學習算法預測交易策略。這種方式有兩個主要弊端,其一是數據不夠豐富,僅限於交易數據,更重要的是它受限於特征的選取與組合(Feature Engineering),模型的好壞取決於分析員對數據的敏感程度。此外一種做法是,模仿專家的行為,選擇某一領域的特定專家,復制他們的決策過程,並導入可重復的計算框架。

全球最大的對沖基金橋水聯合(Bridgewater Asspcoates)早在2013年就開啟一個新的人工智能團隊,該團隊約有六名員工,由曾經供職IBM並開發了認知計算系統WatsonDavid Ferrucci領導。據彭博新聞社報道,該團隊將設計交易算法,通過歷史數據和統計概率預測未來。該程序將隨著市場變化而變化,不斷適應新的信息,而不是遵循靜態指令。而橋水基金的創始人也曾公開表示,其旗下基金持有大量多倉和空倉,投資120種市場,持倉組合高達100多種,並且以人工智能的方式考慮投資組合。Rebellion Research是一家運用機器學習進行全球權益投資的量化資產管理公司,Rebellion Research2007年推出了第一個純人工智能(AI)投資基金。該公司的交易系統是基於貝葉斯機器學習,結合預測算法,響應新的信息和歷史經驗從而不斷演化,利用人工智能預測股票的波動及其相互關系來創建一個平衡的投資組合風險和預期回報,利用機器的嚴謹超越人類情感的陷阱,有效地通過自學習完成全球44個國家在股票、債券、大宗商品和外匯上的交易。

倫敦的對沖基金機構Castilium由金融領域大佬與計算機科學家一同創建,包括前德意誌銀行衍生品專家、花旗集團前董事長兼首席執行官和麻省理工的教授。他們采訪了大量交易員和基金經理,復制分析師、交易員和風險經理們的推理和決策過程,並將它們納入算法中。在量化交易方面的人工智能初創公司有日本的Alpaca,旗下的交易平臺Capitalico利用基於圖像識別的深度學習技術,允許用戶很容易地從存檔裏找到外匯交易圖表並幫忙做好分析,這樣一來,普通人就能知道明星交易員是如何做交易的,從他們的經驗中學習並作出更準確的交易。同時Alpaca也推出AlpacaScan作為對美國股票市場實時反映的的K線圖工具,拋棄二進制濾波的局限旨在提供給交易員用來識別潛在市場變化趨勢的日常必需工具。

坐落在香港的Aidyia致力於用人工智能分析美股市場,依賴於多種AI的混合,包括遺傳算法(genetic evolution),概率邏輯(probabilistic logic),系統會分析大盤行情以及宏觀經濟數據,之後會做出自己的市場預測,並對最好的行動進行表決。 與其類似的公司還有Point72 AssetRenaissance TechnologiesTwo Sigma

2. 自然語言處理:把握市場動態當量化交易分析師發現數字推測模型的局限性後,開始考慮引入新聞,政策,社交網絡中的豐富文本並運用自然語言處理技術分析,將非結構化數據結構化處理,並從中探尋影響市場變動的線索。

率先使用自然語言處理技術的人工智能對沖基金的是今年6月份在倫敦新設的對沖基金CommEqCommEq的投資方法結合了定量模型與自然語言處理(NLP),使計算機能夠如人類一樣通過推斷和邏輯演繹理解不完整和非結構化的信息。

除此之外,也有采用自然語言處理技術的金融科技公司,如由李嘉誠與塔塔通訊投資的Sentient Technologies運用自然語言處理,深度學習(Deep Learning)等多種AI技術,進行量化交易模型的建立。其中最為知名的是號稱”取代投行分析師“的投資機器人——KenshoKensho是一家致力於量化投資大眾化的人工智能公司,旗下有一款產品Warren被稱之為金融投資領域的“問答助手Siri”。Kensho結合自然語言搜索,圖形化用戶界面和雲計算,將發生事件關聯金融市場,提供研究輔助,智能回答復雜金融投資問題,從而加速交易時間,減少成本,用動態數據與實時信息,及時反映市場動態。

這一技術也被廣泛運用於風控與征信。通過爬取個人及企業在其主頁、社交媒體等地方的數據,一來可以判斷企業或其產品在社會中的影響力,比如觀測App下載量,微博中提及產品的次數,在知乎上對其產品的評價;此外將數據結構化後,也可推測投資的風險點。這方面國內的很多互聯網貸款,征信公司都在大量使用自然語言處理技術,例如宜信,閃銀等。另外一些公司則利用這些技術進行B端潛在客戶的搜尋,如Everstring,並將信息出售給其上遊公司。

3. 知識圖譜:減少黑天鵝事件對預測的幹擾

機器學習與自然語言處理的技術經常會在一些意外(如“黑天鵝”事件)發生的時候預測失敗,例如911、熔斷機制和賣空禁令等等。人工智能系統沒有遇到過這些情況,無法從歷史數據中學習到相關模式。這時候如果讓人工智能管理資產,就會有很大的風險。

此外,機器學習擅長發現數據間的相關性而非因果性。很有名的一個例子是早在1990年,對沖基金First Quadrant發現孟加拉國生產的黃油,加上美國生產的奶酪以及孟加拉國羊的數量與標準普爾500指數自1983年開始的10年時間內均具有99%以上的統計相關性,1993年之後,這種關系莫名其妙的消失了。這就是由於自學習的機器無法區分虛假的相關性所導致的,這時候就需要專家設置的知識庫(規則)來避免這種虛假相關性的發生。

知識圖譜本質上是語義網絡,是一種基於圖的數據結構,根據專家設計的規則與不同種類的實體連接所組成的關系網絡。知識圖譜提供了從“關系”的角度去分析問題的能力。就金融領域來說,規則可以是專家對行業的理解,投資的邏輯,風控的把握,關系可以是企業的上下遊、合作、競爭對手、子母公司、投資、對標等關系,可以是高管與企業間的任職等關系,也可以是行業間的邏輯關系,實體則是投資機構、投資人、企業等等,把他們知識圖譜表示出來,從而進行更深入的知識推理。目前知識圖譜在金融中的應用大多在於風控征信,基於大數據的風控需要把不同來源的數據(結構化,非結構)整合到一起,它可以檢測數據當中的不一致性,舉例來說,借款人張三和借款人李四填寫的是同一個公司電話,但張三填寫的公司和李四填寫的公司完全不一樣,這就成了一個風險點,需要審核人員格外的註意。最早應用知識圖譜在金融領域的Garlik就是這一代表。這家公司2005年成立於英國,核心成員來自南安普頓大學(University of Southampton,是語義網的核心研究機構之一),主要業務是在線個人信息監控。Garlik收集網絡和社交媒體上的個人信息,當發生個人信息盜竊時會及時報警。Garlik總計融資2469千萬美金後被美國的三大個人信用記錄公司之一Experian收購,其技術被用於個人信用記錄、信用盜竊的分析。Garlik的核心技術之一是大規模語義數據庫,前後開源發布了3store, 4store, 5store等高性能數據庫。

除此之外還有Dataminr,這家基於Twitter及其他公開信息的實時風險情報分析公司。致力於從數據爆炸的社交網絡提取精簡且價值的風險情報與挖掘關鍵信息,如輿情熱點、金融相關的非交易信息、公共機構安全預警、企業安全等,並直接向客戶推送。除此之外,Dataminr還加入早期預警系統,並實時推送警報

而以投資關系為例,知識圖譜可以將整個股權沿革串起來,方便地展示出哪些PE機構在哪一年進入,進入的價格是多少,是否有對賭條款,這些信息不僅可以判斷該機構進入當時的估值,公司未來的發展情況(公司成長的節奏),還可以看清PE機構的投資偏好,投資邏輯是如何變更發展的。

目前知識圖譜在工業界還沒有形成大規模的應用。即便有部分企業試圖往這個方向發展,但很多仍處於調研階段。我們認為這其中的難點在於如何與特定領域機構建立起一套合作方式,如何將合作變成一種可輕易編程的界面,讓領域專家可以通過系統以一種非常簡單的方式進行行業邏輯的建模,而他的邏輯可以通過系統實時得到驗證,使其進一步更新,只有通過專家與機器反反復復的叠代,形成閉環,才會服務好用戶。全球估值第四高,被稱為“下一個獨角獸”的公司——Palantir曾推出一個基於知識圖譜的金融數據分析平臺—Palantir Metropolis,可以整合多源的量化資料,並提供一套方便易用的分析工具來滿足復雜的研究需求,其中的組件能夠進行復雜搜索,可視化編輯與分析,有非常豐富的人機交互能力。目前Palantir將結構化客戶內部數據,關聯相關數據,讓客戶自己創立分析規則整合並優化模型,量化處理數據,從而解決客戶的特定需求。

未完,明日話題:金融智能搜索、智能投顧,歡迎轉發,歡迎交流。

- - - - - - -摘自推酷 王佳佳

人工智能與金融