1. 程式人生 > >一篇文章讓你看懂量化交易發展史

一篇文章讓你看懂量化交易發展史


閱讀原文:club.jr.jd.com/quant/to

京東金融量化交流群:417082141

一.從文藝復興科技,大獎章和HMM說起

Renaissance Technologies(Ren Tech)這家對衝基金的名字在量化圈算是如雷貫耳了。創始人數學家James Simons帶領著一幫數學家、物理學家與市場博弈,其中最賺錢的投資組合就是1988年創立的Medallion Fund。1994年到2004年中期的年化收益高達71.8%,在全球金融危機的2008年,大部分對衝基金都虧損,而大獎章的return高達98.2%。

由這些天才般的數學家和物理學家以及一些超強的交易員構成的文藝復興科技和他們建立的神祕的大獎章基金,不禁讓外界猜測,他們究竟是搭建了一個怎樣的量化模型,才能用非絕對投機的方法戰勝市場呢?而隱式馬爾可夫模型(HMM)也由於一些原因被認為是他們最有可能運用的一個模型,也是本文即將介紹的最為精彩量化模型。

Ren Tech成立初期的創始人中有一位James的好朋友Lenny Baum,此人正是發明廣泛應用在語音識別等領域的Baum Welch演算法的那個Baum,演算法是用來確定隱式馬爾可夫模型中未知變數可能出現的概率,到今天可以說是廣泛應用於語言識別和金融領域了。並且,1993年加盟復興技術的劍橋大學數學博士尼可·帕特森就是全球HMM領域公認的專家。另外,James還僱了很多曾在IBM從事語音識別和自然語言處理的科學家來Ren Tech工作。以這些人的機器學習和文字資訊處理的功底,很難不引人猜測Ren Tech很大可能就是利用了HMM或者HMM與其它統計方法如SVM結合來進行短期市場預測從而高頻交易的。《解密復興科技:基於隱蔽馬爾科夫模型的時序分析方法》

一書中介紹了這個Jim很有可能採用的演算法,含有詳細的公式推導和運算,並且附上了一些實證結果,可以參考看看。

二.認識模型

HMM與馬爾可夫模型相比,不同的地方在於隱藏變數。馬爾可夫鏈是具有有限記憶屬性的模型。舉個栗子,比如我知道昨天下雨,那麼今天下雨的概率就很大(狀態轉移概率)。但有時候我們並不知道當時那個地方的天氣如何,卻有可能瞭解到那一天雨傘的銷售量出現了提高,這樣我們就可以通過觀察雨傘的銷售量來預測天氣狀態。在這種情況中,雨傘的銷售量就是一個觀察變數,而天氣是一個隱變數,即隱藏狀態。

在股票市場中,也能遇到相似的情況。我們無法準確知道當前時刻的市場狀態,而市場狀態決定了擇時策略。但我們可以通過一系列的觀察變數來進行猜測,比如通過股票收益率、成交量、主力資金流向、融資餘額增長量等觀測資料對市場狀態(即隱藏狀態)進行猜測,並得到第二天的市場狀態預測。這樣一個基於HMM的量化模型的雛形就出來了。

三.建模步驟

對我國股市滬深300指數進行預測,假設隱藏狀態數量是6,即假設股市的狀態有6種,可以理解為“牛市上漲”、“牛市下跌”、“熊市上漲”、“熊市下跌”、“震盪市上漲”和“震盪市下跌”,當然實際能不能夠真正區分出這六個狀態還需要進一步驗證。

雖然我們並不知道每種狀態到底是什麼,但是通過後面的圖我們可以看出那種狀態下市場是上漲的,哪種是震盪的,哪種是下跌的。進行預測的時候假設所有的特徵向量的狀態服從高斯分佈,因此可以使用 python的hmmlearn 這個包中的 Gaussian HMM 方法進行預測了。

四.模型實現:

下面的程式均於京東量化平臺實現,採用的是Python 3.5, 大家可以參考:原文有完整程式碼