金融模型中的三種錯誤:使用TensorFlow Probability進行分析的簡介
在一家人工智慧優先的金融交易和諮詢公司 Hedged Capital 我們使用概率模型在金融市場進行交易。 在這篇部落格文章中,我們探討了所有金融模型中固有的三類錯誤,並在 TensorFlow Probability (TFP)中展示了一個簡單的模型示例。
金融不是物理學
亞當·斯密,一般公認的現代經濟學的創始人,對牛頓的力學和萬有引力定律心存敬畏。 從那時候開始,經濟學家們就一直致力於將他們的學科變成像物理學這樣的科學。 他們渴望將能夠在微觀和巨集觀層面準確解釋和預測人類經濟活動的理論進行公式化。 這種慾望在20世紀初由歐文·費希爾(Irving Fisher)等經濟學家一起凝聚成一種趨勢,並在20世紀後期的經濟物理學運動中達到頂峰。
圖1. Mike Shwe和Deepak Kanungo的作圖,經過許可使用
拋開現代金融學的所有複雜的數學不談,它的理論是有嚴重缺陷的,與物理學相比的時候尤為如此。 例如,物理學可以用令人驚訝的精確度在計算機中預測月球的運動,以及電子的運動。 這些預測可以由任何物理學家在任何時間,地球上的任何地方計算出來。 相比之下,市場參與者在解釋每日市場變動的原因,或在世界任何地方隨時隨地預測股票價格這一點上,會遇到大麻煩。
也許金融比物理更難。 與原子和鐘擺不同,人是複雜的、具有自由意志和潛在認知偏見的感性生物。 他們傾向於具有不一致的表現,並且不斷地對他人的行為做出反應。 此外,市場參與者通過擊敗人類運營的系統或者與其博弈來進行獲利。
在投資南海公司後失去了一筆巨大財富後,牛頓曾經說過,“我可以計算出星體的運動,但卻無法計算出人類的瘋狂。”請注意,牛頓的資金可不是什麼“傻錢”。他擔任英國造幣廠監督近31年,幫助英鎊建立了持續兩個多世紀的黃金成色標準。
所有的金融模型都是錯的
模型用於簡化現實世界的複雜性,從而使我們能夠專注於我們感興趣的現象中蘊含的特徵。 顯然,地圖將無法捕捉其所建模的地形的豐富性。 著名的統計學家George Box曾有一句膾炙人口的打趣:“所有模型都是錯的,不過有些很有用。”
這種觀察特別適用於金融學。 一些學者甚至認為,金融模型不僅錯誤,而且危險; 物理科學的外表使經濟模型的擁護者錯誤地覺得,這些模型預測能力的準確性是確定性的。 這種盲目的信仰給他們的信徒和整個社會帶來了許多災難性的後果。 文藝復興科技(Renaissance Technologies)是歷史上最成功的對衝基金,它對金融理論的批判性觀點付諸實踐。 他們寧願僱用物理學家,數學家,統計學家和電腦科學家,也不聘請具有金融或華爾街背景的人。 他們使用基於非金融理論的量化模型來進行市場交易,這些理論包括資訊理論,資料科學和機器學習。
無論金融模型是基於學術理論還是基於歷史資料的資料探勘策略,它們都受到下面要詳細介紹的三種建模錯誤的影響。 因此,所有模型都需要定量分析其預測中固有的不確定性。 分析和預測中的錯誤可能來自以下任何一類有問題的建模過程:使用不適當的函式形式,輸入不準確的引數,或無法適應市場中的結構變化。
三種建模錯誤
1. 模型定義中的錯誤:幾乎所有的金融理論都在模型中使用正態分佈。 例如,正態分佈是Markowitz的現代投資組合理論和Black-Scholes-Merton期權定價理論的基礎。 然而,有充分記錄的事實表明,股票,債券,貨幣和商品都具有厚尾分佈。 換句話說,極端事件的發生頻率遠高於正態分佈索預測的頻率。
如果資產的價格回報率是具有正態分佈的,那麼在任何時代都不會發生以下任何金融災難:黑色星期一,墨西哥比索危機,亞洲貨幣危機,長期資本管理公司(Long Tem Capital Management)的破產(剛好,這家公司由兩位諾貝爾經濟學獲獎者所領導),以及閃崩。 個別股票的“小型閃崩”的發生頻率甚至高於這些巨集觀事件。
然而,由於其簡單性和易於跟蹤分析的特性,金融教科書、研究生金融專案和職業培訓繼續在其資產評估和風險模型中使用正態分佈。 鑑於當今先進的演算法和計算資源,這些原因已不再合理。 這種不情願放棄正態分佈的情況就是“酒鬼的搜尋”的一個明顯例證,這個原理來自於一個笑話,一個酒鬼在公園的黑暗中丟了鑰匙,但他卻在燈柱下瘋狂搜索,因為這有燈光。
2. 模型引數估計中的錯誤:這種型別的錯誤的出現,可能是因為市場參與者以不同的速度訪問不同等級的資訊。 他們對資訊處理能力的複雜程度、認知偏差上也是不同的。 這些因素導致了對模型引數深刻的認知不確定性。
讓我們考慮一下利率的特例。 作為任何金融資產估值的基礎,利率用於對資產的不確定未來現金流進行折現,並估計其在當前的價值。 例如,在消費者層面,信用卡的可變利率與稱為主利率的基準掛鉤。 這一利率通常與聯邦基金利率同步變化,聯邦基金利率是對美國和世界經濟具有重要意義的利率。
讓我們假設你想從現在開始估算一年後信用卡的利率。 假設目前的主利率為2%,而您的信用卡公司則向您收取10%加上主利率。 鑑於當前經濟的強勢,您認為美聯儲更有可能提高利率。 美聯儲將在未來12個月內舉行八次會議,並將聯邦基金利率提高0.25%或將其保持在前值水平。
在下面的TFP程式碼示例中(參見 完整程式碼 :,我們使用二項分佈來模擬您在12個月期間結束時的信用卡利率。 具體來說,我們將使用具有以下引數的TensorFlow概率 二項 分佈類:total_count = 8(試驗次數,即美聯儲會議次數),probs = {0.6,0.7,0.8,0.9},是我們關於美聯儲在每次會議上將聯邦基金利率提高0.25%這一事件概率的估計範圍。
#首先我們對假設進行編碼
num_times_fed_meets_per_year = 8.
possible_fed_increases = tf.range(
start=0.,
limit=num_times_fed_meets_per_year + 1)
possible_cc_interest_rates = 2. + 10. + 0.25 * possible_fed_increases
prob_fed_raises_rates = tf.constant([0.6, 0.7, 0.8, 0.9])
#現在我們使用TFP以向量化方式進行概率計算
#填充維度,使得美聯儲加息概率和信用卡利率進行廣播計算
prob_fed_raises_rates = prob_fed_raises_rates […,tf.newaxis]
prob_cc_interest_rate = tfd.Binomial (
TOTAL_COUNT = num_times_fed_meets_per_year,
probs = prob_fed_raises_rates).prob(possible_fed_increases)
在下圖中,注意到,12個月內信用卡利率的概率分佈如何主要取決於您對八次會議中每次會議加息的可能性的估計。 您可以看到,隨著對每次美聯儲會議加息概率的估計每增加0.1,您的信用卡在12個月內的預期利率將增加約0.2%。
圖2. Josh Dillion和Deepak Kanungo作圖。 經許可使用
即使所有市場參與者在他們的模型中使用二項分佈,也很容易看出他們如何對未來的主利率存在分歧,因為他們對概率的估計存在差異。 實際上,這個引數很難估計 。 許多機構都有專職的分析師,包括美聯儲的前員工,用分析美聯儲的每一份檔案、演講和事件的方法,試圖估計這個引數。
回想一下,我們假設這個概率引數probs在我們的模型中對於接下來的八次美聯儲會議中的每一次都是不變的。 這有多現實? 利率設定機構聯邦公開市場委員會(FOMC)的成員可不僅僅是一組有偏的硬幣。 他們可以並且確實做到了根據經濟如何隨時間變化來改變他們的個人偏見。 假設引數probs在未來12個月內保持不變,不僅不現實,而且風險也很大。
3. 因為無法適應市場結構變化導致的錯誤:潛在生成基礎資料的隨機過程可能隨時間變化,換句話說,隨機過程不是穩定遍歷的。 我們生活在充滿活力的資本主義經濟中,其特點是技術創新和不斷變化的貨幣和財政政策。 資產價值和風險的分佈隨著時間變化,這是規律,而不是例外。 對於此類分佈,基於歷史資料定下的引數值必然會將錯誤引入預測。
在上面的例子中,如果經濟顯示出放緩的跡象,美聯儲可能會決定在第四次會議中採取更中立的立場,讓你將probs引數從70%改為50%。 您的probs引數的這一變化將反過來改變您的信用卡利率預測。
有時,時變分佈及其引數會連續變化或跳變,如墨西哥比索危機。 對於連續變化或跳變,所使用的模型需要適應不斷變化的市場條件。 很可能我們需要一個具有不同引數的新函式形式來解釋和預測新制度中的資產價值和風險。
假設在我們的例子第五次會議之後,美國經濟遭受外部極端衝擊 – 比如說希臘新的民粹主義政府決定拖欠債務。 現在美聯儲可能更有可能降息而不是提高利率。 鑑於美聯儲前景的這種結構性變化,我們將不得不將模型中的二項概率分佈改為具有適當引數的三項分佈。
結論
金融不是像物理學那樣精確的預測科學,相去甚遠。 因此,我們不要將學術理論和金融模型像量子物理模型那樣進行處理
所有金融模型,無論是基於學術理論還是資料探勘策略,都受三種建模錯誤的影響。 雖然可以使用適當的建模工具弱化這三個錯誤,但卻無法消除。 資訊和認知偏見總是存在不對稱性。 由於資本主義,人類行為和技術創新的動態性質,資產價值和風險模型將隨著時間的推移而變化。
金融模型需要一個框架來量化時變隨機過程預測中固有的不確定性。 同樣重要的是,框架需要根據基於實質性新資料集,不斷更新模型和/或模型引數。 這些模型必須使用小資料集進行訓練,因為基礎環境可能變化太快而導致無法收集大量相關資料。
致謝
我們感謝TensorFlow Probability團隊,特別是 Mike Shwe 和Josh Dillon,感謝他們在此部落格文章的早期草稿中提供的幫助。
參考
1. 金錢公式 ,作者David Orrell和Paul Wilmott,Wiley出版社,2017年
2. 胡扯諾貝爾獎 ,作者:J.R. Thompson,L.S. Baggett,W.C. Wojciechowski和E.E. Williams,後凱恩斯主義經濟學雜誌,2006年秋季
3. 模型錯誤 ,由作者:Katerina Simons,新英格蘭經濟評論,1997年11月
4. 貝葉斯風險管理 ,作者:Matt Sekerke,Wiley出版社,2015年