多少因子才管夠?

2023-11-08     量化投資與機器學習

原標題:多少因子才管夠?

量化投資與機器學習微信公眾號,是業內垂直於量化投資、對沖基金、Fintech、人工智慧、大數據領域的主流自媒體公眾號擁有來自公募、私募、券商、期貨、銀行、保險、高校等行業30W+關注者,曾榮獲AMMA優秀品牌力、優秀洞察力大獎,連續4年被騰訊雲+社區評選為「年度最佳作者」。

來自:Factor Zoo (.zip)

作者:Alexander Swade、Matthias X. Hanauer、Harald Lohre、David Blitz

在一個以因子數量多少論英雄的時代,多少因子才管夠?

在本文中,我們發現,在不影響對可用Alpha的解釋的情況下,大量的因子可以被壓縮到僅僅 15個,這表明目前在資產定價模型中許多因子之間存在顯著的重疊和冗餘。

本文核心發現如下:

  • 使用美股數據,15個因子對Alpha的解釋能力就能替代所有測試的153個因子。

  • 基於特定因子篩選邏輯的動態因子模型,在與比較基準(即普通的學術因子模型)的因子數量相同的情況下,它們也擊敗了普通的學術模型。

  • 在動態因子模型中,我們經常發現新發表的因子會取代舊的因子,說明因子持續創新的重要性。

  • 以上發現,在美國以外的市場也同樣成立。

使用美股數據,15個因子對Alpha的解釋能力就能替代所有測試的153個因子。

基於特定因子篩選邏輯的動態因子模型,在與比較基準(即普通的學術因子模型)的因子數量相同的情況下,它們也擊敗了普通的學術模型。

在動態因子模型中,我們經常發現新發表的因子會取代舊的因子,說明因子持續創新的重要性。

以上發現,在美國以外的市場也同樣成立。

因子動態篩選步驟

為了從Alpha角度確定一個能夠複製整個因子動物園的簡化因子模型,我們遵循一種非常直觀和有效的嵌套模型方法:

我們疊代地向因子模型中添加新因子,直到新增的因子再也不能解釋剩餘的alpha。我們的起點是CAPM,然後我們添加了兩個能夠解釋最多Alpha的因子(通過最低GRS統計量來測量)。請注意,此選擇標準相當於為現有模型選擇具有最大alpha t-stat的因子。一旦確定,該因子將永久地添加到因子模型中,並且我們重複該過程,直到沒有重要的因子留下(詳細步驟可參考原文)。

在整個篩選過程中,有兩個值得注意的地方:

1、用什麼指標判斷該因子是否該被加入到模型中?

本文使用的是GRS統計量,該統計量能夠用于衡量新的候選因子對現有線性模型的解釋性是否有提升。

Gibbons, Michael R., Stephen A. Ross, and Jay Shanken (1989). 「A test of the efficiency of a given portfolio.」 Econometrica, 1121–1152.

2、篩選的疊代過程如何停止?

我們使用一個簡單的標準,要求剩餘有效因子Alpha的總數為零。也就是說,一旦確定了新的因子模型,我們就根據該模型測試所有剩餘的因子,並確定剩餘候選因子的Alpha值。如果新增加的因子是顯著的,則在此過程中剩餘顯著因子α的數量應該減少。

測試結果

本文使用了Jensen, Kelly, and Pedersen(2023)的全球因子資料庫,總共有153個因子,覆蓋93個國家。

下表給出了基於美股因子,因子篩選疊代的過程,第一列為疊代的次數。可以看出疊代到第15次,t大於3的因子數量就為0了,也就是說153個因子中具有顯著Alpha解釋能力的15個因子已經篩選出來了。

請注意,15個選定的因子來自13個定義的因子樣式類別中的8個,並且沒有考慮其餘5個類別中的因子,請參見圖2中突出顯示的因子條。此外,所選擇的因子不一定是在給定因子風格集群中具有最高CAPM alpha的因子;事實上,這隻適用於價值、質量、短期反轉和季節性集群。值得注意的是,雖然8個代表性因子集群中有5個僅具有單個因子,但價值,低風險和投資集群由3到4個因子代表。

下圖突出顯示了隨時間變化的相關因子,並以其相應的因子樣式簇為顏色。也就是說,每當在相應年份的因子模型中選擇一個因子時,它就會在時間軸上突出顯示。雖然絕大多數因子要麼從未被包括,要麼很少被包括,但表1中全樣本證據中的最重要因子卻非常突出,尤其是在過去10-15年里。我們觀察到,一旦一個有代表性的因子被發布,在大多數情況下,許多因子風格集群都被包含在模型中。例如,大多數時候都存在價值集群,但自Jegadeesh和Titman(1993)發表以來,動量集群也不斷出現。其他持續性因子類別包括應計項目、投資、季節性和短期逆轉。

以上的分析基於全部歷史,接下來基於180個月的滾動窗口看一下因子篩選的情況。下圖可以看出所代表的因子風格集群隨著時間的推移而緩慢變化,並且通常存在一些具有低波動性、季節性和質量集群代表性的因子。有趣的是,經典的規模因子很少被選擇,而且似乎與跨越其他因子的Alpha無關。

表記錄了基於全球因子數據的疊代因子選擇。儘管使用了全球因子和較短的樣本周期,但與表1中美國的結果相比,我們觀察到所選因子有很好的重疊。在前十個選擇的因子中,有三個是相同的(cop_at, resf3_12_1, cowc_gr1a),兩個選擇的投資因子是美國的很相近。

文章來源: https://twgreatdaily.com/4c7104bee832f86be98b2f7b69b9dc5c.html