蒸餾Alpha:因子的可交『弈』性

2023-08-17     量化投資與機器學習

原標題:蒸餾Alpha:因子的可交『弈』性

量化投資與機器學習微信公眾號,是業內垂直於量化投資、對沖基金、Fintech、人工智慧、大數據領域的主流自媒體公眾號擁有來自公募、私募、券商、期貨、銀行、保險、高校等行業30W+關注者,曾榮獲AMMA優秀品牌力、優秀洞察力大獎,連續4年被騰訊雲+社區評選為「年度最佳作者」。

量化投資與機器學習公眾號獨家撰寫

「是在一個大的平台里追求安穩,還是在去初創的公司搓破天花板,這其實是每個行業都會遇到的選擇。但尤其在量化行業,你會發現這兩種選擇顯得更為兩極化。但當我看到國內量化行業的蓬勃發展,我還是毅然選擇離開世坤,並深入的參與到國內的市場競爭中來。」

——余建國 | 弈倍投資核心合伙人

*弈倍投資核心合伙人余建國是全球頂級對沖基金「千禧年」旗下量化子公司WorldQuant——世坤投資的核心創始團隊成員,其擁有17年以上策略和技術開發經驗。

堅持系統化的投資理念

在WorldQuant(以下簡稱:世坤十餘年的經歷,也是參與世坤成長、見證世坤模式成功的經歷。這段經歷對我在倍現在的投研模式有了很多的借鑑,比較核心的有:

  • 系統化量化投資的每一個步驟,減少主觀的干預

  • 長期看來,因子的邏輯性和可交易性非常重要

  • 有限度、有節制的使用GA算法因子挖掘

系統化量化投資的每一個步驟,減少主觀的干預

長期看來,因子的邏輯性和可交易性非常重要

有限度、有節制的使用GA算法因子挖掘

量化策略是非常多樣化的,但市場上很多人並不清楚自己要做什麼。我們要找准自己的定位,包括產品的定位以及研究的定位!

比如做因子投資,它是一種相對價值的概念,那你就不能要求每次都能選到市場漲幅靠前的股票。以指數增強為例,Alpha的本質是在截面上,通過組合的優化及風險的控制,使整個組合能在同一個的時期相對戰勝基準。

如果以多空策略為例,Alpha的本質就是在截面上,通過組合的優化及風險的處理(這時由於做空限制的放開,可以中性化掉很多風險),來獲得多頭部分相對空頭部分的超額收益。所以本質上我們是在一個相對獲利的位置,這時如果做擇時的研究就違背了策略理論。

研究定位:不做擇時,不被市場的噪音左右

擇時一定程度上與截面因子模型的理念是相悖的。我們必須要承認我們對於個股的預測是毫無優勢的,所以我們需要以構建組合的方式相對的獲得Alpha。我們也不會根據重大事件或新聞去臨時做一些應對,除非等事件過後,否則我們無法定量的判斷事件影響性的大小。如果一有新聞或事件,就要主觀的做調整,那就失去了量化的意義。

我們認為,一個好的Alpha信號應該對噪音不敏感,這才是可持續的關鍵。因此,敏感性測試和顯著性測試是很重要的。測試穩健性的最常用技術包括對不同時段、不同時長、隨機數據子集等進行測試,另一方面,每個輸入數據都應該對結果作出重大貢獻。

同時,量化模型應該對這些噪音進行中性化處理,即使無法中性化掉,那也應該在風險層面去控制。噪音的衝擊往往會帶來階段性的虧損,但噪音之後的均值回歸又會給量化策略帶來可觀的收益。

Alpha研究:更關注因子的可交易性

一切可用的、可靠的數據都是我們Alpha的來源。

每個Alpha提供了一個收益來源,並進一步稀釋了投資組合的風險負荷。理想的投資組合將保持對任何一個廣為人知的風險因素(Beta)的零負荷,以及對他所能發現的儘可能多的未知因素(Alpha)的非零負載。所以,在設計新Alpha的過程中,需要不斷測試Alpha的稀缺性,邏輯性,穩定性和可交易性。

因此,好的Alpha應該具有以下特徵:

  • 表達式有邏輯
  • 具有較高的樣本內夏普比
  • 對於數據參數的變化不敏感
  • 適用於多個市場和地區
  • 適用於多頭組合和空頭組合 ··· ···

作為市場的參與者,我們並不會限定自己的研究範圍,也不會對某一類數據有特定的青睞。基本面數據不一定就是價值投資的專屬,量價數據也不是高頻交易的專屬,你使用大量的另類數據也並不說明你比別人更有優勢。

而核心的研究還是要從邏輯出發,要從市場的非有效性出發。比如,量價數據,特別是高頻量價數據就更適合用來度量過度反應的行為。因為市場高頻的日內的量價數據相對日度數據往往包含了更多反應交易行為的有用的信息。比如呈U形分布的日內交易量就比日度總體的交易量包含更多的信息。我們需要通過降頻處理來有效的利用這些信息。

每一類數據都能表示股票的某一維度的特徵。那我們研究的是特徵還是因子?對於從事機器學習研究的人來說,它倆可能是一回事。我們通常會將表示投資標的某一維度的特徵作為機器學習模型的輸入,對模型進行調優,然後用輸出作為信號。這個過程中不會特別在意輸入特徵本身的預測性,即使在意,可能也只是考察特徵與投資標的未來收益的相關性。但是在弈倍,不僅可預測性,我們還看中因子的可交易性,包括它的換手、回撤及勝率等。我們確保每一個因子都是一個可交易的信號,能夠單獨構建組合,作為一個投資策略。

在隨後構建因子組合的過程中,我們也不會使用預定義的概念對因子進行分類並從中篩選因子進行組合,而會從結果去看因子的相關性。最後的組合也會完全的進行市值行業中性化處理。

擁抱新的工具,有限度且克制的使用GA因子

GA本身其實並不是一個新的事物。基於十多年GA算法的研究經驗,我們非常克制且有限度的使用GA算法進行因子挖掘。並把GA因子作為人工Alpha因子的補充。

對於某一個特定的數據集,我們首先會用人工的方式帶有邏輯的對數據集進行因子研究,挖掘出儘可能多的信號。

然後再使用GA算法對該數據集進行因子挖掘。這樣做的目的有兩個,首先通過人工的方式確保該數據集的價值,避免將無用的數據輸入到GA算法中;其次是使用GA「榨取」數據的剩餘價值。

最後,再把人工挖掘的因子和GA因子進行組合。但組合的過程中,我們並不會把GA因子與人工的因子配置相等的權重。比如人工挖掘了100個因子,GA算法可能在短時間就能挖掘出10000個因子。如果簡單的將100個人工與10000個GA因子在同一層級組合,有可能這100個人工因子會淹沒在10000個GA因子中,這是由於GA因子樣本內的表現通常會更優(由於更高的過擬合風險)。比較安全且合理的做法是先將這10000個GA因子組合成一個或幾個因子,再與100個人工Alpha因子進行組合。

我們同樣應該克制過度依賴機器學習和歷史數據的訓練,因為當前市場規則一直在變,投資主體及其技術也在變,故而測試周期越長越好,這不一定是正確的。同時,過擬合的現象是普遍存在的,那些良好的結果,可能只是隨機誤差或噪音,並沒有預測能力。我們必須敬畏市場,因為沒有一個完美的訓練方法可以提高未來的夏普比率,皆因市場一直在變化。所以,我們選擇回歸本源,持續改進Alpha,如果模型對參數變化的敏感性較低,這有助於降低過度擬合的風險。

十年磨一劍:股票多空策略

弈倍的投資團隊過去在海外有長達十餘年的多空策略投資經驗,而在今年「全面註冊制」施行後,也正式上架了A股的多空策略產品線。

在海外,多空策略在主流對沖基金中廣受歡迎,也是表現最出色的策略之一。據Eureka hedge的統計數據,在2000年到2023年長達24年的時間裡,全球對沖基金股票多空策略,平均歷史年度收益達到10%以上的年份為 14 個,占比 58.33%,而收益下跌的年份僅有4個,其三年期年化收益率甚至常年排行第一。

弈倍策略體系

在國內,由於對沖工具較為貧乏,絕大多數「多空策略」管理人實質上都在做「市場中性策略」。該策略通過建立指數增強的多頭頭寸和對應指數期貨的空頭頭寸來對沖市場整體風險,收益主要依賴於多頭端的超額收益和對沖端的成本之差。而多空策略則是一種「增強型的市場中性策略」,其多頭端無需選擇對標某一類指數,空頭端則通過融券形式做空,並以此獲取雙倍的選股Alpha收益。

隨著今年「全面註冊制」正式啟動,這將對中國資本市場中長期帶來深遠影響,主板的新股上市首日即可納入融資融券標的,這將極大豐富融券券源,緩解多空策略的容量難題。

弈倍投資希望能以成熟海外策略,輔以國內經驗,補上 A 股「量化多空策略」這一塊缺口,為投資者持續穩健地創造收益!

文章來源: https://twgreatdaily.com/2b450adc6de351a6a789538ddab44501.html