全文連結：http://tecdat.cn/?p=32071

原文出處：拓端數據部落公眾號

隨著中國的證券市場規模的不斷壯大、市場創新不斷深化、信息披露不斷完善、市場監管不斷強化，隨著現代投資組合理論的發展和計算機技術的進步，投資者為了在股票交易中取得更多的收益，就需要有合理有效的投資策略，因素模型的基礎上發展出眾多量化研究模型。對於這些模型的研究能夠幫助投資者有效的跟蹤市場的變化，為得出更好的投資策略而提供幫助。Logistic選股模型正是這些眾多模型中的一個。

因素模型

因素模型是建立在證券收益率對各種因素或指數變動具有一定敏感性的假設基礎之上的一種模型。證券的收益率具有相關性，這種相關性是通過對模型中的一個或多個因素的共同反應而體現出來。證券收益率中不能被因素模型所解釋的部分被認為是各種證券的個性，因而與其他證券無關。因素模型也被稱為指數模型(Index model)或夏普模型(Sharp model)。

研究思路

本文以多因素模型在股票交易中的應用為背景，幫助客戶針對Logistic選股模型的理論基礎以及模型原理方面分析Logistic選股模型的可行性與穩定性。為保證模型的可靠和穩定，使用過去五年的歷史數據來檢測模型。

Logistic模型在股票交易中的選股策略

結合以上多因素模型與Logistic回歸分析的知識可以得到基於Logistic選股模型。這裡採用滬深300指數作為基準，將滬深300中的個股作為研究對象，研究其收益率超過滬深300股指收益率的機率。

這裡Logistic選股模型研究的窗口期選擇為一個月，在當月的最後一個交易日以股票或指數投資組合的收盤價買入股票或指數資產組合，在次月的最後一個交易日以股票或指數投資組合的收盤價賣出股票或指數資產組合。

這樣將即可以使用Logistic回歸分析結合歷史數據對組合中每支股票進行回歸分析。利用回歸分析結果預測每隻股票下個月收益率大於指數投資組合收益率的機率，這時我們選取預測中收益率大於基準收益率機率排名前40支股票，等權重組合，在當月的最後一個交易日以收盤價買入，在次月的最後一個交易日以收盤價賣出。如此即為Logistic選股模型的交易策略。

實證結果分析

#讀取數據

file=list.files(".",pattern=".Rdata")

for(i in file)load(i)

#計算對數收益率

data$return2=c(0,( log((data$CLOSE.y[-1])/data$CLOSE.y[-nrow(data)])))

合併因子數據和收益率數據

經過對模型的檢驗得到以下結果：

邏輯回歸收益分布

邏輯回歸收益的直方圖可以看到大部分收益分布在大於0的區域

圖中顯示了根據模型所選股票在當期的收益率分布。從圖中可以看出大部分股票收益率分布在0%至-10%之間，將近半數的股票在其交易當期內具有小額負收益。

這個圖橫軸代表時間。縱軸代表使用邏輯回歸模型結果在不同時間點的收益

累計收益

組合累積和基準累積

這個圖橫軸代表時間。縱軸代表使用邏輯回歸模型結果在不同時間點的收益率：

通過圖中對利用Logistic選股模型選出的組合的收益率和基準收益率的對比可以看出看出通過Logistic選股模型選出的組合具有一個較平穩的收益率，而且在絕大數的時間內收益率超過了基準收益。由此可以看出Logistic選股模型具有一定的穩定性和有效性，在絕大多數的情況下可以選出收益率高於基準收益的組合。

組合和基準每月的收益率的對比圖

邏輯回歸模型結果

Deviance Residuals:

Min 1Q Median 3Q Max

-0.86049 -0.32622 -0.05835 -0.00147 2.24675

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 7.199e+00 9.101e+00 0.791 0.429

SHARE_TOTALTRADABLE -9.482e-10 1.934e-09 -0.490 0.624

MKT_CAP -4.653e-11 5.952e-11 -0.782 0.434

MV -1.687e+00 2.033e+00 -0.830 0.407

pe -9.811e-02 1.128e-01 -0.870 0.384

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 16.081 on 41 degrees of freedom

Residual deviance: 11.560 on 37 degrees of freedom

(1 observation deleted due to missingness)

AIC: 21.56

總結

構建了Logistic選股模型，並利用歷史數據經行回測，驗證模型的有效性，並根據實驗數據得到結果證明Logistic選股模型可以在大部分情況下為投資者選出一個收益率能夠超過基準收益的投資組合。但是本文的研究也可能存在以下問題和漏洞：

參考文獻

[1]：黃志文. Logistic選股模型及其在滬深300中的實證[R].國信證券，2010.

[2]：黃志文.傳統多因素模型及其在滬深300 中的實證[R].國信證券，2010.

[3]：滋維·博迪.投資學[M].第九版.機械工業出版社，2012；127-172.

最受歡迎的見解

1.R語言對S＆P500股票指數進行ARIMA + GARCH交易策略

2.R語言改進的股票配對交易策略分析SPY—TLT組合和中國股市投資組合

3.R語言時間序列：ARIMA GARCH模型的交易策略在外匯市場預測應用

4.TMA三均線期指高頻交易策略的R語言實現

5.r語言多均線量化策略回測比較

6.用R語言實現神經網絡預測股票實例

7.r語言預測波動率的實現：ARCH模型與HAR-RV模型

8.R語言如何做馬爾科夫轉換模型markov switching model

9.matlab使用Copula仿真優化市場風險

R語言邏輯回歸Logistic選股因素模型交易策略及滬深300指數實證

全文連結：http://tecdat.cn/?p=32071

原文出處：拓端數據部落公眾號

因素模型

研究思路

Logistic模型在股票交易中的選股策略

實證結果分析

邏輯回歸收益分布

邏輯回歸模型結果

總結

參考文獻

SPSS用多元逐步回歸模型對上證指數預測、描述統計和相關分析可視化研究

數據報告分享|WEKA貝葉斯網絡挖掘學校在校人數影響因素數據分類模型

matlab使用長短期記憶（LSTM）神經網絡對序列數據進行分類|附代碼數據

R軟體文本挖掘分析服裝公司職位要求數據和分布地理可視化

R語言大學城咖啡店消費問卷調查報告：信度分析、主成分分析可視化

SAS邏輯回歸logistic在對鮑魚年齡識別中的應用可視化

R語言邏輯回歸logistic對ST股票風險建模分類分析混淆矩陣、ROC曲線可視化

【視頻】Copula算法原理和R語言股市收益率相依性可視化分析|附代碼數據

數據分享|AARRR模型淘寶用戶行為分析、電商銷售分析

SPSS modeler利用類神經網絡對茅台股價漲跌幅度進行預測

ARIMA模型，ARIMAX模型預測冰淇淋消費時間序列數據|附代碼數據

在r語言中使用GAM（廣義相加模型）進行電力負荷時間序列分析|附代碼數據

【專題】2023年全球製藥行業研究報告PDF合集分享（附原數據表）

【專題】中國仿生機器人產業全景報告PDF合集分享（附原數據表）

數據分享|R語言逐步回歸模型對電影票房、放映場數、觀影人數預測可視化

HAR-RV-J與遞歸神經網絡（RNN）混合模型預測和交易大型股票指數|附代碼數據

【專題】2023中國產業元宇宙趨勢研究報告PDF合集分享（附原數據表）

【專題】2023年中國社會辦口腔醫療企業報告PDF合集分享（附原數據表）

【專題】中國數字科技產業投資發展研究報告PDF合集分享（附原數據表）

MATLAB熱傳導方程模型最小二乘法模型、線性規劃對集成電路板爐溫優化

R語言機器學習方法分析二手車價格影響因素

基於ARIMA、SVM、隨機森林銷售的時間序列預測|附代碼數據

R語言Copula模型分析股票市場板塊相關性結構|附代碼數據

上海、國際新冠疫情數據分析可視化