雖然中國股票市場日益完善,但還不完全是弱有效市場,因此中國股票市場存在比較明顯的通過技術分析達到的套利機會。
任務/目標
根據基金凈值的要求,運用多種模型分析實現股票走勢的預測。
本次數據來源於天天基金網南方恒生中國企業ETF版面,數據獲取採用python(版本3.6)爬蟲,數據分析部分則是採用Rstudio(3.6.2)。由於南方恒生中國企業ETF沒有分紅,所以單位凈值和累計凈值相同,本次分析採用單位凈值(數據採用從2018/2/8~2020/6/10,共556個)作為數據分析對象。本次數據分析採用的數據模型有AR, MA,ARMA,GARCH模型。
將獲得數據進行標準化,並作圖發現數據超出了[0,1]的限制,於是我們可以初步估計數據不滿足正態性。其次,我們採取箱形圖法分析分析數據中可能存在的異常值,發現數據中存在三個異常值點,2020-03-18 -3.636842,2020-03-19 -4.182578,2020-03-23 -3.552882。
數據波動性大且不聚集。於是對數據進行二階差分(一次差分模型擬合效果不好)。利用箱型圖法進行異常值檢測,發現二階差分之後的數據異常值增多,但是從圖上可以看出數據具有集群波動性,在這裡初步估計數據具有garch模型的特點。
首先考察時間序列 時間序列平方以及絕對值的ACF和PACF圖,判斷二階差分具有一定的ARCH性質,接下來我們使用MC.LEOAD.LI方法檢驗我們剛才的判斷。右圖說明,二階差分數據具有很強的ARCH特徵。現在我們計算其峰度以及偏度,判斷其厚尾性。偏度為0.2112377,峰度為2.870266,j-b檢驗數為171.9739 遠大於kai(2)的置信度5% 時的3.84, 因此相信序列存在高階相關性和厚尾結構。
利用EACF方法判斷garch的階數。我們選取EACF圖建議採用GARCH(1,2)模型。根據最小二乘法,發現模型參數α2不顯著,因此考慮GARCH(1,1)模型。
發現CARCH模型的各項係數均顯著。並比較GARCH(1,1)和GARCH(1,2)的AIC係數。發現GARCH(1,1)的係數665.12略小於GARCH(1,2)的666.77。
我們選用GARCH(1,1)模型進行模型診斷。根據QQ圖發現GARCH(1,1)模型殘差近似滿足正態分布,其次我們檢驗shapiro數p-value = 0.8696 大於0.05,故我們認為殘差滿足正態性分布。我們採用L-B檢驗數,檢驗殘差的獨立性,這裡發現m<11時,獨立性滿足。
考慮到最終模型會預測將來的某時間段的銷量,為了更真實的測試模型效果,以時間來切分訓練集和測試集。具體做法如下:假設我們以2018/2/8~2020/5/28的單位凈值作為訓練,最後5個交易日的數據作為測試。
ARIMA , 一般應用在股票和電商銷量領域
ARIMA模型是指將非平穩時間序列轉化為平穩時間序列,然後將結果變量做自回歸(AR)和自平移(MA)。
GARCH
金融市場領域常用的分析模型,自回歸條件異方差模型,消除arma模型對於同方差假設引起的問題,能夠更好的認識到風險的波動性
混合模型
由於上述模型確定具有一定的主觀性,現考察混合模型是否能夠更好的擬合數據。主要考察兩種混合模型--ARMA(1,3) + GARCH(1,2)和 MA(1) + GARCH(1,1)。
採用h步向前估計,對之後的數據進行預測,其中將最後一天的數據(2020/06/10)作為預測原點,方差作為σt|t-1的初值。程序中預測了未來五次交易的數據,並做了上下區間。
發現預測數據與實際數據相差不大,並且在預測區間當中。
可以看出,銷量的預測值的趨勢已經基本與真實基金趨勢保持一致,但是在預測期較長的區間段,其預測值之間的差別較大。
在此對Yuyan Wang對本文所作的貢獻表示誠摯感謝,他畢業於同濟大學,擅長數理金融、數據採集、數據分析。
點擊標題查閱往期內容
R語言使用多元AR-GARCH模型衡量市場風險
R語言GARCH模型對股市sp500收益率bootstrap、滾動估計預測VaR、擬合診斷和蒙特卡羅模擬可視化R語言單變量和多變量(多元)動態條件相關係數DCC-GARCH模型分析股票收益率金融時間序列數據波動率
R語言中的時間序列分析模型:ARIMA-ARCH / GARCH模型分析股票價格
GARCH-DCC模型和DCC(MVT)建模估計
R語言預測期貨波動率的實現:ARCH與HAR-RV與GARCH,ARFIMA模型比較
ARIMA、GARCH 和 VAR模型估計、預測ts 和 xts格式時間序列
PYTHON用GARCH、離散隨機波動率模型DSV模擬估計股票收益時間序列與蒙特卡洛可視化
極值理論 EVT、POT超閾值、GARCH 模型分析股票指數VaR、條件CVaR:多元化投資組合預測風險測度分析
Garch波動率預測的區制轉移交易策略
金融時間序列模型ARIMA 和GARCH 在股票市場預測應用
時間序列分析模型:ARIMA-ARCH / GARCH模型分析股票價格
R語言風險價值:ARIMA,GARCH,Delta-normal法滾動估計VaR(Value at Risk)和回測分析股票數據
R語言GARCH建模常用軟體包比較、擬合標準普爾SP 500指數波動率時間序列和預測可視化
Python金融時間序列模型ARIMA 和GARCH 在股票市場預測應用
MATLAB用GARCH模型對股票市場收益率時間序列波動的擬合與預測
R語言極值理論 EVT、POT超閾值、GARCH 模型分析股票指數VaR、條件CVaR:多元化投資組合預測風險測度分析
Python 用ARIMA、GARCH模型預測分析股票市場收益率時間序列
R語言中的時間序列分析模型:ARIMA-ARCH / GARCH模型分析股票價格
R語言ARIMA-GARCH波動率模型預測股票市場蘋果公司日收益率時間序列
Python使用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模擬進行股價預測
R語言時間序列GARCH模型分析股市波動率
R語言ARMA-EGARCH模型、集成預測算法對SPX實際波動率進行預測
matlab實現MCMC的馬爾可夫轉換ARMA - GARCH模型估計
Python使用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模擬進行股價預測
使用R語言對S&P500股票指數進行ARIMA + GARCH交易策略
R語言用多元ARMA,GARCH ,EWMA, ETS,隨機波動率SV模型對金融時間序列數據建模
R語言股票市場指數:ARMA-GARCH模型和對數收益率數據探索性分析
R語言多元Copula GARCH 模型時間序列預測
R語言使用多元AR-GARCH模型衡量市場風險
R語言中的時間序列分析模型:ARIMA-ARCH / GARCH模型分析股票價格
R語言用Garch模型和回歸模型對股票價格分析
GARCH(1,1),MA以及歷史模擬法的VaR比較
matlab估計arma garch 條件均值和方差模型