R語言多元線性回歸、ARIMA分析美國不同候選人對經濟GDP時間序列影響

2022-08-21     tecdat拓端

原標題:R語言多元線性回歸、ARIMA分析美國不同候選人對經濟GDP時間序列影響

全文連結:http://tecdat.cn/?p=28144

原文出處:拓端數據部落公眾號

作者:Yuanchang Luo

近段時間,美國總統大選引起了世界各國的關注。共和黨候選人唐納德·特朗普和民主黨候選人喬·拜登將角逐總統。兩黨候選人在金融貿易、經濟金融治理以及防控措施等重點發展領域有著不同的政治立場和施政綱領。不同的政治立場的候選人對美國甚至全世界的經濟發展有著一定的影響,本文結合具體數據,定量分析不同候選人對美國經濟發展的影響。

解決方案

任務/目標

根據美國各指標數據以及兩位候選人的不同 政策,分析出對美國經濟的影響。

數據源準備

在美國政府公開數據集上搜索數據,共 26 類, 並且用 GDP 來反映美國經濟。得到數據後, 由於是時間序列數據,因此通過拉格朗日插值 法補充空值。並且,由於是美國政府公開的數 據集,因此默認異常值,即較大較小值是由實 際歷史因素導致的,不作處理。

特徵抽取

首先經過觀察特徵間的相關矩陣以及和因變量的相 關性,初步剔除 7 個與因變量相關性非常低且指標 間相關性較高的指標,使用剩餘19個自變量作為 回歸分析的指標。(剔除掉的指標:'美國個人收入 中位數','個人所得稅(最高)','個人所得稅(最低) ','商品和服務出口','金融資產凈收購','勞動力市場狀 況指數','失業率')

建模

多元線性回歸,一般應用與多個特徵指標的回 歸問題。 在多元線性回歸的過程中,除了考慮模型的 AIC 最小外,還需考慮模型間自變量相互的關 系對因變量的影響,即多重共線性,通過 VIF 來剔除相關自變量。 ARIMA,一般應用在時間序列領域上。 ARIMA 模型是指將非平穩時間序列轉化為平 穩時間序列,然後將結果變量做自回歸(AR) 和自平移(MA)。

模型優化

1.通過 VIF 準則剔除相關的自變量:

上圖為 VIF 最初結果和最終結果。進一步篩選 7 個指標進行預測。

2.通過 AIC 準則選擇最優模型

結合各因素的 t 檢驗以及模型的 AIC,通過向 前向後選擇的方法,選擇出最優的回歸模型。

結合上圖,確信此回歸模型表現良好。

3.時間序列預測自變量

由於美國政府公開的數據截至到 19 年,而我 們需要 21 年 1 月份自變量的數據以次來預測 不同候選人當選對經濟的影響,因此通過時間 序列對 5 個指標往後預測 5 季度的數值。

4.不同政策對特徵的定量影響

結合不同候選人的政策,可以人為定性的分析 出對各特徵的影響是增大還是減小,然後通過 平均 20 年的數據,算出各特徵增大以及減小 的百分比均值,以此來估計影響的具體數值。 這樣一來,對歷史數據通過 ARIMA 模型得到 20 年的的數據,然後通過各候選人的不同政 策對指標的影響以及歷史變動均值,就得到了 21 年四個季度各指標的具體數值,然後通過 多元回歸所得方程,預測 21 年 4 個季度的 GDP 具體數值。

項目結果

多元回歸方程:y= − 0.3478 − 0.08548x 2+1.579 × 10 −7 x 10 +4.653 × 10 −5 x 14+1.565 × 10 −5 x15+1.156x 19

結合對各指標的預測值,計算出不同候選人當 選對經濟的影響:

可以看到,兩位候選人的當選都會對美國經濟有一定的提升,但拜登的當選無疑提升更大, 因此可以估計,拜登有更大的可能贏得此次大 選。評估效果不能只看經濟影響,要綜合考慮, 需要參考不同候選人的具體政策帶來的影響, 以及不同黨派不同群體對兩位候選人的不同 態度。因此預測結果僅作為參考。

關於作者

在此對Yuanchang Luo對本文所作的貢獻表示誠摯感謝,他在西北大學完成了應用統計碩士學位,專長數據挖掘、數據分析、機器學習等。

最受歡迎的見解

1.在python中使用lstm和pytorch進行時間序列預測

2.python中利用長短期記憶模型lstm進行時間序列預測分析

3.Python用RNN循環神經網絡:LSTM長期記憶、GRU門循環單元、回歸和ARIMA對COVID-19新冠疫情新增人數時間序列

4.Python TensorFlow循環神經網絡RNN-LSTM神經網絡預測股票市場價格時間序列和MSE評估準確性

5.r語言copulas和金融時間序列案例

6.R 語言用RNN循環神經網絡 、LSTM長短期記憶網絡實現時間序列長期利率預測

7.Matlab創建向量自回歸(VAR)模型分析消費者價格指數 (CPI) 和失業率時間序列

8.r語言k-shape時間序列聚類方法對股票價格時間序列聚類

9.R語言結合新冠疫情COVID-19股票價格預測:ARIMA,KNN和神經網絡時間序列分析

文章來源: https://twgreatdaily.com/zh-tw/1814c5415513e0807c37bcf29d6aba8d.html