全文連結:http://tecdat.cn/?p=31480
原文出處:拓端數據部落公眾號
我國以前一直以來都是世界上大豆生產的第一大國。但由於各國的日益強大,導致我國豆種植面積和產量持續縮減。因此,預測我國的大豆產量對中國未來的經濟發展有著極其重要的作用。
我們為一位客戶進行了短暫的諮詢工作,他正在構建一個主要基於ARIMA的大豆產量預測應用程式,運用SAS與eviews軟體對全國1957年到2009年大豆產量的歷史數據建立時間序列ARIMA模型,通過判斷其穩定性與是否通過白噪聲檢驗,建立AR(2)模型。最後,因通過殘差白噪聲檢驗,對數據進行分析並預測未來五年的我國的大豆產量。
一、問題分析
預測未來5年我國的大豆產量及其發展趨勢,對國民經濟與人民生活都是百利而無一害的。同時,還可以提前讓國家了解未來的情況,及時作出應對措施。
我國的大豆出產量的數據,在此假設所有數據真實可靠(詳見下表1),並假設在預測期內不發生任何影響我國的大豆出產量的突發事件。
difx=dif(x);
year=intnx('year', **'1jan1957'd**,_n_-**1**);
二、模型識別
首先,根據原始數據繪製時間序列圖形,觀察序列特徵。圖形如下:
plot x*year difx*year;
圖1 我國的大豆產量時序圖
由原始數據的時間序列圖可以看出,資料數據呈現明顯的上升趨勢,其平均數不穩定,是非平穩序列。
圖2 原始序列的自相關圖
上圖是自相關函數的結果,自相關函數衰減到0的速度緩慢,由此可以再次確定序列是非平穩的。
因為原序列呈現出上升的趨勢,故選擇1階差分。1階差分後的時序圖如下所示。
圖3 1階差分後的時序圖
由該圖可以看出差分後的時間序列在均值附近比較穩定地波動。為了進一步確定平穩性,考察差分後序列的自相關圖(如下所示)。
接下來,我們對差分後的時間序列進行ARMA模型的建立。季節差分後數據的自相關函數如下:
圖4 1階差分後的自相關係數圖
從上面的分析結果可以看到自相關圖顯示很強的短期相關性,所以可以初步認為1階差分後序列平穩。
隨後,對1階差分後序列進行白噪聲檢驗,結果如下圖所示。
圖5 1階差分後白噪聲檢驗圖
在檢驗的顯著水平取為0.05時,由於上述所有延遲階數的P值都小於0.05,所以該差分後的序列不能視為白噪聲序列,即差分後序列還蘊藏著不容忽視的相關信息可供提取。
1階差分後序列的自相關圖已經顯示該序列自相關係數具有拖尾的性質。再考慮其偏自相關係數的性質(見下圖)。
圖6 偏自相關係數圖
根據自相關圖和偏自相關圖的特點,進行模型的定階。偏自相關圖顯示,延遲1階和2階的偏自相關係數顯著大於2倍標準差範圍內波動,其他階數的偏自相關係數都比較小。通過多方面的考慮,最後認為AR(2)模型為最優模型。接著,綜合考慮前面的差分運算,實際上是對原序列擬合模型ARIMA(2,1,0)。
三、參數估計
在此,本文採用最小二乘法來估計參數,得到未知參數的估計值為:
圖7 參數估計圖
四、模型確定
由上面的輸出結果可知擬合的方程如下:
圖8 模型擬合結果圖
該輸出形式等價於
五、模型檢驗
本文需要檢驗殘差是否有自相關性,由SAS的分析結果得知,不存在自相關性,即殘差序列通過白噪聲檢驗。
圖9殘差白噪聲檢驗
六、模型的預測
本文給出了後面5年的人口自然增長率預測值以及置信區間。
forecast lead=**5** id=year out=out;
plot x*year=**1** forecast*year=**2** l95*year=**3** u95*year=**3**/overlay;
圖10 預測值以及置信區間
通過圖示可以直觀地看出該模型對序列的擬合效果良好。
七、 總結與建議
從對我國大豆出產量的預測值可以看出,大豆的產量會相對提高,不過提高的速率跟之前的相比也不會相差太大。因此,為了提高我國的大豆產量,我提出了以下幾點:
1、為大豆生產提供技術支撐。目前我國水稻、玉米和小麥的單產基本位於國際領先水平,大豆單產卻與國際水平有較大差距,這也說明提高我國大豆單產還是很有潛力的。所以,我們應該選育和改良大豆品種,為大豆生產提供優良的種質資源。
2、充分利用我國的自然資源,進一步擴大大豆的種植面積,為擴大我國大豆生產規模和優化區域布局提供保障。
3、提高我國大豆在國際市場的競爭優勢,以食品的安全性為主打,向外國銷售。
八、 參考文獻
[1]應用時間序列分析(第三版),王燕 編著 中國人民大學出版社
最受歡迎的見解
1.在python中使用lstm和pytorch進行時間序列預測
2.python中利用長短期記憶模型lstm進行時間序列預測分析
3.Python用RNN循環神經網絡:LSTM長期記憶、GRU門循環單元、回歸和ARIMA對COVID-19新冠疫情新增人數時間序列
4.Python TensorFlow循環神經網絡RNN-LSTM神經網絡預測股票市場價格時間序列和MSE評估準確性
5.r語言copulas和金融時間序列案例
6.R 語言用RNN循環神經網絡 、LSTM長短期記憶網絡實現時間序列長期利率預測
7.Matlab創建向量自回歸(VAR)模型分析消費者價格指數 (CPI) 和失業率時間序列
8.r語言k-shape時間序列聚類方法對股票價格時間序列聚類
9.R語言結合新冠疫情COVID-19股票價格預測:ARIMA,KNN和神經網絡時間序列分析