數據變得越來越重要,其核心應用「預測」也成為各個行業以及產業變革的重要力量。對於股市來說,用人工智慧來對股價進行預測成為量化投資的一個重要手段。本項目幫助客戶運用powerBI獲取網易財經上茅台2020年股票數據、並用SPSSmodeler 的類神經網絡模型對第二天股價漲跌幅度進行預測。
數據對於機器學習十分重要。沒有合適的數據,就無法訓練機器學習模型,運用powerBI上的數據爬取功能,獲取網易財經上貴州茅台2020年全年數據、並進行數據清洗。
1、根據網頁結構,構建參數和自定義函數
2、用URL高級功能獲取茅台2020年數據
3 、用 powerQuery 編輯器對日期、漲跌幅等數據進行清洗和加工,得到規範的數據。
載入數據,進行數據分區,隨機選取 80% 數據訓練模型、 20% 的數據進行測試。
構建增強型的類神經網絡模型,對第二天股票漲跌幅度進行預測
對模型進行分析:其標準差為 0.996 、線性相關性為 0.806 ,模型基本符合要求。
修改模型參數和抽樣比等對模型進行優化
可以看出,第二天股價的預測值和真實值趨勢基本保持一致,但是預測時間越長其預測的準確度越低。
對於股票預測,模型的準確度與數據量的大小、K線關鍵技術指標、模型的選擇有很大的關係。通過不斷地改進模型和方法,股票的走勢是可以大致進行的預測的。
在此對Xu Zhang對本文所作的貢獻表示誠摯感謝,他專注數據採集、統計分析領域。擅長Excel、MySQL、powerBI、TableauBI、SPSSmodeler、Python。