python用回歸模型對水泥生產關鍵溫度點預測模型

2023-03-17     tecdat拓端

原標題:python用回歸模型對水泥生產關鍵溫度點預測模型

全文連結:http://tecdat.cn/?p=31930

原文出處:拓端數據部落公眾號

分析師:Xiang Li

本項目目標為水泥生產關鍵生產數據的回歸及預測(某一關鍵溫度點的預測)。面臨挑戰如下所述:1.水泥行業屬於流程工業,流程工業由於其自身具有化學反應較多,前後流程耦合,控制變量多,生產波動等特點,使得數據來源、數據治理及特徵提取等步驟執行較為困難,因此大數據及人工智慧相關背景的從業人員無法直接按照離散工業中的數據分析流程進行智能化相關應用的項目實施;2.另一方面,流程工業的從業人員本身熟稔生產工藝,但對於智能化相關技術也缺乏了解,無法將豐富的一線經驗和生產數據獨立轉化成在線化智能化的應用。

解決方案

任務/目標

由水泥燒成系統的歷史生產數據,對其中某標誌性測量指標(C1旋風筒出口煙氣溫度)進行預測,從而能夠指導一線操作人員對水泥熟料的燒成系統進行煤量和風量的合理調節。

備註:該關鍵測量指標僅僅為眾多標誌性測量指標之一,因此實際的智能生產控制其實是針對多目標的預測及結合模型的控制與優化,進行該項目是在水泥生產中開展數據分析及後續機器學習技術應用的先導任務。

數據源準備

本項目的數據來源為生產所用的DCS系統的數據。

在線DCS系統導出數據源:本項目組與某水泥廠進行了長期的合作,我根據相對應工藝,篩選出了目標溫度參數對應的所有相關測量點位,在DCS系統中採集了目標點位和相關點位的2個月的生產數據,並導出到了CSV文件中以進行數據治理和特徵轉換;

特徵轉換 及數據治理

採集到的生產數據不能直接用於數據分析,我結合計量點位的情況及該批數據的特性,做出了以下轉換步驟(還有些預處理內容未列出):

1.剔除非數字內容對應列:DCS數據中有一些測量點位對應的測量儀表存在故障,顯示內容為非數字格式,此類數據均被剔除;

2.剔除恆定不變數據對應列:一些儀表點位的測量值早已超過量程(未及時更換新表),因此顯示數據為同一值(最大示數),該類所有數據均被剔除;

3.轉換時間戳數據格式:將原來CSV文件中的時間戳格式轉換為python中更易處理的datetime格式;

4.刪除停產對應的時間段的數據行。

數據 構造

在進行了數據治理後,我整理出了如下表所示的原始數據列表(涉及點位較多,僅顯示部分內容)。

圖1原始數據局部內容

圖2數據集概覽

劃分訓練集和測試集

針對該月份的數據劃分出前面21天的日期對應數據作為訓練數據集,後10天對應數據為測試數據集。

建模

針對這一典型的單目標多輸入變量的回歸問題,採用了最基本的scikit-learn中的linear regression(線性回歸)的方法進行模型建模。

模型 訓練及精度指標

採用訓練集針對模型進行了訓練,採用測試集進行了模型的精度驗證,通過比較預測結果,得到模型的預測的標準差為0.010775,預測的平均誤差為0.005065,可以認為此回歸模型符合生產的需求。

採用第三組數據(來自於DCS的相鄰月份的數據)進行模型的預測,最終得到的預測值和真實值的可視化結果如下圖所示:

由上圖可知,根據線性回歸模型預測得到的目標溫度的數值與真實值在大多數情況非常接近,在所採集的1.5個月的範圍內,考慮到工況運行較為平穩,應該可以滿足預測的實際需求。

應清醒的認識到,由於水泥燒成系統的生產包含的關鍵參數較多,且原燃料不可能一成不變,更常見的情況是原料和燃料均存在一定的波動,而反映兩者的質量分析數據並未包含在本項目的數據集中,因此該項目僅僅能夠作為流程工業單一參數預測的參考流程,並不能夠作為普遍適用的數據模型加以推廣。此外,神經網絡、SVM等模型也可以作為模型預測的建模方法,非線性回歸模型更適合波動工況及多變量輸入的目標值預測的項目(在2019年-2020年的水泥質量預測的項目中,採用了機器學習中的多個模型進行了建模工作)。

關於分析師

在此對Xiang Li對本文所作的貢獻表示誠摯感謝,他擅長深度學習、數據分析、網絡爬蟲 。

最受歡迎的見解

1.R語言多元Logistic邏輯回歸 應用案例

2.面板平滑轉移回歸(PSTR)分析案例實現

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言混合效應邏輯回歸Logistic模型分析肺癌

6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現

7.R語言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機森林算法預測心臟病

8.python用線性回歸預測股票價格

9.R語言用邏輯回歸、決策樹和隨機森林對信貸數據集進行分類預測

文章來源: https://twgreatdaily.com/464ded614fc41c17d5c4be80ca773686.html