最近我們被客戶要求撰寫關於GAM廣義相加模型的研究報告,包括一些圖形和統計輸出。
現實情況是,我們經常要處理多個自變量和一個因變量之間的關係,此外,雖然通過做散點圖可以發現非線性關係,但很難歸因其形式,多項式回歸在廣義線性模型中,由於其不可解釋的係數,降低了模型的有用性。
本文使用的廣義加性模型提供了一種首選方案來研究多個自變量與因變量之間的關係,而無需事先了解因變量和自變量之間的關係,而是使用非線性平滑項來擬合模型。
廣義相加模型(GAM:Generalized Additive Model),它模型公式如下:有p個自變量,其中X1與y是線性關係,其他變量與y是非線性關係,我們可以對每個變量與y擬合不同關係,對X2可以擬合局部回歸,X3採用光滑樣條,不必採用統一的關係,而最終結果『加』在一起就可以了。
最近我們被要求探討公交專用道,工作日,向西方向,早高峰,停駐時間係數,延誤係數對行程時間變異度的影響。
所有因素中,公交專用道 對 行程時間變異度 的影響最大,且可以減少行程時間變異度。
序號自變量變量類型1公交專用道0.1 變量2工作日0.1 變量3向西方向0.1 變量4早高峰0.1 變量5信號燈離散變量 整數6延誤係數連續變量7行程時間可靠性連續變量
讓我們使用summary函數對第一個模型進行診斷。
P值:給定變量對因變量的統計顯著性,通過F檢驗進行檢驗(越低越好)。調整後的R平方(越高越好)。 s()是樣條函數,括號裡面的數字是定義的自由度,除了使用回歸樣條,還能使用局部樣條lo()函數,得到的結果與上面的結果十分類似。
採用plot()可以將模型畫出來,圖橫坐標為自變量X,縱坐標為因變量Y。
讓我們使用summary函數進行診斷。
P值:給定變量對因變量的統計顯著性,通過F檢驗進行檢驗(越低越好)。從結果可以看到公交專用道對行程時間變異度有顯著影響。
最受歡迎的見解
1.R語言多元Logistic邏輯回歸 應用案例
2.面板平滑轉移回歸(PSTR)分析案例實現
3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
4.R語言泊松Poisson回歸模型分析案例
5.R語言回歸中的Hosmer-Lemeshow擬合優度檢驗
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現
7.在R語言中實現Logistic邏輯回歸
8.python用線性回歸預測股票價格
9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標