全文連結:http://tecdat.cn/?p=27078
最近我們被客戶要求撰寫關於時間序列聚類的研究報告,包括一些圖形和統計輸出。
時序數據的聚類方法,該算法按照以下流程執行。
import pandas as pd
# 讀取數據幀,將其轉化為時間序列數組,並將其存儲在一個列表中 tata = [] for i, df in enmee(dfs):
# 檢查每個時間序列數據的最大長度。 for ts in tsda:
if len(s) > ln_a:
lenmx = len(ts)
# 給出最後一個數據,以調整時間序列數據的長度 for i, ts in enumerate(tsdata):
dta[i] = ts + [ts[-1]] * n_dd
# 轉換為矢量 stack_list = [] for j in range(len(timeseries_dataset)):
stack_list.append(data)
# 轉換為一維數組 trasfome_daa = np.stack(ack_ist, axis=0)
return trafoed_data
數據集準備
# 文件列表flnes= soted(go.ob('mpldat/smeda*.csv'))
# 從文件中加載數據幀並將其存儲在一個列表中。for ienme in fiemes:
df = pd.read_csv(filnme, indx_cl=one,hadr=0) flt.append(df)
聚類結果的可視化
# 為了計算交叉關係,需要對它們進行歸一化處理。# TimeSeriesScalerMeanVariance將是對數據進行規範化的類。sac_da = TimeeiesalerMVarne(mu=0.0, std=1.0).fit_trnform(tranfome_data)# KShape類的實例化。ks = KShpe(_clusrs=2, n_nit=10, vrboe=True, rano_stte=sed)
yprd = ks.ft_reitsak_ata)# 聚類和可視化plt.tight_layout()
plt.show()
點擊標題查閱往期內容
R語言k-Shape時間序列聚類方法對股票價格時間序列聚類
左右滑動查看更多
01
02
03
04
用肘法計算簇數
- 什麼是肘法...
- 計算從每個點到簇中心的距離的平方和,指定為簇內誤差平方和 (SSE)。
- 它是一種更改簇數,繪製每個 SSE 值,並將像「肘」一樣彎曲的點設置為最佳簇數的方法。
#計算到1~10個群組 for i in range(1,11):
#進行聚類計算。
ks.fit(sacdta)
#KS.fit給出KS.inrta_ disorons.append(ks.netia_)
plt.plot(range(1,11), disorins, marker='o')
點擊文末 「閱讀原文」
獲取全文完整資料。
本文選自《Python用KShape對時間序列進行聚類和肘方法確定最優聚類數k可視化》。
點擊標題查閱往期內容
R語言中的SOM(自組織映射神經網絡)對NBA球員聚類分析
K-means和層次聚類分析癌細胞系微陣列數據和樹狀圖可視化比較KMEANS均值聚類和層次聚類:亞洲國家地區生活幸福質量異同可視化分析和選擇最佳聚類數
PYTHON實現譜聚類算法和改變聚類簇數結果可視化比較
有限混合模型聚類FMM、廣義線性回歸模型GLM混合應用分析威士忌市場和研究專利申請數據
R語言多維數據層次聚類散點圖矩陣、配對圖、平行坐標圖、樹狀圖可視化城市宏觀經濟指標數據
r語言有限正態混合模型EM算法的分層聚類、分類和密度估計及可視化
Python Monte Carlo K-Means聚類實戰研究
R語言k-Shape時間序列聚類方法對股票價格時間序列聚類
R語言對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸
R語言譜聚類、K-MEANS聚類分析非線性環狀數據比較
R語言實現k-means聚類優化的分層抽樣(Stratified Sampling)分析各市鎮的人口
R語言聚類有效性:確定最優聚類數分析IRIS鳶尾花數據和可視化Python、R對小說進行文本挖掘和層次聚類可視化分析案例
R語言k-means聚類、層次聚類、主成分(PCA)降維及可視化分析鳶尾花iris數據集
R語言有限混合模型(FMM,finite mixture model)EM算法聚類分析間歇泉噴發時間
R語言用溫度對城市層次聚類、kmean聚類、主成分分析和Voronoi圖可視化
R語言k-Shape時間序列聚類方法對股票價格時間序列聚類
R語言中的SOM(自組織映射神經網絡)對NBA球員聚類分析
R語言複雜網絡分析:聚類(社區檢測)和可視化
R語言中的劃分聚類模型
基於模型的聚類和R語言中的高斯混合模型
r語言聚類分析:k-means和層次聚類
SAS用K-Means 聚類最優k值的選取和分析
用R語言進行網站評論文本挖掘聚類
基於LDA主題模型聚類的商品評論文本挖掘
R語言鳶尾花iris數據集的層次聚類分析
R語言對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸
R語言聚類算法的應用實例對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸
分位數回歸、GAM樣條曲線、指數平滑和SARIMA對電力負荷時間序列預測
【視頻】R語言廣義相加模型(GAM)在電力負荷預測中的應用
R語言里的非線性模型:多項式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析
R語言用標準最小二乘OLS,廣義相加模型GAM ,樣條函數進行邏輯回歸LOGISTIC分類
R語言ISLR工資數據進行多項式回歸和樣條回歸分析
R語言中的多項式回歸、局部回歸、核平滑和平滑樣條回歸模型
R語言用泊松Poisson回歸、GAM樣條曲線模型預測騎自行車者的數量
R語言中的多項式回歸、B樣條曲線(B-spline Curves)回歸
R語言廣義相加模型 (GAMs)分析預測CO2時間序列數據
R語言中實現廣義相加模型GAM和普通最小二乘(OLS)回歸
在r語言中使用GAM(廣義相加模型)進行電力負荷時間序列分析
R語言用泊松Poisson回歸、GAM樣條曲線模型預測騎自行車者的數量
Python用廣義加性模型GAM進行時間序列分析
R語言廣義線性模型GLM、多項式回歸和廣義可加模型GAM預測鐵達尼號倖存者
R語言中的廣義線性模型(GLM)和廣義相加模型(GAM):多元(平滑)回歸分析保險資金投資組合信用風險敞口
R語言對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸
對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸