Python用KShape對時間序列進行聚類和肘方法確定最優聚類數k可視化|附代碼數據

2023-02-08     tecdat拓端

原標題:Python用KShape對時間序列進行聚類和肘方法確定最優聚類數k可視化|附代碼數據

全文連結:http://tecdat.cn/?p=27078

最近我們被客戶要求撰寫關於時間序列聚類的研究報告,包括一些圖形和統計輸出。

時序數據的聚類方法,該算法按照以下流程執行。

import pandas as pd

# 讀取數據幀,將其轉化為時間序列數組,並將其存儲在一個列表中 tata = [] for i, df in enmee(dfs):

# 檢查每個時間序列數據的最大長度。 for ts in tsda:

if len(s) > ln_a:

lenmx = len(ts)

# 給出最後一個數據,以調整時間序列數據的長度 for i, ts in enumerate(tsdata):

dta[i] = ts + [ts[-1]] * n_dd

# 轉換為矢量 stack_list = [] for j in range(len(timeseries_dataset)):

stack_list.append(data)

# 轉換為一維數組 trasfome_daa = np.stack(ack_ist, axis=0)

return trafoed_data

數據集準備

# 文件列表flnes= soted(go.ob('mpldat/smeda*.csv'))

# 從文件中加載數據幀並將其存儲在一個列表中。for ienme in fiemes:

df = pd.read_csv(filnme, indx_cl=one,hadr=0) flt.append(df)

聚類結果的可視化

# 為了計算交叉關係,需要對它們進行歸一化處理。# TimeSeriesScalerMeanVariance將是對數據進行規範化的類。sac_da = TimeeiesalerMVarne(mu=0.0, std=1.0).fit_trnform(tranfome_data)# KShape類的實例化。ks = KShpe(_clusrs=2, n_nit=10, vrboe=True, rano_stte=sed)

yprd = ks.ft_reitsak_ata)# 聚類和可視化plt.tight_layout()

plt.show()

點擊標題查閱往期內容

R語言k-Shape時間序列聚類方法對股票價格時間序列聚類

左右滑動查看更多

01

02

03

04

用肘法計算簇數

  • 什麼是肘法...
  • 計算從每個點到簇中心的距離的平方和,指定為簇內誤差平方和 (SSE)。
  • 它是一種更改簇數,繪製每個 SSE 值,並將像「肘」一樣彎曲的點設置為最佳簇數的方法。

#計算到1~10個群組 for i in range(1,11):

#進行聚類計算。

ks.fit(sacdta)

#KS.fit給出KS.inrta_ disorons.append(ks.netia_)

plt.plot(range(1,11), disorins, marker='o')

點擊文末 「閱讀原文」

獲取全文完整資料。

本文選自《Python用KShape對時間序列進行聚類和肘方法確定最優聚類數k可視化》。

點擊標題查閱往期內容

R語言中的SOM(自組織映射神經網絡)對NBA球員聚類分析

K-means和層次聚類分析癌細胞系微陣列數據和樹狀圖可視化比較KMEANS均值聚類和層次聚類:亞洲國家地區生活幸福質量異同可視化分析和選擇最佳聚類數

PYTHON實現譜聚類算法和改變聚類簇數結果可視化比較

有限混合模型聚類FMM、廣義線性回歸模型GLM混合應用分析威士忌市場和研究專利申請數據

R語言多維數據層次聚類散點圖矩陣、配對圖、平行坐標圖、樹狀圖可視化城市宏觀經濟指標數據

r語言有限正態混合模型EM算法的分層聚類、分類和密度估計及可視化

Python Monte Carlo K-Means聚類實戰研究

R語言k-Shape時間序列聚類方法對股票價格時間序列聚類

R語言對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸

R語言譜聚類、K-MEANS聚類分析非線性環狀數據比較

R語言實現k-means聚類優化的分層抽樣(Stratified Sampling)分析各市鎮的人口

R語言聚類有效性:確定最優聚類數分析IRIS鳶尾花數據和可視化Python、R對小說進行文本挖掘和層次聚類可視化分析案例

R語言k-means聚類、層次聚類、主成分(PCA)降維及可視化分析鳶尾花iris數據集

R語言有限混合模型(FMM,finite mixture model)EM算法聚類分析間歇泉噴發時間

R語言用溫度對城市層次聚類、kmean聚類、主成分分析和Voronoi圖可視化

R語言k-Shape時間序列聚類方法對股票價格時間序列聚類

R語言中的SOM(自組織映射神經網絡)對NBA球員聚類分析

R語言複雜網絡分析:聚類(社區檢測)和可視化

R語言中的劃分聚類模型

基於模型的聚類和R語言中的高斯混合模型

r語言聚類分析:k-means和層次聚類

SAS用K-Means 聚類最優k值的選取和分析

用R語言進行網站評論文本挖掘聚類

基於LDA主題模型聚類的商品評論文本挖掘

R語言鳶尾花iris數據集的層次聚類分析

R語言對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸

R語言聚類算法的應用實例對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸

分位數回歸、GAM樣條曲線、指數平滑和SARIMA對電力負荷時間序列預測

【視頻】R語言廣義相加模型(GAM)在電力負荷預測中的應用

R語言里的非線性模型:多項式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析

R語言用標準最小二乘OLS,廣義相加模型GAM ,樣條函數進行邏輯回歸LOGISTIC分類

R語言ISLR工資數據進行多項式回歸和樣條回歸分析

R語言中的多項式回歸、局部回歸、核平滑和平滑樣條回歸模型

R語言用泊松Poisson回歸、GAM樣條曲線模型預測騎自行車者的數量

R語言中的多項式回歸、B樣條曲線(B-spline Curves)回歸

R語言廣義相加模型 (GAMs)分析預測CO2時間序列數據

R語言中實現廣義相加模型GAM和普通最小二乘(OLS)回歸

在r語言中使用GAM(廣義相加模型)進行電力負荷時間序列分析

R語言用泊松Poisson回歸、GAM樣條曲線模型預測騎自行車者的數量

Python用廣義加性模型GAM進行時間序列分析

R語言廣義線性模型GLM、多項式回歸和廣義可加模型GAM預測鐵達尼號倖存者

R語言中的廣義線性模型(GLM)和廣義相加模型(GAM):多元(平滑)回歸分析保險資金投資組合信用風險敞口

R語言對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸

對用電負荷時間序列數據進行K-medoids聚類建模和GAM回歸

文章來源: https://twgreatdaily.com/01aee57398e9db5b8d0ad09bc210a3ee.html