R語言Apriori關聯規則、K-means均值聚類數據挖掘中藥專利復方治療|附代碼數據

2023-11-01     tecdat拓端

原標題:R語言Apriori關聯規則、K-means均值聚類數據挖掘中藥專利復方治療|附代碼數據

全文連結:http://tecdat.cn/?p=30605

原文出處:拓端數據部落公眾號

應用關聯規則、聚類方法等數據挖掘技術分析治療抑鬱症的中藥專利復方組方配伍規律。方法檢索治療抑鬱症中藥專利復方,排除外用中藥及中西藥物合用的復方。

最近我們被要求撰寫關於用藥規律的研究報告,包括一些圖形和統計輸出。對入選的中藥專利復方進行術語規範化等處理,抽取信息、建立表,應用數據分析軟體R對數據進行關聯規則分析,應用網絡分析軟體進行聚類分析。

查看數據

轉換成二值矩陣數據

colnames(data) <- paste0("X",1:ncol(data))

for(i in 1:nrow(data)) {

tmp <- integer(length(total_types))

建立apriori

plot(all_rules, method = "graph")

中藥專利復方中藥對的關聯規則分析

藥對是方劑配伍的基本形式,它反映了中藥之間相輔相成、相反相成、同類相從等配伍關係。藥對中的中藥在組方配伍時具有在處方中同時出現的特點,因此在關聯規則分析中,分析置信度較大且雙向關聯的規則即可得到藥對。

根據置信度和支持度篩選強關聯規則

K-means均值網絡聚類分析

抑鬱症中藥專利復方中藥物之間形成了一個複雜的配伍關係網絡,關聯規則分析可以用來發現其中的藥對及強關聯規則,但隨著支持度和置信度閾值參數的降低,關聯規則大量湧現,使得其中的配伍規律變得難以分析,應用網絡聚類方法可以有效地發現其中的配伍規律。

#聚類類別號

kmod$cluster

查看每個類別中的強關聯規則

聚類1

聚類2

配伍關係網絡的聚類分析結果顯示了抑鬱症治療中常用的中藥「社團」,反映了復方中一些配伍關係相對密切、固定的中藥聯合,臨床運用可以提高療效。

最受歡迎的見解

1.R語言分布式滯後非線性模型(DLNM)空氣污染研究溫度對死亡率影響建模

2.R語言分布滯後線性和非線性模型(DLNM)分析空氣污染(臭氧)、溫度對死亡率時間序列數據

3.R語言群組變量選擇、組懲罰GROUP LASSO套索模型預測分析新生兒出生體重風險因素數據和交叉驗證、可視化

4.R語言邏輯回歸、隨機森林、SVM支持向量機預測FRAMINGHAM心臟病風險和模型診斷可視化

5.R語言非線性混合效應 NLME模型(固定效應&隨機效應)對抗哮喘藥物茶鹼動力學研究

6.R語言使用限制平均生存時間RMST比較兩條生存曲線分析肝硬化患者

7.分類回歸決策樹交互式修剪和更美觀地可視化分析細胞圖像分割數據集

8.PYTHON深度學習實現自編碼器AUTOENCODER神經網絡異常檢測心電圖ECG時間序列

9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標

文章來源: https://twgreatdaily.com/zh-cn/975628bb3dd159eeb9a26e3959bf74fa.html