R語言上市公司經營績效實證研究 ——因子分析、聚類分析、正態性檢驗、信度

2023-06-10     tecdat拓端

原標題:R語言上市公司經營績效實證研究 ——因子分析、聚類分析、正態性檢驗、信度

全文連結:http://tecdat.cn/?p=32747

原文出處:拓端數據部落公眾號

隨著我國經濟的快速發展,上市公司的經營績效成為了一個備受關注的話題。本文旨在探討上市公司經營績效的相關因素,並運用數據處理、圖示、檢驗和分析等方法進行深入研究,幫助客戶對我國45家上市公司的16項財務指標進行了因子分析與聚類分析。

分析脈絡如下:

  • 數據預處理(包括缺失值,異常值,標準化這些)
  • 數據圖示
  • 相關性檢驗正態性檢驗
  • 做因子分析和聚類分析

查看數據

讀取到r軟體中:

數據預處理(包括缺失值,異常值,標準化

首先,在進行數據分析前,需要對數據進行預處理。數據預處理包括缺失值的處理、異常值的排除、標準化處理等。另外,為了減少數據誤差,需要對數據進行標準化處理。

data=na.omit(data)

標準化和可視化

其次,在數據處理完成後,需要對數據進行圖示。通過繪製散點圖等圖示,可以直觀地了解各項指標的數值分布和趨勢變化。同時,圖示也有助於發現數據中的異常點和趨勢漂移等問題。

數據的標準化及適用性檢驗

然後,進行相關性檢驗和正態性檢驗等統計方法。相關性檢驗可以通過計算相關係數的方法來判斷各項指標之間的聯繫程度。而正態性檢驗則可以通過繪製機率圖、矩陣圖等方法,來判斷數據是否符合正態分布。通過這些檢驗方法,可以更準確地分析數據,並確定適當的分析方法。

相關性檢驗

正態性檢驗

shapiro.test(data[,2])

信度檢驗結果

信度檢驗結果是指對某種測量工具(例如問卷、測試等)進行信度檢驗後得到的結果。信度檢驗是一種評估測量工具穩定性和一致性的方法,通常使用統計學方法來計算測量工具的內部一致性或者重測信度。通過信度檢驗,可以確定測量工具的可靠性和準確性,從而確定測量結果的可信度。信度檢驗結果可以幫助研究者評估測量工具的質量,以確保研究結果的可靠性和有效性。

KMO檢驗:

KMO檢驗是一種用於評估數據是否適合進行因子分析的統計方法。KMO(Kaiser-Meyer-Olkin)檢驗的主要目的是測量數據集中各個變量之間的相關性,以確定是否存在足夠的共性方差,從而確定是否適合進行因子分析。KMO值介於0和1之間,通常認為KMO值大於0.6表示數據適合進行因子分析。如果KMO值低於0.6,則表明數據不適合進行因子分析,需要重新考慮數據收集和分析方法。

kmores=kmo(data\[,2:17])\

kmores\$overall

## [1] 0.5985173

因子分析和聚類分析

接下來,進行因子分析和聚類分析。因子分析旨在尋找出反映上市公司經營績效的主要因素,並通過統計方法進行因素提取和旋轉。而聚類分析則是將樣本進行分類,以便於對不同類別的上市公司進行比較分析。

因子分析

因子分析是一種統計方法,用於確定多個變量之間的關係。它將一組相關變量分解為更少的未觀察到的變量,稱為因子,這些因子可以解釋原始變量的方差。因子分析可用於數據降維、變量選擇和構建模型等應用。它在社會科學、市場研究和心理學等領域得到廣泛應用。

旋轉成分矩陣

因子得分排名

K-means聚類分析上市公司經營績效

K-means聚類分析是一種常用的無監督學習方法,用於將一組數據分成K個不同的類別。該算法通過疊代的方式將數據點分配到不同的類別中,並且通過計算每個類別的中心點來更新類別的位置。K-means聚類分析的目標是最小化每個數據點到其所屬類別中心點的距離平方和,從而使得每個類別內部的數據點儘可能的相似,不同類別之間的數據點儘可能的不同。該算法的優點是簡單易懂,計算速度快,適用於大規模數據集的聚類分析。

在上市公司經營績效的分析中,可以將公司的各項經營指標作為輸入數據,通過K-means聚類算法將公司分成若干類別,同一類別內的公司具有相似的經營績效表現。這樣可以幫助投資者或經營者更好地了解市場上不同公司的經營狀況,從而做出更明智的投資或經營決策。

memb <- hmod\$cluster

群集成員

cludata

plot(data[,2:17],mem

綜上所述,我國上市公司經營績效實證研究涉及到數據預處理、圖示、檢驗和分析等多個方面。其中,數據預處理和圖示為分析提供了基礎和依據,檢驗和分析則為研究提供了科學性和可靠性保障。通過本文的研究,可以更深入地了解上市公司經營績效的相關因素,為政府部門和企業提供決策參考。

最受歡迎的見解

1.matlab偏最小二乘回歸(PLSR)和主成分回歸(PCR)

2.R語言高維數據的主成分pca、 t-SNE算法降維與可視化分析

3.主成分分析(PCA)基本原理及分析實例

4.R語言實現貝葉斯分位數回歸、lasso和自適應lasso貝葉斯分位數回歸

5.使用LASSO回歸預測股票收益數據分析

6.r語言中對lasso回歸,ridge嶺回歸和elastic-net模型

7.r語言中的偏最小二乘回歸pls-da數據分析

8.R語言用主成分PCA、 邏輯回歸、決策樹、隨機森林分析心臟病數據並高維可視化

9.R語言主成分分析(PCA)葡萄酒可視化:主成分得分散點圖和載荷圖

文章來源: https://twgreatdaily.com/zh-hk/fe4820f62001d2e4cb0812f04c7db4e7.html