基於E-R圖,你能分析出哪些業務指標?

2023-07-11     CDA數據分析師

原標題:基於E-R圖,你能分析出哪些業務指標?

給你一張E-R圖,它由3張表組成,據此你能分析出哪些業務指標?請詳述你的分析思路。

解析:將常見的一些業務分析指標,還原成數據表的基礎欄位,通俗的說就是知道如何將表中的基本欄位進行計算後得到一些分析指標,是數據分析師的基本功。

知識點1:

E-R圖即實體-聯繫圖(Entity Relationship Diagram),是指提供了表示實體型、屬性和聯繫的方法,用來描述現實世界的概念模型。E-R方法:是「實體-聯繫方法」(Entity-Relationship Approach)的簡稱。它是描述現實世界概念結構模型的有效方法。

從3張表的表間關係、表名、欄位名等特徵來看,這應該是記錄了零售行業,或者電商行業的一個簡單的業務信息。作為零售行業,應關注如下指標:

  • 用戶層面

用戶層面

下單用戶數、總用戶數、下單用戶占比、各性別用戶占比、各性別用戶下單占比、

  • 訂單層面

訂單層面

銷量、銷售額、人均訂單數、人均消費額(客單價)

  • 區域層面

區域層面

按省、市維度分析:銷量、銷售額,可以從總數分析、也可以從最大值(單筆訂單)分析。在省、市維度中,可以各省匯總排名、各市匯總排名、省內各市匯總排名等。非常靈活,看實際分析需求。

知識點2:去重計數

在orderinfo表中計算下單人數的時候,要注意對userid進行去重計數,因為一個用戶可以多次下單。

知識點3:多表連接

(1)計算下單用戶中,性別比例問題

要用userinfo和orderinfo兩表連接,可以用內連接,也可以用左/右連接切記以orderinfo為主表(保證未下單的用戶排除掉)。

(2)在按區域為維度進行分析時,必須將orderinfo與regioninfo進行兩次連接,從而得到省名稱、市名稱。此時要注意兩點:

- 連接後的select子句中避免出現重複欄位,導致後面的二次查詢報錯。

- 在與regionname進行連接的時候,可以用內連接,也可以用左連接(orderinfo表為主表),一定要給regioninfo表設置表別名。

將orderinfo與regioninfo兩次表連接,得到基礎表的寬表,後面查詢可在此基礎上操作,示例如下:

Select orderinfo.*, 省表.regionname as 省, 市表.regionname as 市

from orderinfo

left join regioninfo as 省表 on province=省表.regionid

left join regioninfo as 市表 on city=市表.regionid

文章來源: https://twgreatdaily.com/3b2de3e5f2d2f4e585625977b41a8d15.html