上海、國際新冠疫情數據分析可視化

2023-11-07     tecdat拓端

原標題:上海、國際新冠疫情數據分析可視化

原文連結:https://tecdat.cn/?p=34192

原文出處:拓端數據部落公眾號

分析師:Junjie Chen

新冠疫情的發展情況已經成為人們目前最密切關注的問題之一,疫情的歷史數據以圖形的形式進行對比和呈現能夠讓客戶直觀地了解各地區疫情的發展情況。

解決方案

任務/目標

分析上海各區縣、上海與其他省市和地區以及全球各國的新冠疫情數據進行分析及可視化處理。數據的時間跨度為2020年1月20日至2020年4月8日。

數據源準備

記錄了多個層次、較為完整的新冠疫情數據,篩選原始數據中的中國省級、上海地區區縣級以及全球國家級三個層級的數據,挑選累計確診、累計死亡、累計治癒、新增確診、新增死亡、新增治癒等指標,並對數據進行預處理。

上海、國際疫情分析

折線圖

折線圖是基本的統計圖表之一,能夠用來反映疫情隨時間變化的情況。

條形圖

條形圖也是基本的統計圖表之一,將條形圖的數據進行分類和疊加能夠反映地區新冠患者的匯總情況以及累計確診、累計治癒、累計死亡的比例,在同一張圖表中壓縮更多的信息。

動態條形圖

隨著公眾號、網站等多媒體平台作為新聞獲取的渠道,動態的圖表能夠包含更多的信息,加入時間維度後,動態圖表便能反映疫情排名隨時間的變化情況,且動態的圖片更能夠吸引讀者的眼球,結果更加令讀者印象深刻。

熱力圖

熱力圖往往與地理信息相結合,由於本案例探究的是上海地區、國際的疫情分布情況,因此可以將疫情數據覆蓋在地圖上,顏色越深的地區代表疫情更為嚴重。熱力圖能夠從空間分布上展現疫情的擴散情況。

南丁格爾玫瑰圖

形狀似螺旋狀排列的條形圖,新穎、美觀且能夠將數據直觀地進行對比展示,可用於各國疫情的排名對比。

根據上海在觀測期內的疫情新增走勢圖,我們能發現疫情的發展出現了三個不同的發展階段:快速上升、回落、回升。除此以外我們還能在圖3中發現新增確診與新增治癒的走勢圖有非常高的相似程度,事實上新增治癒的走勢圖就是新增確診的延遲,而延遲的天數在2周左右,由此我們可以推斷,新冠狀病毒從入院治療至康復出院的周期大約是14天。國家醫療專家組成員李興旺1月28日在國家衛健委新聞發布會上曾表示,對於輕症患者來說,康復的周期大約在一周左右,而對於病情偏重的感染者來說,可能需要兩周或更長時間,這與我們所觀察到的情況較為相符。

截至2020年4月8日,上海累積確診人數出現最多的分別是浦東新區、寶山區和閔行區。據2019年上海統計局公布的數據,浦東、閔行和寶山三區的常住人口數量位列前三,與此同時這三個區外來人口較多,人口流動密集,與目前疫情確診的數據相符。而值得注意的是,徐匯、靜安和長寧等人口占比排名較為靠後的市轄區出現的確診人數卻尤為靠前,通過上海各區縣條形圖,我們也能發現這一趨勢:

由於格式限制,上海Top10疫情排行的動態條形圖以截圖形式進行展示:

下圖為上海地區疫情發展情況熱力圖,展示了2020年4月8日上海的累計確診狀況,可見疫情主要分布於上海市中心地區(黃浦、徐匯區、長寧、楊浦、虹口、普陀、靜安)以及浦東新區,而上海的疫情增長較快的也是上述地區,自2020年2月25日起新增確診病例數也未見明顯上升,體現出上海本地區各區縣的疫情已經獲得很好的控制。

國際疫情分析

自從國內疫情於2020年1月20日爆發以來,由於早期對新冠病毒傳染機制不夠深入的了解,加之無症狀感染者存在的特殊性,世界衛生組織於2020年1月24日對本次新冠疫情的評估為「尚不構成國際突發衛生事件」。但隨著世界各國陸續出現感染病例,世界衛生組織於2020年1月31日對此次疫情的評估等級上升為「國際關注的突發公共衛生事件」,然而對新冠病毒的傳染性的認識偏差和系統性的低估風險,仍然給出了「沒有必要採取限制國際人員流動的措施,不建議限制旅行」的建議,從某種程度上來看,這給日後新冠疫情在世界各國的爆發埋下了隱患。直至2020年2月28日,世界衛生組織才將新冠疫情全球風險級別由此前的 「高」上調為「非常高」,並與2020年3月11日宣布「新型冠狀病毒全球大流行」。根據全球疫情熱力圖,初步可以看出全球疫情的嚴重程度。

由全球確診數排名前25的國家的南丁格爾玫瑰圖,可見全球各國的累計確診人數已經達到了相當大的規模,確診數排名第25的日本也達到了5548例之多,確診病例數排名第一的美國已達到了431694例。根據南丁格爾玫瑰圖的排名,本文重點關注了除中國外確診人數最多的九個國家:美國、西班牙、義大利、德國、法國、伊朗、英國、土耳其、比利時,圖9和圖10分別展示了這九個國家2020年2月20日以來累計確診病例的增加數量和每日新增確診病例數量,其中最為嚴重的美國確診就人數即將突破50萬,並且日增確診在3萬左右居高不下,從累計確診的斜率來看,確診增長仍無放緩趨勢。而在三月中旬採取了大規模「封城措施」的歐洲國家,每日新增確診人數似乎得到了控制,並未持續增加,而是穩中有降,從累計走勢圖中也可以看出這些歐洲國家的增長曲線的斜率也有放緩的趨勢。

關於分析師

在此對Junjie Chen對本文所作的貢獻表示誠摯感謝,他在上海交通大學完成了博士學位,專注計算機視覺、遷移學習、弱監督學習等領域。擅長R語言、SPSS、Python。

最受歡迎的見解

1.R語言結合新冠疫情COVID-19股票價格預測:ARIMA,KNN和神經網絡時間序列

2.Python用RNN循環神經網絡:LSTM長期記憶、GRU門循環單元、回歸和ARIMA對COVID-19新冠疫情新增人數

3.MATLAB用高斯曲線擬合模型分析疫情

4.疫情下的新聞數據觀察

5.MATLAB用高斯曲線擬合模型分析疫情

6.在R語言中使用航空公司複雜網絡對疫情進行建模

7.R軟體SIR模型網絡結構擴散過程模擬

8.R語言和Stan,JAGS:用rstan,rjag建立多元貝葉斯線性回歸預測選舉

9.R語言和JAGS:用rjag建立多元貝葉斯線性回歸預測選舉

文章來源: https://twgreatdaily.com/zh-hk/e4fcaa531b38ade70961e3d587183bbc.html