自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數據|附代碼數據

2023-07-18     tecdat拓端

原標題:自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數據|附代碼數據

全文連結:http://tecdat.cn/?p=12310

最近我們被客戶要求撰寫關於自然語言處理NLP的研究報告,包括一些圖形和統計輸出。

新冠肺炎的爆發讓今年的春節與往常不同。與此同時,新聞記錄下了這場疫情發展的時間軸

為此我們分析了疫情相關的新聞內容、發布時期以及發布內容的主題和情感傾向這些方面的數據,希望通過這些數據,能對這場疫情有更多的了解。

新聞對疫情相關主題的情感傾向

通過對疫情相關的新聞進行主題分析和情感分析,我們可以得到每個主題的關鍵詞以及情感分布。

圖表1

症狀檢測主題的新聞內容表達出最多積極情感,該話題下討論的是醫院中檢測患者的症狀,其次是城市服務以及學校相關的新聞內容,討論了商店關閉,社區隔離和學校延遲開學等話題,生活主題也表達出較多的積極情感(關鍵詞:時間、家庭),疫情增加了家人相處的時間(圖1)。

點擊標題查閱往期相關內容

R語言自然語言處理(NLP):情感分析新聞文本數據

左右滑動查看更多

01

02

03

04

新聞表達的情感傾向隨時間變化

考慮到新聞發布的時間、新聞相關的話題因素,圖2顯示了通過情感交叉分析得到的結果。

圖表2

從話題排名來看,不同時間段的新聞中最熱門的話題都有經濟、出行和政治。從情感分布來看,1月份的經濟主題新聞表達出較多的負面情緒(如股市因對冠狀病毒的日益關注而下跌)。3月份隨著疫情逐漸好轉,城市主題新聞(如疫情期間保證商店服務和生產經營)的熱度排名超過防護主題(關鍵詞:口罩,洗手,健康等)。從1月到3月,各個主題下的積極情感比例都在不斷增加。

新聞對不同主題關鍵詞的關注度

考慮到不同話題的關注度,圖3顯示了高頻關鍵詞的分布。

圖表3

從中我們可以看到疫情相關的新聞中最關注的方面,首先是健康,家庭和隔離和出行,其中健康出現的頻率最高。然後關注的話題,包含冠狀病毒、疫情期間的工作和病毒檢測。其次關注的話題包含區分健康和感染的症狀。其他關注的熱門關鍵詞包含學校、商業、旅行和經濟等。

本文章中的所有信息(包括但不限於分析、預測、建議、數據、圖表等內容)僅供參考,拓端數據(tecdat)不因文章的全部或部分內容產生的或因本文章而引致的任何損失承擔任何責任。

本文摘選 自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數據 ,點擊「閱讀原文」獲取全文完整資料。

點擊標題查閱往期內容

【視頻】文本挖掘:主題模型(LDA)及R語言實現分析遊記數據

NLP自然語言處理—主題模型LDA案例:挖掘人民網留言板文本數據

Python主題建模LDA模型、t-SNE 降維聚類、詞雲可視化文本挖掘新聞組數據集

自然語言處理NLP:主題LDA、情感分析疫情下的新聞文本數據

R語言對NASA元數據進行文本挖掘的主題建模分析

R語言文本挖掘、情感分析和可視化哈利波特小說文本數據

Python、R對小說進行文本挖掘和層次聚類可視化分析案例

用於NLP的Python:使用Keras進行深度學習文本生成

長短期記憶網絡LSTM在時間序列預測和文本分類中的應用

用Rapidminer做文本挖掘的應用:情感分析

R語言文本挖掘tf-idf,主題建模,情感分析,n-gram建模研究

R語言對推特twitter數據進行文本情感分析

Python使用神經網絡進行簡單文本分類

用於NLP的Python:使用Keras的多標籤文本LSTM神經網絡分類

R語言文本挖掘使用tf-idf分析NASA元數據的關鍵字

R語言NLP案例:LDA主題文本挖掘優惠券推薦網站數據

Python使用神經網絡進行簡單文本分類

R語言自然語言處理(NLP):情感分析新聞文本數據

Python、R對小說進行文本挖掘和層次聚類可視化分析案例

R語言對推特twitter數據進行文本情感分析

R語言中的LDA模型:對文本數據進行主題模型topic modeling分析

R語言文本主題模型之潛在語義分析(LDA:Latent Dirichlet Allocation)R語言對NASA元數據進行文本挖掘的主題建模分析

R語言文本挖掘、情感分析和可視化哈利波特小說文本數據

Python、R對小說進行文本挖掘和層次聚類可視化分析案例

用於NLP的Python:使用Keras進行深度學習文本生成

長短期記憶網絡LSTM在時間序列預測和文本分類中的應用

用Rapidminer做文本挖掘的應用:情感分析

R語言文本挖掘tf-idf,主題建模,情感分析,n-gram建模研究

R語言對推特twitter數據進行文本情感分析

Python使用神經網絡進行簡單文本分類

用於NLP的Python:使用Keras的多標籤文本LSTM神經網絡分類

R語言文本挖掘使用tf-idf分析NASA元數據的關鍵字

R語言NLP案例:LDA主題文本挖掘優惠券推薦網站數據

Python使用神經網絡進行簡單文本分類

R語言自然語言處理(NLP):情感分析新聞文本數據

Python、R對小說進行文本挖掘和層次聚類可視化分析案例

R語言對推特twitter數據進行文本情感分析

R語言中的LDA模型:對文本數據進行主題模型topic modeling分析

R語言文本主題模型之潛在語義分析(LDA:Latent Dirichlet Allocation)

文章來源: https://twgreatdaily.com/zh-cn/d57371bb264f85fe526c147baa185f53.html