三個方法教你做詞雲圖,連文科生都能輕鬆學會

2019-07-19     數據分析不是個事兒

經常做數據分析的人肯定不會對詞雲圖感到陌生,尤其是近幾年來非常流行,不管是發布會、行業報告還是新聞,都喜歡使用詞雲這種形式,將信息的關鍵詞組成形象生動的圖案,一下子就能抓住生人眼球,因為詞雲圖這種可視化圖表給人的第一印象就是足夠裝逼,足夠亮眼

羅振宇的跨年演講中用到詞雲

但是詞語云圖的最大優點,其實並不是它的顏值,而是它能夠能夠直觀地展示數據頻率,對出現頻率較高的關鍵詞予以重點突出,從而過濾掉大量的文本信息,幫助我們進行數據分析。

而且,如果能夠親手做一個詞雲圖,發到朋友圈裡豈不是能夠帥到沒朋友?

網上有很多線上詞雲製作網站,但是基本上很難實現對數據的篩選和過濾,僅僅是有著好看的皮囊而已。對於數據分析人而言,還是要藉助專業的分析工具,下面我就用PythonFineBI這兩個常用的數據分析工具,分別實操一下如何製作炫酷又裝逼的詞雲。

Pyhton

1、安裝Python運行環境和套裝

這個不必多說,推薦下載的套裝是anaconda,做詞雲很好用。下載完畢後,配置好運營環境後,執行安裝文件就行了。

2、準備數據

下面是我隨便找了一篇英文文章,作為要進行詞雲製作的數據基礎:

我把其中的正文文字部分拷貝了下來,存儲為一個文本文件,叫做yes-minister.txt,把這個文件挪動到我們的工作目錄demo里,這樣數據就準備好了。

3、開始做詞雲了

做詞雲的核心步驟只有兩個——輸入文本呼喚詞雲包

首先,在命令行下,輸入:

jupyter notebook

瀏覽器會自動開啟,並且顯示如下介面——Jupyter的主頁面,我們點擊New按鈕,選擇Python 2選項。

然後就出現了一個空白的筆記本,供我們使用了。我們在網頁里唯一的代碼文本框里,輸入以下3條語句,輸入後,按Shift+Enter鍵,就可以執行了。

filename = "yes-minister.txt"
with open(filename) as f:
mytext = f.read()

顯示的結果如下圖所示。

文本就出現了,然後我們呼喚(import)詞雲包,利用mytext中存儲的文本內容來製造詞雲。

from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext)

此時,製作詞雲最核心的兩步就完成了。

4、調出詞雲,完成

輸入下面4行語句:

%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")

運行結果如圖所示:

這樣一個簡單的詞雲圖就做好了,想要將詞雲圖做的更加美觀,還需要調節各種參數,這裡就不一一講解了,感興趣地可以自己慢慢去探索。

FineBI

相比於Python,用FineBI最大的好處就是不用編寫代碼,簡單易用,毫無數據和編程基礎的人都能夠輕鬆做出好看的詞雲。

1、下載安裝FineBI,準備數據

下載地址可以私聊我「FineBI」獲得免費下載連結,為了方便起見,我這裡就直接用FineBI自帶的數據了。

2、組件設置

新建組件並選擇樣式數據業務包下的搜索詞彙統計表,將待分析區域維度下的欄位「搜索詞」拖入橫軸中,將指標下的欄位「搜索次數」拖入縱軸中,在圖表類型下選擇詞雲圖。

3、大小、文本、顏色的優化

選擇該圖表類型後,圖形屬性下形狀自動切換為文字,維度欄位被添加到文本中,指標欄位添加到大小屬性中,如下圖:

4、詞雲完成

總結

通過進行詞雲分析,我們可以看的出來哪些數據是出現頻次最多的,我們的關注點是哪些。這次我演示做的詞雲也很簡單,後續在研究研究讓它更美觀一些,精準一些。

下載地址可以私聊我「FineBI」,獲得免費版下載連結!

文章來源: https://twgreatdaily.com/zh-sg/gPv1KmwBmyVoG_1ZcljA.html