經常做數據分析的人肯定不會對詞雲圖感到陌生,尤其是近幾年來非常流行,不管是發布會、行業報告還是新聞,都喜歡使用詞雲這種形式,將信息的關鍵詞組成形象生動的圖案,一下子就能抓住生人眼球,因為詞雲圖這種可視化圖表給人的第一印象就是足夠裝逼,足夠亮眼!
羅振宇的跨年演講中用到詞雲
但是詞語云圖的最大優點,其實並不是它的顏值,而是它能夠能夠直觀地展示數據頻率,對出現頻率較高的關鍵詞予以重點突出,從而過濾掉大量的文本信息,幫助我們進行數據分析。
而且,如果能夠親手做一個詞雲圖,發到朋友圈裡豈不是能夠帥到沒朋友?
網上有很多線上詞雲製作網站,但是基本上很難實現對數據的篩選和過濾,僅僅是有著好看的皮囊而已。對於數據分析人而言,還是要藉助專業的分析工具,下面我就用Python和FineBI這兩個常用的數據分析工具,分別實操一下如何製作炫酷又裝逼的詞雲。
Pyhton
1、安裝Python運行環境和套裝
這個不必多說,推薦下載的套裝是anaconda,做詞雲很好用。下載完畢後,配置好運營環境後,執行安裝文件就行了。
2、準備數據
下面是我隨便找了一篇英文文章,作為要進行詞雲製作的數據基礎:
我把其中的正文文字部分拷貝了下來,存儲為一個文本文件,叫做yes-minister.txt,把這個文件挪動到我們的工作目錄demo里,這樣數據就準備好了。
3、開始做詞雲了
做詞雲的核心步驟只有兩個——輸入文本和呼喚詞雲包。
首先,在命令行下,輸入:
jupyter notebook
瀏覽器會自動開啟,並且顯示如下介面——Jupyter的主頁面,我們點擊New按鈕,選擇Python 2選項。
然後就出現了一個空白的筆記本,供我們使用了。我們在網頁里唯一的代碼文本框里,輸入以下3條語句,輸入後,按Shift+Enter鍵,就可以執行了。
filename = "yes-minister.txt"
with open(filename) as f:
mytext = f.read()
顯示的結果如下圖所示。
文本就出現了,然後我們呼喚(import)詞雲包,利用mytext中存儲的文本內容來製造詞雲。
from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext)
此時,製作詞雲最核心的兩步就完成了。
4、調出詞雲,完成
輸入下面4行語句:
%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
運行結果如圖所示:
這樣一個簡單的詞雲圖就做好了,想要將詞雲圖做的更加美觀,還需要調節各種參數,這裡就不一一講解了,感興趣地可以自己慢慢去探索。
FineBI
相比於Python,用FineBI最大的好處就是不用編寫代碼,簡單易用,毫無數據和編程基礎的人都能夠輕鬆做出好看的詞雲。
1、下載安裝FineBI,準備數據
下載地址可以私聊我「FineBI」獲得免費下載連結,為了方便起見,我這裡就直接用FineBI自帶的數據了。
2、組件設置
新建組件並選擇樣式數據業務包下的搜索詞彙統計表,將待分析區域維度下的欄位「搜索詞」拖入橫軸中,將指標下的欄位「搜索次數」拖入縱軸中,在圖表類型下選擇詞雲圖。
3、大小、文本、顏色的優化
選擇該圖表類型後,圖形屬性下形狀自動切換為文字,維度欄位被添加到文本中,指標欄位添加到大小屬性中,如下圖:
4、詞雲完成
總結
通過進行詞雲分析,我們可以看的出來哪些數據是出現頻次最多的,我們的關注點是哪些。這次我演示做的詞雲也很簡單,後續在研究研究讓它更美觀一些,精準一些。
下載地址可以私聊我「FineBI」,獲得免費版下載連結!