作者 | CDA數據分析師
Tableau是一款非常棒的數據可視化商業軟體,通過拖拉拽的方式迅速的實現數據可視化。而且該軟體可以連接任何一種資料庫,在處理大型數據時一點都不遜色。缺點是其無法從事數據分析和挖掘工作,幸運的是,從Tableau的8.0開始,Tableau與R語言打通,可以在Tableau中運行R腳本,從而將R語言的分析或挖掘結果在Tableau中展示。
如何實現Tableau和R語言的聯手繪製可視化圖表呢?
首先需要在R中下載Rserve包
install.packages(『Rserve』) library(Rserve)
啟動R伺服器
Rserve()
其次,通過Tableau連接R語言。 在Tableau介面下連接R語言:「幫助」——「設置和性能」——「管理R連接」,輸入伺服器及埠號即可成功連接(這裡的伺服器是本地機算計,故伺服器填』localhost』)。
如何將統計學意義的異常值尋找出來? 通過R創建異常值欄位:
上圖的異常值判斷標準是:超過上四分位數的1.5倍四分位距或低於下四分位數的1.5倍四分位距。 二、連續變量的預測 雖然Tableau可以直接繪製趨勢線,並根據趨勢線做預測,但是這僅僅是一個因變量與一個自變量之間的趨勢關係,如下圖繪製的利潤趨勢僅僅與時間維度相關:
如果影響利潤的因素由銷售數量、銷售額和折扣率三個變量組成,該如何將回歸後的預測體現在圖中呢? 通過R擬合預測值:
從圖中的結果顯示,預測與實際的趨勢一致,是一個比較理想的預測模型。 三、聚類分析 聚類分析是數據挖掘中無監督的算法之一,R語言可以非常便捷的實現各種聚類算法,如K-Means、K中心、EM期望最大法、層次分析等,下面就是要K均值算法的距離結果在Tableau中展示:
強大的可視化工具與強大的統計分析工具讓你的工作變得更加高效和方便。
進入CDA官方小程序,解鎖更多新鮮資訊和優質內容,還有免費試聽課程,千萬不能錯過喲!