數據素養的7大判斷標準:看你骨骼清奇,來當數據科學家吧

2020-08-10   讀芯術

原標題:數據素養的7大判斷標準:看你骨骼清奇,來當數據科學家吧

全文共2314字,預計學習時長6分鐘

圖源:unsplash

對於數據科學家來講,能否理解數據是必須通過的篩選條件,任何先進的算法或複雜的機器學習模型都無法取代人類分析數據的優勢,一個優秀的數據科學家必須具備數據素養。

企業每天都要通過分析來處理變化和由此產生的不確定性,這些日常的變化和不確定性使企業更快地行動,其中發展迅速卻不冒失的才能成為成功的企業。數據科學家則負責研究場景、分析找出其根本原因、評估替代方案,在最後實施解決方案。企業越快收集到足夠的數據進行調查,就能越快做出合理的決定,而這就是為什麼優秀的數據科學家必須具備數據素養的原因。

數據素養在維基百科上的定義是「閱讀、工作、分析和用數據說話的能力」。此外,數據素養還包括從事與數據相關工作的能力。

1.能夠清晰地表達觀點

你是否能理解所見的事物?是否知道如何將其表述給他人?判斷一個人是否具備數據素養的標準是能否清晰表達自己的觀點,不是給出過分複雜化的解釋,而是直擊要害。

阿爾伯特·愛因斯坦曾說:「如果你不能解釋得很淺顯,說明你本身就未完全理解。」「理解」並非指的是明白當下的一切,而是指人們至少可在信息中有所提煉。當人們不是完全明白的時候,他們往往浪費很多篇幅來解釋,只有他們完全理解才能簡述自己的想法。

2.不會輕易被信息淹沒

圖源:unsplash

數據無處不在,人們很容易被它淹沒。

以新冠疫情為例,從疾病的信息、疫情帶來的經濟損失到洗手的方法,各個方面信息無處不在。很多人都被這些信息淹沒,甚至難以辨別真假。被信息淹沒的人們會忽視許多重要的事情,也會無法集中注意力。因此,在處理數據時,人們需要記住重點問題和信息。

3.能夠用數據說話

當你瀏覽網際網路上的評論時,會發現其中很多都是毫無根據的或是純粹的騙局。這與現實生活沒有太大區別:許多人只會根據自己的感受或當下的想法來爭論,但是具備數據素養的人則會基於數據而不是毫無根據地爭論。

在商業領域,數據科學家是數據驅動業務的驅動者。在數據驅動的企業中,許多要素需要使人信服,數據科學家需要具備數據素養來建立合理的論據。

用數據說話比你想像中要困難,它需要理解數據並將其清晰表達,信息才能有效傳達。用數據說話同樣需要承擔很大的責任,人們需要闡明他們擁有的數據符合正確的標準。當數據不足時,你最好保留意見。

圖源:unsplash

4.能夠基於數據採取行動

具備數據素養的重要性,在於人們可以理解數據並基於此採取行動。具備數據素養的人即便面對諸多信息,也可以在腦海里處理好這些數據,並在此基礎上採取行動。

舉一個很常見的例子——在網上購買電腦。因為選擇繁多,所以我們的第一步是判斷所需要的電腦類型。如果是為了遊戲,那麼你需要通過瀏覽其他人的評論來決定預算範圍內最適合遊戲的電腦。這一過程就像定義問題(遊戲)和範圍(預算)收集數據(評論)採取行動。別不以為然地認為下單前看看買家秀是基操,很多人甚至懶得收集數據!

合理的行動需要專業知識和業務洞察力,如果能加上「結合數據」這一步驟,成功率大大上升。

5.行動迅速而不莽撞

企業發展迅速,決策的速度更快,猶豫何時採取行動會讓事情變得不確定。在數據較少的情況下過早採取行動無疑是莽撞的,但等待足夠多的數據又或許太遲了。擁有數據素養意味著能夠決定合適的行動時間,對變化做出快速的反應是數據科學家的基本意識。

以約會為例,向一個認識不久的人求婚是魯莽的,但是等待太久才採取行動很可能錯過愛情。人們通過收集關於對方足夠多的信息來是否可以更進一步。「足夠多的信息」可以是任何東西:它可能是對方的價值觀,也可能只是身體特徵。如果把它和企業類比,收集關於企業「足夠多的信息」是採取行動前必須完成的步驟。

圖源:unsplash

6.對數據感興趣

有些人被數據淹沒,但有些人卻直接忽略了數據。他們不在乎世界上發生了什麼,也不想去了解最新的信息。在隔離期間,筆者很驚訝地發現自己的朋友甚至不知道需要通過拭子PCR檢測才能確認是否感染新冠肺炎。

具備數據素養的人會對數據感興趣。這並不是說他們需要在任何地方挖掘數據,但最起碼他們想隨時了解最新情況。筆者認識的具備數據素養的人總是對數據可視化感興趣。他們對數據感興趣,並不斷追求如何以最完美的形式呈現數據,他們希望通過展示恰當的數據來獲取有價值的信息。

7.能夠提出質疑

在這個充滿信息的世界裡,人們每天都會被新的數據轟炸,其中不乏正確信息,但更多的是錯誤的或是無關緊要的。具備信息素養的人會不斷質疑自己獲取到的信息,例如詢問自己這條信息是否正確、是否有用、是否必需。

具備數據素養的人也會是渴望信息的人,因此他們會不斷地提出質疑以獲取新知。如果在商業環境中考慮,你可能已經完成了分析並得出了答案,但是這個答案是對的嗎?或者你已經建立了最精確的機器學習模型,但是這個模型真的可以在現實世界中實現嗎?數據科學家工作時經常會遇到這種情況,而這也是作為數據科學家應該提的問題。

圖源:unsplash

但請注意,你仍然需要找到妥協點,因為問題終究是無窮無盡的。

判斷一個人是否具備數據素養有以上七種標準,你滿足這些條件了嗎?

留言點贊關注

我們一起分享AI學習與發展的乾貨

如轉載,請後台留言,遵守轉載規範