95後的小鮮肉是如何自學成才?這裡有份必備的入門資源

2019-11-27     程式設計師聖經

程式設計師書庫(ID:CodingBook) 猿妹編譯

連結:https://towardsdatascience.com/becoming-a-self-taught-data-scientist-5563f546bb7b

數據科學的工作被認為是21世紀最性感的工作,最近,有一位22歲的數據科學家Dario,和大家分享了自己自學成才的路線,並提供了一些很好的入門資源。

本文適合以下人群:

  • 沒有取得數據科學相關學位的人
  • 大學剛畢業,並且想轉行數據科學的人

如果你想轉行數據科學,那你要明白轉行的道路可能會很難,可能你想轉行的原因是你已經在一個領域已經工作了好幾年,現在發現它不適合你,你也可能是工作動力不足.....但無論你是何種原因,如果你想轉行數據科學,你要做的第一件事就是評估自己數學和統計的技能。

如果你對線性代數、機率論、統計、程序設計等知識沒有基礎或者沒有掌握,你可以參考選擇以下資源進行學習

數據科學自學之路

我接觸數據科學的第一堂課是Jose Portilla的《Python for Data Science and Machine Learning Bootcamp》

Portilla是一位很厲害的教練,你很快就可以通過該課程開始使用Pandas和Numpy進行數據分析,並使用Matplotlib和Seaborn進行一些數據可視化。是的,你會開始學習機器學習,雖然不多,但也不深入,不過足夠引你入門

地址:https://www.udemy.com/course/python-for-data-science-and-machine-learning-bootcamp

1、《Python數據科學手冊》

這本書大約有550頁,這本書涵蓋了Numpy、panda、Matplotlib和Scikit-Learn,所有這些課程都是數據科學中很重要的知識點。

一旦你掌握了這些基礎知識,就可以深入的學習機器學習,這邊有兩本好書推薦,其中一本還是免費。

2、《An Introduction to Statistical Learning》

這是一個免費的機器學習書籍,它偏向數學化,但讀起來還是很容易,對於像機器學習這樣廣泛的領域,它卻能控制在400頁左右,讓內容十分簡潔,唯一的缺點是代碼使用的是R而不是Python編寫的,不過你可以嘗試把書中代碼嘗試用Python編寫,這也是很不錯的練習方式。

下載地址:https://www.ime.unicamp.br/~dias/Intoduction%20to%20Statistical%20Learning.pdf

2、《機器學習實戰:基於Scikit-Learn和TensorFlow》

我推薦的最後一本書是《機器學習實戰:基於Scikit-Learn和TensorFlow》,如果沒記錯的話,這本書大概有700頁,但是這是一本好書,你可以深入學習一些概念,你也可以更深入的學習機器學習算法,這兩者都會對你幫助很大。

對於在線課程,我不得不再向你推薦Coursera的機器學習課程,這門課程的時長超過10周,如果你的基礎不牢固,你很快就會變得困難,但是,這門課程的評分4.9(滿分5分),大約有12萬的讀者,這足以說明它的質量。唯一不足的是,示例代碼不是用Python或者R編寫的,而是用Matlab的免費版本Octave編寫的

地址:https://www.coursera.org/learn/machine-learning

下一步你要怎麼做?

如果你已經閱讀的以上書籍,並上了相應的課程,相信你已經知道你的下一步要怎麼做了,理想情況下,你應該建立一個GitHub存檔,並尋找5個數據集來練手,在這個過程中寫出自己的結論和思考過程。

建議這樣做主要有以下兩個原因:

  • 你可以聯繫新獲得技能
  • 你可以像企業展示你編寫優質代碼的能力,對於僱主來說,看到你的實踐輸出是很重要的,如果你沒有相關的大學學位,你就更需要以某種方式證明自己,Github就是個不錯的選擇。

最後,希望你也能成功進入數據科學領域,成為一名優秀的數據科學家。

文章來源: https://twgreatdaily.com/zh/tQoDqm4BMH2_cNUgjHfL.html