95后的小鲜肉是如何自学成才?这里有份必备的入门资源

2019-11-27     程序员圣经

程序员书库(ID:CodingBook) 猿妹编译

链接:https://towardsdatascience.com/becoming-a-self-taught-data-scientist-5563f546bb7b

数据科学的工作被认为是21世纪最性感的工作,最近,有一位22岁的数据科学家Dario,和大家分享了自己自学成才的路线,并提供了一些很好的入门资源。

本文适合以下人群:

  • 没有取得数据科学相关学位的人
  • 大学刚毕业,并且想转行数据科学的人

如果你想转行数据科学,那你要明白转行的道路可能会很难,可能你想转行的原因是你已经在一个领域已经工作了好几年,现在发现它不适合你,你也可能是工作动力不足.....但无论你是何种原因,如果你想转行数据科学,你要做的第一件事就是评估自己数学和统计的技能。

如果你对线性代数、概率论、统计、程序设计等知识没有基础或者没有掌握,你可以参考选择以下资源进行学习

数据科学自学之路

我接触数据科学的第一堂课是Jose Portilla的《Python for Data Science and Machine Learning Bootcamp》

Portilla是一位很厉害的教练,你很快就可以通过该课程开始使用Pandas和Numpy进行数据分析,并使用Matplotlib和Seaborn进行一些数据可视化。是的,你会开始学习机器学习,虽然不多,但也不深入,不过足够引你入门

地址:https://www.udemy.com/course/python-for-data-science-and-machine-learning-bootcamp

1、《Python数据科学手册》

这本书大约有550页,这本书涵盖了Numpy、panda、Matplotlib和Scikit-Learn,所有这些课程都是数据科学中很重要的知识点。

一旦你掌握了这些基础知识,就可以深入的学习机器学习,这边有两本好书推荐,其中一本还是免费。

2、《An Introduction to Statistical Learning》

这是一个免费的机器学习书籍,它偏向数学化,但读起来还是很容易,对于像机器学习这样广泛的领域,它却能控制在400页左右,让内容十分简洁,唯一的缺点是代码使用的是R而不是Python编写的,不过你可以尝试把书中代码尝试用Python编写,这也是很不错的练习方式。

下载地址:https://www.ime.unicamp.br/~dias/Intoduction%20to%20Statistical%20Learning.pdf

2、《机器学习实战:基于Scikit-Learn和TensorFlow》

我推荐的最后一本书是《机器学习实战:基于Scikit-Learn和TensorFlow》,如果没记错的话,这本书大概有700页,但是这是一本好书,你可以深入学习一些概念,你也可以更深入的学习机器学习算法,这两者都会对你帮助很大。

对于在线课程,我不得不再向你推荐Coursera的机器学习课程,这门课程的时长超过10周,如果你的基础不牢固,你很快就会变得困难,但是,这门课程的评分4.9(满分5分),大约有12万的读者,这足以说明它的质量。唯一不足的是,示例代码不是用Python或者R编写的,而是用Matlab的免费版本Octave编写的

地址:https://www.coursera.org/learn/machine-learning

下一步你要怎么做?

如果你已经阅读的以上书籍,并上了相应的课程,相信你已经知道你的下一步要怎么做了,理想情况下,你应该建立一个GitHub存档,并寻找5个数据集来练手,在这个过程中写出自己的结论和思考过程。

建议这样做主要有以下两个原因:

  • 你可以联系新获得技能
  • 你可以像企业展示你编写优质代码的能力,对于雇主来说,看到你的实践输出是很重要的,如果你没有相关的大学学位,你就更需要以某种方式证明自己,Github就是个不错的选择。

最后,希望你也能成功进入数据科学领域,成为一名优秀的数据科学家。

文章来源: https://twgreatdaily.com/zh-hans/tQoDqm4BMH2_cNUgjHfL.html