如果正好打算入职机器学习领域,一定非常希望了解:到底需要怎么做才能更好的入行呢?
首先,咱们要清楚行业趋势,然后了解行业内的岗位细分,最后看看自己如何准备才能匹配上。那么,接下来,就是戴尔首席科学家李三平老师给我们分享的——入门者需要了解的4个要点。
第一, 认清机器学习的趋势——垂直应用正在兴起
这几年机器学习已经成为行业热点和学术热点,有人说2019年或者2020年是数据元年,可以看出其火热程度。那么这个领域有什么趋势呢?其中之一就是垂直应用正在兴起。
之前,机器学习一直在算法领域发展。近一两年,不同的垂直领域开始更加深度的应用机器学习。那么未来,机器学习会实实在在的应用到各个行业中,比如金融、营销、销售、医疗,现在很多公司在做这种垂直领域内的应用,也有物流、金融专业背景的人进入这个领域。
第二, 认识机器学习领域的岗位——不仅仅是算法工程师
提到机器学习,大家立刻想到算法工程师。为好优姐姐今年也辅导一位在美国留学的姑娘,专业是计算机,很希望进入机器学习领域,可是又担心不能胜任算法工程师岗位。同时她在美国读书期间,做了很多商业上的应用工作,比如机器学习的金融应用,商业分析项目等。那么经过一个秋招的努力,最后得到某科技公司咨询部数据科学家offer,日后的工作是为客户的数据模型提供咨询服务。
其实算法工程师仅仅这个领域的一小部分,相关岗位门类很多。整个机器学习的项目流程中,会涉及到原始的数据采集、如何理解、形式化业务问题,如何构建机器学习数据库,如何找模型,如何给模型调参,如何部署模型,以及部署之后的性能检测、在线评估、持续学习等等。所以整个机器学习的生命周期非常长,会包括很多门类的技术岗位。
因此想要进入这个领域的同学,也别光盯着算法工程师,以免失去了整个生命周期中的更多机会。
第三, 求职机器学习的准备——从语言到心态
想要应聘机器学习研发或工程师类的职位,首先要通过技术要求,比如编程语言、对算法理解、对模型的理解,对目前流行的开发框架的理解。特别是对算法背后理论知识的理解,能够看出你解决真实问题的能力。
所以招聘中,项目经历或比赛经历是这类岗位看重的基础应用能力,然后就是理论知识,比如为什么有一个性能很好的模型应用到实际项目中却会变得性能很差,你能不能理解这个模型对理想数据分布的假设是什么?和真实生产数据会有哪些不同。所以有扎实的理论基础,就很重要。这里也再次强调一下数学知识,比如线性代数、微积分、概率论与数理统计等都是必备的基础学科知识。很多机器学习问题,都可以转化为某种约束条件下的优化问题,所以对数学的学习是绕不开的。
而软技能方面,要对学习、探索新知识、新技术有极大的热情。IT领域中各种技术的快速演进和迭代,必然要求技术类人员持续、快速地学习,这是行业特点要求的。所以要首先问问自己,是不是喜欢学习不断地新技术,有没有对新知识的热情和渴望。
第四,在机器学习领域纵深发展,最经济的职业路径推荐。
一直以来都有很多IT相关专业同学问我,要不要做开发?有没有可能从项目管理、测试、用户研究类岗位入手呢?如果你真心讨厌开发,那么当然要听从自己内心的声音。而如果你没有明确的好恶,只是想要在机器学习领域寻找价值,那么建议从开发做起。这是最经济、最有效的一条职业路径了。
首先,做工程应用,在开发过程中学习编程,学习模型应用,进而逐渐去理解项目设计、理解用户需求、理解业务问题、理解各种开发细节,这个之后再去学习理论知识。在学习之后,可以继续从事开发、架构设计,或者技术研发等。
所以在刚毕业的时候,希望大家具备的基础素质就是应用知识,比如图形图像的分类与识别,有很多非常好的模型可以直接拿来用。如何使用好这些模型,是初级开发岗位必备的技能。更进一步,你还能理解模型背后的数学原理,能应用理论知识去改善模型在生产环境中的性能,那么这就会是一个积极、清晰的职业路径。
最后,如果你想要从事机器学习,下面的学习资源提供给大家。以下三个链接,有实际动手,也有理论知识,既有汉语资料也有英语资料,大家酌情选择。
【备注】
以下内容来自《IT岗位解析系列微课》中《15分钟,读懂机器学习》在线微课。
分享人,李三平,戴尔科技集团中国研究院首席科学家。毕业于美国麻省大学,计算机工程专业博士。有跨多个领域的科研与工作经历,包括机器学习、遥感影像、Web应用开发、Web平面设计、硬件设计验证等,目前从事机器学习、深度学习的技术研发、创新与应用。在国际学报类期刊、IEEE Transactions及国际会议发表20多篇论文,申请美国专利40余项,中文译著三本。