如果正好打算入職機器學習領域,一定非常希望了解:到底需要怎麼做才能更好的入行呢?
首先,咱們要清楚行業趨勢,然後了解行業內的崗位細分,最後看看自己如何準備才能匹配上。那麼,接下來,就是戴爾首席科學家李三平老師給我們分享的——入門者需要了解的4個要點。
第一, 認清機器學習的趨勢——垂直應用正在興起
這幾年機器學習已經成為行業熱點和學術熱點,有人說2019年或者2020年是數據元年,可以看出其火熱程度。那麼這個領域有什麼趨勢呢?其中之一就是垂直應用正在興起。
之前,機器學習一直在算法領域發展。近一兩年,不同的垂直領域開始更加深度的應用機器學習。那麼未來,機器學習會實實在在的應用到各個行業中,比如金融、營銷、銷售、醫療,現在很多公司在做這種垂直領域內的應用,也有物流、金融專業背景的人進入這個領域。
第二, 認識機器學習領域的崗位——不僅僅是算法工程師
提到機器學習,大家立刻想到算法工程師。為好優姐姐今年也輔導一位在美國留學的姑娘,專業是計算機,很希望進入機器學習領域,可是又擔心不能勝任算法工程師崗位。同時她在美國讀書期間,做了很多商業上的應用工作,比如機器學習的金融應用,商業分析項目等。那麼經過一個秋招的努力,最後得到某科技公司諮詢部數據科學家offer,日後的工作是為客戶的數據模型提供諮詢服務。
其實算法工程師僅僅這個領域的一小部分,相關崗位門類很多。整個機器學習的項目流程中,會涉及到原始的數據採集、如何理解、形式化業務問題,如何構建機器學習資料庫,如何找模型,如何給模型調參,如何部署模型,以及部署之後的性能檢測、在線評估、持續學習等等。所以整個機器學習的生命周期非常長,會包括很多門類的技術崗位。
因此想要進入這個領域的同學,也別光盯著算法工程師,以免失去了整個生命周期中的更多機會。
第三, 求職機器學習的準備——從語言到心態
想要應聘機器學習研發或工程師類的職位,首先要通過技術要求,比如程式語言、對算法理解、對模型的理解,對目前流行的開發框架的理解。特別是對算法背後理論知識的理解,能夠看出你解決真實問題的能力。
所以招聘中,項目經歷或比賽經歷是這類崗位看重的基礎應用能力,然後就是理論知識,比如為什麼有一個性能很好的模型應用到實際項目中卻會變得性能很差,你能不能理解這個模型對理想數據分布的假設是什麼?和真實生產數據會有哪些不同。所以有紮實的理論基礎,就很重要。這裡也再次強調一下數學知識,比如線性代數、微積分、機率論與數理統計等都是必備的基礎學科知識。很多機器學習問題,都可以轉化為某種約束條件下的優化問題,所以對數學的學習是繞不開的。
而軟技能方面,要對學習、探索新知識、新技術有極大的熱情。IT領域中各種技術的快速演進和疊代,必然要求技術類人員持續、快速地學習,這是行業特點要求的。所以要首先問問自己,是不是喜歡學習不斷地新技術,有沒有對新知識的熱情和渴望。
第四,在機器學習領域縱深發展,最經濟的職業路徑推薦。
一直以來都有很多IT相關專業同學問我,要不要做開發?有沒有可能從項目管理、測試、用戶研究類崗位入手呢?如果你真心討厭開發,那麼當然要聽從自己內心的聲音。而如果你沒有明確的好惡,只是想要在機器學習領域尋找價值,那麼建議從開發做起。這是最經濟、最有效的一條職業路徑了。
首先,做工程應用,在開發過程中學習編程,學習模型應用,進而逐漸去理解項目設計、理解用戶需求、理解業務問題、理解各種開發細節,這個之後再去學習理論知識。在學習之後,可以繼續從事開發、架構設計,或者技術研發等。
所以在剛畢業的時候,希望大家具備的基礎素質就是應用知識,比如圖形圖像的分類與識別,有很多非常好的模型可以直接拿來用。如何使用好這些模型,是初級開發崗位必備的技能。更進一步,你還能理解模型背後的數學原理,能應用理論知識去改善模型在生產環境中的性能,那麼這就會是一個積極、清晰的職業路徑。
最後,如果你想要從事機器學習,下面的學習資源提供給大家。以下三個連結,有實際動手,也有理論知識,既有漢語資料也有英語資料,大家酌情選擇。
【備註】
以下內容來自《IT崗位解析系列微課》中《15分鐘,讀懂機器學習》在線微課。
分享人,李三平,戴爾科技集團中國研究院首席科學家。畢業於美國麻省大學,計算機工程專業博士。有跨多個領域的科研與工作經歷,包括機器學習、遙感影像、Web應用開發、Web平面設計、硬體設計驗證等,目前從事機器學習、深度學習的技術研發、創新與應用。在國際學報類期刊、IEEE Transactions及國際會議發表20多篇論文,申請美國專利40餘項,中文譯著三本。