作者:datarevenue
編譯:ronghuaiyang
如果你想要用機器學習來做一些事情,這裡列出了 4 件最重要的事情。
如何確保你的項目保持在正軌上。
如果你是產品經理,想要用機器學習來做一些事情,這裡列出了 4 件最重要的事情:
一個機器學習項目首先是一個軟體項目。許多數據科學家在構建架構良好、可靠、易於部署的軟體方面缺乏經驗。當你構建一個生產系統時,這將成為一個問題。
根據經驗,**工程師掌握數據科學技能的速度要比數據科學家掌握工程經驗的速度快。**如果有疑問,請與擁有 5 年以上經驗、對人工智慧充滿激情的 python 工程師合作,而不是首次嘗試構建商業應用的數據科學博士。
儘早降低風險很重要。用具體的里程碑來組織你的項目:
總時間:1-3 個月
一個有經驗的團隊應該能夠為幾乎所有的項目遵循這些時間表。讓團隊在 1-3 個月內建立一個實時系統。上線後,再決定是否值得進一步改進。
這些誘惑會不必要地延長你的項目:
機器學習系統有很多有趣的按鈕可以使用。不要這麼干。
這些改進值得花時間(按重要性排序):
算法是最不重要的因素。簡單地選擇一個可行的算法。無休止地升級算法是很誘人的,但它可能不會提供你期望的結果。
一旦工程團隊開始構建,他們必須做出許多選擇。他們越了解你的輕重緩急,就越能做出正確的決定。至少,你應該告訴他們:
這是一個關鍵的問題嗎?它是否需要每天處理數百萬個請求?這是不是一個未來產品的研究?
目前處理流程是否太長?是不是太不準確了?還是有很多數據沒有機器學習就無法計算?
輸入:你(作為一個人)將使用哪些數據來做出正確的決策?輸出:誰將使用輸出?使用的頻率?它需要是實時的嗎?
最重要的指標是什麼:點擊率?銷售?投資回報?假陽性?
如果你想要優化轉化率,那麼它可能不值得再花 2 周的時間來獲得 2%的準確率。如果你建立了醫療診斷系統,那麼即使是 1%的假陰性也是不可接受的。
英文原文:https://www.datarevenue.com/en-blog/ai-project-success-factors