AI公司為什麼要建立更具可擴展性的AI/ML項目？

全文共1370字，預計學習時長5分鐘

機器學習似乎已成為每個人都追求的一個宏大目標，超過80％的公司都正在研究至少一個AI項目。

圖源：unsplash

在開始之前，最好先詢問自己以下三個問題：

· 「此機器學習模型的準確性如何？」

· 「培訓時間多長？」

· 「需要多少培訓數據？」

用戶通常想知道新模型的裝載需要多長時間，以及它的性能或推廣效果如何，他們想要一種根據性能衡量總體成本的方法。但遺憾的是，以上問題的答案並不能解決這個問題。

它們甚至具有誤導性。

模型訓練只是冰山一角。獲取合適的數據集以及清理、存儲、聚合、標記、建立可靠的數據流和基礎架構管道需要巨大成本，但大多數用戶和AI / ML公司都忽略了這一點。

根據最近的研究，公司在AI / ML項目中將80％以上的時間用於數據準備和工程業務。換句話說，如果將大部分精力放在構建和訓練模型上，則總的工程工作量和成本可能是預計的五倍。

此外，機器學習模糊了用戶和軟體開發商之間的界線。

AIaaS或MLaaS已經開始出現。隨著數據的增長，雲端模型不斷改進。也正因如此，MLaaS的業務比SaaS更具挑戰性。

資料來源：黃Bastiane

機器模型從訓練數據中學習，因此缺乏高質量的數據，模型將無法良好運行。在大多數情況下，用戶並不了解生成或注釋適當數據集的最佳做法。

當系統性能不佳時，用戶往往會歸咎於模型。因此，AI / ML公司通常花費大量時間和資源進行培訓並與用戶合作，以確保數據質量，這成為AI公司與其客戶之間的共同責任。

圖源：unsplash

例如，要訓練生產線上的缺陷檢查模型，計算機視覺公司需要與客戶合作，以正確的角度和位置安裝攝像頭，檢查解析度和幀頻，確保每個場景都有足夠的正負面訓練樣本。

某些時候機器人或車輛需要人為操作，因此使用機器人技術或自動駕駛汽車應用程式進行數據收集更加耗時且成本更高。

即使進行了培訓課程，且看完了所有用戶手冊和指南，你仍然不能完全控制用戶生成的數據。一家機器視覺相機公司告訴我，他們的工程師會手動驗證所有數據以確保其完整輸入。

圖源：unsplash

所有這些經常被忽視的額外培訓、手動檢查、數據清理和標記任務會給AI公司帶來巨大的間接費用。這就是為什麼要建立更具可擴展性的AI/ML項目的原因。那麼該如何解決這個問題呢？

1、可擴展性是關鍵。

確定大量客戶願意購買的正確用例，並使用相同的模型體系結構解決。最後，你需要在沒有標準產品的情況下為不同的公司構建和訓練不同的模型。

2、儘量提供自助服務。

儘可能使培訓和數據管道自動化，以提高運營效率並減少對體力勞動的依賴。相比較內部工具或自動化，公司更看重開放客戶可見的功能，但是前者很快就會收到回報，你需要確保為內部流程自動化分配足夠的資源。

3、最後，確定並跟蹤成本，尤其是隱性成本。

工程師花費了多少時間清理、過濾或聚合數據？他們花費多少時間來確保第三方正確完成注釋？他們需要多久幫助客戶設置環境並正確收集數據？其中有多少可以自動化或外包？

圖源：unsplash

練級之路可能艱難而漫長，但有些問題是遲早都需要面對的。

留言點贊關注

我們一起分享AI學習與發展的乾貨

如轉載，請後台留言，遵守轉載規範

AI公司為什麼要建立更具可擴展性的AI/ML項目？

宇宙是否穩定？如果時間夠長，質子本身是否也會衰變？

全球首個「算法章程」：應對算法偏見，紐西蘭使出殺手鐧

參加頂級科技公司面試前需要掌握的10個基本算法

備戰解決方案架構師考試，你需要哪些知識和技能？

數據之美：可視化會給你意想不到的答案

ARM晶片取代Intel：這對iOS的開發人員意味著什麼？

GPT-3主導編程：最新的AI會扼殺編碼工作嗎？

如何定義和搭建可靠人工智慧系統的規則？

算法之「算法」：所有機器學習算法都可以表示為神經網絡

拋棄VS Code，轉向終端，我「移情別戀」的理由是什麼？

迷你器官的大作用：微型實驗室人腦揭示新冠影響

數據素養的7大判斷標準：看你骨骼清奇，來當數據科學家吧

數據科學終極求職指南：在這場較量中脫穎而出的藍海策略是？

顛覆已知：基礎物理學的下一次大革命將如何開啟？

不用再掐點兒搶號！遠程醫療帶來求醫新體驗

今日芯聲｜巴西副總統：不懼美方威脅，歡迎華為參與 5G 建設競標

這才是真正的共享！區塊鏈技術是如何幫助共享經濟崛起的？

疫情衝擊經濟放緩：我們需要全自動奢侈型共產主義

今日芯聲｜雷軍小米十周年：一碗滾燙的小米粥，開啟了沸騰的十年

軟體開發人員的「定投」：把知識當作生意來對待

一種簡單而智能的方法：Python也能進行面部識別

減少污染和溫室氣體排放，數據科學家在行動

態度決定與上限的距離：培養對數據科學的良好態度

25個最佳的VSCode擴展！帶你領略VSCode的獨特魅力