我，一個95後，從阿里辭職與賈揚清去矽谷創業

作者 | 褚杏娟

「在舊金山，隨便進去一家咖啡館，十分鐘之內，你就會聽到有人在談論 ChatGPT、AI。不管是不是有些天馬行空，視線範圍內的所有人都在嘗試著融入和探索新的事物。」25 歲決定與賈揚清一起在美國加利福尼亞州創業的魚哲說道。

魚哲跟賈揚清的緣分始於阿里雲。2020 年，魚哲本科畢業後入職阿里雲，這是賈揚清進入阿里的第二年。當時，負責阿里雲機器學習平台 PAI 產品線的魚哲進入了賈揚清的團隊，並與之共事了很久。2023 年，賈揚清從阿里離職創業，魚哲也選擇加入這支隊伍。

「我非常認同揚清的創業方向，這個方向非常有趣。」魚哲說道。在時代浪潮的推動下，每個人都在尋找自己的方向。魚哲用這個中式的比喻來形容他們正在做的事情：我們不幫別人包餃子，而是為他們的廚師提供一個優秀的中央廚房，讓廚師們可以輕而易舉的獲取所需的食材以便其能更好地準備自己的菜肴。

那麼，這個 98 年的「新秀」是如何一步步走向 AI 創業道路的？他們現在究竟在做什麼樣的事情？又是如何思考 AI 的現狀和發展的呢？

從高中開始就一直很「不正經」

2017 年 7 月的一個周末，深圳的颱風襲來，而幾十位極客正在科技寺舉辦的黑客松上如火如荼地討論各種項目，其中便有魚哲的身影。

在大二選擇 Gap Year 時，魚哲在編程貓擔任算法工程師，業餘時間利用圖像識別和自然語言處理技術，做了一個可以在對話中自動生成相應表情配合文字的程序，叫「表情包終結者（Meme Fighter）」，據說是因為他經常在微信群的表情包大戰中慘敗。

兩天內做出這樣一個項目，對魚哲來說並不是太難。

當大多數人在為高考努力的時候，受素質教育影響的魚哲被更願意去探索不同的領域。那時的他對技術很感興趣，除了一直關注最新的技術動態，他玩過單片機、也參與了一些機器人項目，算是積累了一些經驗。後來在第一次接觸 JupyterLab 時，遇到問題後的魚哲會自己修復並提出 bug 報告，因此還被 JupyterLab 創始人邀請參與到了項目中。

舉一反三也是魚哲的強項。在編程貓工作時，他需要讓模型能夠應對大量業務流量。最開始無從下手，但當時聽了「Instagram 如何架構 Python 後端」的講座後，魚哲借鑑了其思路並實施到自己項目中，取得了不錯效果。

在魚哲的成長過程中，實習工作是家常便飯，但也正是一次次的工作經歷影響了他看待世界的方法，進而影響了他的職業選擇。

高中期間，魚哲去了一家諮詢公司做市場調研的工作。實際上，這份工作並不複雜：研究當時市場上的青少年科技夏令營主要做什麼、定價情況、客戶群體等，在收集到大量數據並進行分析後，推測當地人們的消費情況、對子女教育的投入等。

「這種洞察力非常有趣，你可以通過一些有趣的數據看到其他人是如何生活的，就像有了上帝視角。」魚哲說道。諮詢公司對方法論和數據運用的重視也深刻影響了魚哲，讓魚哲養成了「用數據看世界」的思維習慣。

另外，這段實習經歷也讓魚哲接觸到了另一個跟技術無關的領域：商業運作。魚哲開始思考將技術與商業結合起來。他認為，技術不能只停留在實驗室中，只有真正落地並被大家接受和應用才能發揮更大的價值。

於是，本科期間，魚哲選擇了去美國倫斯勒理工就讀信息技術與網絡科學專業（Information Technology and Web Science，ITWS），計算機學院和商學院各學兩年，深入了解技術對商業變革的影響。根據規劃，其最終的職業發展方向就是技術的落地及商業化。

「阿里雲最年輕的產品經理」

阿里雲是魚哲大學畢業後的第一份正式工作，22 歲的他成了「阿里雲史上最年輕的產品經理」。

在阿里雲，魚哲更像是經歷了一場「系統化訓練」，用他的話就是，這次工作對他在「個人技術深度和廣度方面的提升、個人職業規劃的明朗，以及商業模式和市場的理解上，都產生了很大影響。」

回憶起這段經歷，魚哲最先想到的是養成了「只要沒幹死，就往死里干」的態度。當時阿里雲要研發很多新產品，剛入職的他心裡憋著勁，將自己的工作節奏安排得非常緊：早上吃咖啡因含片，中午甚至只吃蛋白質代餐，一直工作到晚上九點或更晚。「年輕人總是會容易感動自己，以為這個世界離開了我就不行。」魚哲笑著調侃當年的自己。

魚哲坦言自己經歷了失敗，「想要第一次嘗試的事情也不總是正確的」，但周圍阿里的同事給了他很大的包容，經過多次試錯後最終可以找到正確的「打開方式」。這些努力也讓他收穫頗豐：經手業務一年裡基本上都實現了二三十倍的增長。

對魚哲來說，「阿里雲最年輕的產品經理」的標籤，從某種程度上來說，代表著他年輕的特質。「年輕時，我們對許多東西都不懂，也不知道如何去應對，意識到『自己不知道』很重要，更重要的是迎難而上的勇氣和不斷探索的精神」魚哲解釋道。

選擇創業，只能不停地學習

去年下半年，ChatGPT 的爆火引發了 AI 狂潮，進而吸引了一批 AI 創業者，多年前就想創業的賈揚清這次終於下場。

「在 AI 領域，模型的保鮮期基本上是一年左右。」賈揚清曾表示，因此他瞄準了需求更明確的方向：如何更好地部署模型，是否有更彈性的、更穩定的、更低成本的部署模式。不直接幫企業開發應用是因為許多情況下，用戶比廠商更了解特定場景的實現細節，廠商無法深入解決專業領域的問題。

已經在 AI 領域積累多年的魚哲很認同賈揚清的觀點，因此在阿里雲工作三年的魚哲加入了這個創業團隊。「我的優勢在於曾在甲方和乙方兩方都工作過，對整體商業模式有較為深入的了解。我還有一段時間在海外工作、生活和學習，這些經歷讓我能更全面地看待問題。」魚哲認真剖析了自己。

如今，魚哲在 LeptonAI 擔任產品負責人一職，他經常參加各種線下活動，通過與外界交流來了解市場和用戶的需求，進而反推出自己應該做什麼樣的產品。

對於魚哲來說，大廠的很多工作相對來說都是可預測的，而現在的工作不確定性更強，但也更加讓他興奮。他如今需要更快速地學習，並充分利用自己之前的工作經驗，來找到更好幫助用戶實現自己 AI 落地的方法。

沒有固定的上下班時間、更注重結果，選擇創業公司讓他比之前更加忙碌。同時，像魚哲這樣的 AI 創業者，現在面臨的最大挑戰之一就是市場的不確定性：整個 AI 和機器學習領域變化迅速，每天都有新的機會和技術湧現，大家每天讀論文的速度都跟不上發布速度，他們需要始終都要保持初學者的心態，不斷學習和吸收新知識。

「我也沒有特別好的辦法，只能盡力跟進最新進展，多與業內一些頂尖公司的專業人士交流，跟上這個快速發展的領域。」魚哲說道。

「很難找出這樣出色的團隊」

作為一個創業公司，魚哲所在的 LeptonAI 現在主要將精力放在了三個方面：

LeptonAI 的自信來自創始成員們此前資深的工作經驗。創始人們在這些大廠多次帶領團隊實現技術和產品架構升級。比如賈揚清就曾在 Meta 將 Pytorch 打造為深受 AI 開發者們喜愛的框架的經歷。這給 LeptonAI 的啟示就是要與開發者「共鳴」：雖然 Pytorch 可能在性能方面不及靜態圖的 TensorFlow，但它讓開發者使用起來更方便。「我們對 AI 開發者的需求有很好的理解，知道他們在使用時可能遇到的問題。」

除了「AI 大神」賈揚清，團隊很多成員之前都曾在阿里、Google、Meta 和 Uber 等大廠工作，積累了在 AI 應用和 AI 框架方面的豐富經驗。團隊對雲基礎架構也有深入了解，能夠充分利用各種雲資源，包括完備的雲服務商和基礎的 IDC。同時，新團隊的成果，比如之前做的 Llama 2 API 以及 SDXL 性能優化等，得到了開發者們認可和好評，這也讓團隊更加自信。

「在業界，找出這樣一支能夠在這些方面都表現出色的團隊是非常困難的。」魚哲說道。

至今為止，LeptonAI 仍然專注於開發面向應用和開發者的 AI 工具平台。不過，魚哲也表示，順勢而為非常關鍵，「每個團隊都需要建立自己的基本實力和核心競爭力，在此基礎上，關鍵就看哪個團隊能夠更快地跟上技術熱點的發展，並且能夠充分利用已有的能力。」

LeptonAI 不會制定過於詳細的長期規劃，而是傾向更靈活地應對局勢，以月、周為周期來關注公司的目標和方向，不斷調整和適應變化。

比如，目前市場需求主要集中在大模型方面，公司則會在這方面相對投入更多資源。但這並不意味著 LeptonAI 放棄了傳統的深度學習或機器學習模型，因為很多企業實際上是混合模型的架構，這些傳統模型並沒有被捨棄。

怎麼做好產品？

「我們不是過去傳統意義上的服務提供者。」魚哲強調，「我們是要將客戶的行業專業知識轉化為應用落地的加速器，而不是代替他們完成任務。」

在對外交流過程中，魚哲發現用戶的需求多且細，比如企業很想使用一些機器學習和深度學習模型，但模型的複雜度是個阻礙；企業想在不將代碼放在公共網際網路上的情況下，利用代言模型來管理代碼補全，但技術能力可能無法實現等。魚哲團隊要做的就是依靠工作經驗找到其中確定性的東西，來解決用戶真實存在的問題。

當前，LeptonAI 的思路是：開發者用 Python 原生方式構建模型，無需學習容器或 Kubernetes；然後在本地調試和測試模型，再使用單個命令將它們部署到雲端；之後，開發者可以通過簡單、靈活的 API 在任何應用程式中使用模型。這個過程中，LeptonAI 還要幫開發者選擇最適合應用程式的異構硬體，並做水平擴展來處理大量工作負載。

為了方便開發者以更舒適的方式構建和打包 AI 應用，LeptonAI 提供了一個名為「光子（Photon）」的 Python 庫，「光子無處不在，何時何地都能找到它，同時也象徵著速度快的特性。」Photon 最初是團隊將機器學習模型、運行時環境以及工程代碼有機結合的抽象概念。現在，Photon 定義了一組處理程序和 Python 依賴項，用戶也可以根據情況構建自己的 Photon。

關於 Python 作為 AI 服務框架的問題，業內目前存在一些爭議，比如 Python GIL 是眾所周知令人頭疼的問題。為解決 Python 帶來的性能問題，大家的基本思路似乎是放棄 Python：Hugging Face 用 Rust 重寫了一個 ML 框架、Modular 公司發布了名為 Mojo 的新程式語言。在魚哲看來，Python 的應用取決於具體的使用場景。例如高頻量化交易場景可能需要使用更低級別的語言來滿足毫秒級延遲的要求，而在其他情況下，幾十毫秒級別的延遲可能是可接受的。

對於性能要求極高的場景，LeptonAI 會對原本在 Python 下進行的模型服務進行編譯、推理、優化和加速等處理，進而保證其他方面的高效運行。比如部署在機器人或車輛上的應用，運行時資源非常有限，LeptonAI 會通過特殊的壓縮手段來保持更高的性能，而用戶端是無感的。

LeptonAI 當前主要在公有雲中提供全託管服務，但 LeptonAI 給自己的定位和傳統雲廠商有些不同。「我們幫助客戶制定自己的 AI 戰略，這是很多廠商不提供的服務。我們能夠提供很多雲廠商無法提供的技術細節，我們比雲廠商更深入了解 AI。」魚哲說道。

目前 LeptonAI 產品處於開放測試階段，還在不斷優化疊代和完善功能。比如團隊推出了一個名為 TUNA 的功能，用戶只需要上傳語料，就能一鍵操作對模型進行微調。魚哲總結自己產品的優勢在開發者體驗、價格成本和性能上。

測試有時候也不僅僅針對產品，還有對開發團隊心理的考驗。「這個階段，沮喪的事情有很多。」魚哲說道，「當你抱著很高的期望嘗試時，有時會發現某個基礎組件並不穩定，或者是最初以為用戶會非常喜歡的功能，實際做完後發現用戶覺得很難用。」

技術不斷進步，總會有新的問題需要解決。在魚哲看來，最重要的是保持冷靜、堅定前行，因為很多事情並沒有捷徑可走。「這個道路上的坑也是多不勝數的，不要試圖繞過，而是要努力填坑，並且越快越好。」

承上啟下的角色

現在，LeptonAI 的客戶涵蓋了金融、能源、自動駕駛以及信息網際網路服務等領域。除了個別性能要求極高場景，LeptonAI 並不針對特定行業提供解決方案，更多是提供底層標準能力，方便用戶快速應用。

「我們處於一個承上啟下的角色。因為在上游和下游的每個人，都有他們自己的客戶（甲方）和供應商（乙方）。」魚哲說道。

LeptonAI 提供算力、模型和服務，服務方面包括通用流行模型的 API 服務、個性化模型的平台服務和對模型進行微調和部署的服務。這些能力背後需要計算、存儲和網絡三種資源支撐。LeptonAI 會從不同的供應商那裡採購這些資源，包括傳統雲廠商和新興雲廠商。能夠做好供應鏈整合、在價格上獲得比競爭對手更大的優勢，這也是 LeptonAI 的核心競爭力之一。

LeptonAI 的收費項主要有三部分：基於軟體訂閱的費用，私有模型部署的資源使用費用，和熱門模型的使用費用。資源使用的定價邏輯是基於規格乘以使用時長的方式來計算。對於單位價格，LeptonAI 基於 AWS、GCP、Azure 等多個市場供應商來設定適當價格。

魚哲表示，LeptonAI 並不是基於各種成本來定價的，而是假設用戶自己處理需要花費的成本，然後 LeptonAI 在此基礎上設定價格，目的是確保用戶直接購買現成解決方案比自己做要更加划算。

不過魚哲強調，低成本並非是 LeptonAI 的主打市場推廣策略，同時還是要關注用戶使用體驗和產品性能。畢竟 To B，從來就不是單個維度上的短跑，而是多個維度的長跑。

此外，LeptonAI 也在積極融入整個行業發展中，以 GitHub 開源工具鏈 SDK 的方式來降低模型使用的門欄，讓每一位 AI 開發者們通過一行命令即可拉起熱門模型。

不能「拿著錘子找釘子」

關注 AI 多年，魚哲這次感受到的一個顯著變化是，人們不再是僅僅被炫酷的技術吸引後就不斷投入資金進行嘗試，反而會更加迅速地關注技術的實際應用和落地，更注重可行性和投資回報率（ROI）。人們變得更加理性，特別是在資本投入方面，也更加客觀、認真地去思考技術如何落地。

大模型因為聊天機器人被更多人熟知，但大模型不僅僅是聊天機器人。大模型的多模態特性可以將世界上的豐富多彩元素轉化為機器可理解的格式。大模型的應用場景是非常廣泛的。但對於大模型應用來說，最困難的不是訓練模型，而是找到適合的應用場景和相應數據。

魚哲表示，開發大模型應用，行業經驗和數據的質量是非常重要的因素：有足夠的行業經驗才能更好地理解目標受眾的需求和應用場景；而數據的質量和多樣性將直接影響模型的性能和效果。這兩項確定後，擁有先發優勢就非常關鍵，開發者一定要保持持一定的疊代速度。

但在新技術落地上，找到場景也很難。「如果我現在只是拿著一個大模型去構建應用，那這就像拿著錘子找釘子。實際上，我們應該先有一個場景，然後再構建相應的應用。」魚哲進一步說道，同時，大模型落地還需要企業里有既了解特定場景又熟悉相關技術、清楚什麼能做什麼不能做的人才，才能真正落地。

本質上，大模型應用還處於非常早期的階段，大多數應用仍停留在概念驗證（POC）或短期上線能夠使用的狀態。就像 Bing 或者 Google 搜索雖然落地了，但在特定領域的深度應用還在不斷嘗試中。

「建議大家不要被大模型束縛住。實際落地時，除了大模型外，還可以充分利用許多已存在的深度學習模型或傳統模型。例如在圖像處理方面，卷積神經網絡（CNN）實際上可能比大模型更適用。」魚哲說道。

如今，行業在大模型上基本形成了這樣的共識：沒必要一味追求大規模參數，開源會成為主流，通用大模型並不「通用」，垂直行業的大模型更被期待。魚哲認為，下一步是努力消除基礎能力和場景差距。這方面，AI Agent 被寄予厚望，人們希望藉此解決單靠大模型無法解決的問題。

AI Agent 示意圖

簡單說來，AI Agent 希望達成的效果是：一個獨立思考的實體具備了多種技能，這些技能可以組合起來應用到生產中，最終交付出一個成果。其中，大模型充當了代理的大腦，並由 Memory、Tools、Planning、Action 幾個關鍵組件進行補充。

魚哲設想的一個 Agents 應用場景是交互式搜索，比如用戶去某地方開會，智能助手可以除了導航還可以提示哪裡可以停車等。魚哲始終認為，技術否能夠成功取決於它是否能與特定場景良好結合，停留在實驗室內的技術不見天日更難有機會被打磨，因此更接近場景的人其實更有機會。

結束語

「我無法設想 AI 不再流行的情景。」魚哲說道，「AI 代表了一種信息處理的方式，而人類對於信息處理方式的投入只會越來越多，不會減少。」魚哲預計，人工智慧的進步和發展會越來越深入和持久，自己也會持續在這個行業深耕下去。

魚哲坦言，自己最擅長的領域仍然是人工智慧。在這個領域工作久了，他逐漸意識到，技術落地的過程比想像的複雜得多，有些事很多時候更像是一場馬拉松，而不是一次短跑。他現在的首要目標是和團隊一起幫助 LeptonAI 發展壯大，在這個前提下，繼續秉持自己的興趣前行。

直播預告

隨著大模型的湧現，許多領域的大佬都發表過「值得考慮用大模型重新構建所有行業和產品」的看法。那麼，在 ChatGPT 推出快一年了，針對不同行業，這些大模型都用來解決哪些具體問題呢？在實際落地時，又會面臨哪些挑戰？在 10 月份的 InfoQ《極客有約》中，我們將有幸邀請到 AIGC 領域的傑出從業者，由魚哲擔任特邀主持，與他們進行深入對話，探討這些重要問題。敬請期待！

戳直播預約按鈕，預約 InfoQ 視頻號直播。

直播內容

熱了快一年了，讓我們來聊聊生成式 AI 落地吧

特邀主持：魚哲，Lepton AI 創始團隊成員，產品負責人

2023 年 10 月 9 日 20:00 對話廣推科技 AIGC 商業化負責人崔世傑
2023 年 10 月 16 日 20:00 對話京東雲言犀 KA 產品負責人王超
2023 年 10 月 23 日 20:00 對話網易杭州研究院人工智慧部總監胡光龍
2023 年 10 月 30 日 20:00 對話百度搜索主任架構師 Tianbao

下一代 Docker 來了！1小時構建縮至1.5分鐘，還能結合 LangChain、Ollama 等做 AI 應用開發

蘋果中國App Store將不允許未備案應用上架；iPhone 15發熱嚴重，問題源於第三方軟體？Meta又要裁員了 | Q資訊

微軟裁員內幕

Angular 重磅回歸

內容推薦

《行知數字中國數字化轉型案例集錦【第二期】》重磅發布，覆蓋多個行業，對話一線專家，挖掘企業數字化的實踐故事，揭秘數字化時代背景下如何重塑企業組織、技術與人才。掃描下方二維碼，關注「InfoQ 數字化經緯」公眾號，回復「行知數字中國」即可解鎖全部內容。

讀者福利

2023 中國雲原生成熟度模型報告

我，一個95後，從阿里辭職與賈揚清去矽谷創業

文章來源: https://twgreatdaily.com/zh-cn/098e2e6d2c9677a3b51032f9dc719e80.html

麥當勞中國：打造 MACH 架構的數字化巨無霸

vivo 軒轅文件系統：AI 計算平台存儲性能優化實踐

從架構角度認識 AI：為架構師解讀機器學習與生成增強技術

全球科技巨頭扎堆的機密計算，迎來了中國「黑馬」

都2024年了，端到端保護軟體供應鏈安全真的實現了嗎？

AI 驅動的可觀測性革新：攜程如何通過架構升級實現高效數據治理與性能平衡

人工智慧缺乏「激勵機制」，如何重新定位和思考 AI 的發展？

Flux、SD 等圖片生成模型遭「封禁」，但這次矽谷大廠不反對了！

Uber 履約系統如何實現零停機時間遷移

前端策略：使用框架還是純JavaScript？

卷模型還是做平台？

三年虧損51億元，去年賣出22台車！文遠知行被爆赴美IPO，估值超360億元

Forrester在HashiCorp 2024雲戰略現狀調查中推薦了雲成熟度修復措施

40 個頂尖數據團隊的構成剖析

改善 Kubernetes 日誌以增強可觀測性

優步使用谷歌雲平台實現大數據基礎設施的現代化

鴻蒙崛起背後：作業系統新格局，關業務場景什麼事？

LLM 能提高開發人員的生產力嗎

華盛頓大學開源語音深度學習算法，可以在嘈雜的環境中鎖定某個說話者

2024年8款資料庫數據分析能力（TPC-H）真實性能評測，真有100倍差距

AI 大模型如何在各行業跑通業務閉環？

豆包大模型家族發布、火山方舟升級，火山引擎如何打造全棧AI技術服務？

百度文心智能體平台舉辦開發者沙龍，打造國內領先的智能體生態 | Q推薦

領英是如何利用機器學習解決內容相關威脅和濫用問題