技術最牛逼的阿里,又回來了!

2024-09-20     51CTO

科技界的「中秋晚會」來了!

距離ChatGPT發布22個月,國內AI語境下的網際網路技術基座究竟該做哪些?支撐AI原生應用的技術天花板有多高?AI的行業風口會吹向哪裡?

9月19日,一年一度的阿里雲棲大會拉開帷幕,阿里現任掌舵者吳詠銘、CTO周靖人攜手大模型領域當紅炸子雞月之暗面CEO楊植麟、小鵬汽車CEO何小鵬等一眾明星企業創始人給業界帶來了一場久違的國產自豪感。

不管是能實時觀看秒回答的阿里版GPT-4o、號稱性能超越 Llama 405B的新一代的開源模型旗艦版 Qwen2.5-72B,還是一系列涵蓋伺服器、網絡、存儲、AI平台、數據湖等硬科技的AI Infra,還是通義萬相、通義靈碼、閱讀助手、AI翻譯等辦公生活兩不誤的AI應用,都不得不讓我們感嘆:那個10年前國內技術最牛逼的阿里,又回來了!

一、吳泳銘:一場「AI想像力」的開幕式

大會第一天,阿里現任掌舵者吳泳銘在《雲與AI的創見》主論壇上,提及AI的發展變革,心情十分澎湃,自去年發出「用戶為先、AI驅動」的重大戰略調整的全員信已滿一年之際,他激動地分享了3個切實的實踐感受。

首先,吳詠銘認為,過去22個月,AI發展速度超過任何歷史時期,但依然處於AGI變革的早期。在這個階段,推理成本是應用爆發的關鍵問題,阿里未來會努力繼續推動推理成本降低。過去一年以來,通義千問API在阿里雲百鍊上的調用價格下降了97%,百萬tokens調用花費最低已經降到5毛錢,阿里雲會努力地把成本繼續降下去。」

第二,生成式AI最大的想像力不在手機螢幕做一兩個新的超級App,而是滲透數字世界、接管數字世界,並改變物理世界。怎麼理解?

吳泳銘提出,一方面,與網際網路不同,生成式AI是通過給生產力供給增加智能,從而為世界創造更大的內在價值。這種價值創造,可能是移動網際網路連接價值的十倍、幾十倍。另一方面,生成式AI將逐漸滲透數字世界,並接管數字世界,物理世界的大部分事物都會具備AI能力,形成下一代的全新產品,並與雲端AI驅動的數字世界連接產生協同效應。

例如汽車行業的自動駕駛,在使用AI模型後已經發生了發生的巨大變化,可以預測機器人將是下一個迎來巨變的行業。他認為,未來,所有能移動的物體都會變成智能機器人,它可以是工廠里的機械臂、工地里的起重機、倉庫里的搬運工、救火現場的消防員、家庭里的寵物狗。現在每個城市家庭里有一輛車,未來每個家庭可能會有兩三個機器人。

最後一點,AI計算正在加速演進成為整個計算體系的主導,未來幾乎所有軟硬體都會具備推理能力,驅動新算力需求滲透。未來幾乎所有軟硬體的計算內核將會變成GPU AI算力為主,CPU傳統計算算力為輔助的計算模式。「我們看到在新增的算力市場和算力需求上,超過50%以上的新需求,都由AI驅動,且新需求已經超過50%,已占據主導地位,這一趨勢還會持續的擴大。」

二、大模型時代的阿里,都在做什麼

前不久,阿里迎來了25周年,馬雲那句「阿里從來不是被保護出來的公司,阿里相信市場的力量和創新的價值」言猶在耳,緊接著這次雲棲大會接下來的全新的AI版阿里雲技術讓人看罷直呼過癮:那個讓人驕傲的阿里,又回來了!

下午一點左右,阿里雲 CTO 周靖人信步上台,從AI模型與應用及面向AI的基礎設施兩個方面,詳細介紹了阿里雲近兩年來面向AI所攻克的先進「黑科技」。全程一個小時,信息密度極其之高,簡直目不暇接,實在是愛了。

在AI時代,雲計算髮生了全棧全系列的技術革命,這場革命中,而阿里雲提出的「模型即服務」已經成為了業界的標準。

1.阿里版的AI Infra,刀刀要害

不管大家願不願意,GPU時代已經來臨,對此,周靖人直接甩出一個自研的Infra大殺器:磐久伺服器。

磐久的厲害之處有三點:支持多種異構晶片,主流、國產一應支持,關鍵之處還在架構上做了CPU和GPU的分離,以更好地實現算力匹配,晶片適配速度提升1倍;同時,為了能夠提供更多算力,磐久的一個伺服器可以承載8顆甚至16顆GPU卡,遠遠超過行業水平;此外,針對高密度的信息計算帶來的散熱問題和GPU故障問題,「磐久」伺服器正如其名,非常耐造,通過優化的散熱布局,有效滿載GPU溫度降低3度,而基於AI算法的GPU故障預測,準確率達92%。

伺服器之外,網絡成為影響大模型訓練和用戶體驗的一大難題。周靖人介紹阿里雲高性能網絡架構HPN7.0。作為新型智算集群架構,可穩定連結超過10萬個GPU,數據中心就可以化身為一台超級計算機。周靖人還介紹到,HPN7.0通過前後端網絡分離的方式,後端可以提供3.2T的帶寬,可以提供極致的並行計算,此外阿里還自研了一系列協議,比如Solar RDMA協議、HPCC協議等,端到端的通信性能也做了翻倍。

另外,文件存儲系統CPFS也是一個亮點,它把面向AI的存儲和面向對象的存儲進行打通,為AI智算提供更佳的存儲能力,這樣就可以保證多帳號多模型的同時訓練與推理。

容器方面,對於去年推出的容器計算服務ACS,也進行了產品升級,將支持動態細粒度熱調整,並能處理更大的並發數。

模型訓練方面,阿里雲主推的PAI平台將為模型提供多種能力,比如模型、硬體、並行方式的組合多樣;可以更好地優化模型的架構,做到自動化的並行加速;同時PAI的模型推理功能,也將優化大模型服務,提高效率和優化成本。

除了算力,在數據處理方面,阿里雲也相應推出了OpenLake湖倉一體化的平台,將在未來兩天的講演中有更加詳細的說明。

此外,周靖人表示,在AI時代,安全有了新的含義。為此,阿里雲提供了安全中心、數字水印等解決方案,解決語料安全、數據安全、模型安全評測等一系列安全問題。

不得不說,全棧AI Infra,性能、穩定、效率、伸縮、安全,可謂面面俱到,面面嚴謹,一貫是阿里的風格。

2.通義家族全新亮相:開源生態已經全球第二

上一部分的AI Infra還意猶未盡,結果下一PART更是讓現場人掌聲不斷。

在模型與應用部分,周靖人持續丟出大招。Qwen2.5、旗艦版模型Qwen-Max(阿里版GPT-4o)、通義萬相、Qwen-Audio、Qwen-Math等連環引燃現場。通義家族徹底在雲棲上出圈了!

周靖人介紹,通過通義家族全球領先的模型能力,可以充分發揮AI能力。同時,阿里雲的百鍊平台,能夠將模型的調用和企業的數據有機結合起來。

2.1 通義千問大語言模型家族

通義千問開源模型累計下載量已突破 4000 萬,成為開源生態的全球第二,僅次於Llama。

Qwen2.5首次達到了18萬億的token,模型的輸入和輸出都支持了128K,同時數學和代碼能力大幅提升。此外,鑒於千問在全球廣泛的影響力,此次Qwen2.5支持中英文在內的29種語言。

Qwen2.5開源了7個尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它們在同等參數賽道都創造了業界最佳成績,型號設定充分考慮下游場景的不同需求。Qwen2.5開源了一系列小模型,如14B、7B模型,方便企業將模型集成到業務當中,降低成本。而首次推出的3B模型,將有望推動端側應用的開發,同時和雲上的模型應用形成協同。可謂全尺寸、全場景、多態,一應俱全。

周靖人透露,旗艦版模型Qwen-Max,性能接近GPT-4o。通義官網和通義APP的後台模型均已切換為Qwen-Max,繼續免費為所有用戶提供服務。

在多模態的維度,通義千問也取得了一系列進展。

視覺維度上,視覺語言模型Qwen-VL在之前的圖片理解上,新增了對視頻的理解和推理能力,甚至超越了GPT-4o的水平,支持長達20分鐘以上長視頻理解,可以調用手機和設備的視覺智能體,支持多種語言。

而音頻模型Qwen-Audio,則融合了語音識別和語音理解,無須通過ASR模塊,實現了端到端的大模型,大大降低延遲。

同時,在專有能力上,通義推出Qwen-Math並開源。據阿里雲官方透露,該模型超過了一眾開源模型及GPT-4o的數學能力。

2.2 通義萬相

與千問模型家族不同,通義萬相專注圖像和視頻的生成。

周靖人宣布,通義萬相的文生圖的能力得到了大幅提升,框架升級到Diffusion Transformer,具備強擴展性和靈活性。

同時,通義萬相正式推出了文生視頻能力,在技術上進行升級和優化,可生成20s原生的1080p視頻,同時支持各種各樣的視頻風格。該功能目前已在官網上公開試用。

講個小插曲,今晚6點左右,阿里會推出飛天音樂節的現場視頻《江雪》,大家可以留意觀看。

2.3 多項模型應用

通義靈碼

通義靈碼插件下載破500萬,在服務開發者的同時,靈碼提供企業級的支持,能有效理解本地的代碼庫,同時保障了數據安全。

在此次升級中,靈碼進一步向智能體方向進化——可以理解需求、拆解任務並嘗試進行代碼的編寫,實現AI程式設計師的能力。

通義聽悟

通億聽悟提供實時的對話記錄功能,能完成語音轉文字等任務。目前,通義聽悟已經集成在通義APP和Web端中,旨在幫助用戶提高學習和工作的效率。

通義PPT創作

通義也跟進了打工人喜愛的AI PPT功能。通義的PPT創作支持了豐富的類型輸入,長文本、音視頻都可以,值得一提的是支持了1000萬字的文檔,是同類產品望塵莫及的長度了!

此外,周靖人提到,通義PPT創作提供了豐富的模板,使得呈現效果美觀且專業。

通義AI翻譯助手

通義的翻譯助手也進行了有意思的更新。除了在基礎功能上,搭載的端到端模型有效降低延遲,支持多種語言翻譯之外。通義的AI翻譯助手還提供旅行模式和會議模式,面向高頻場景提供更加適合的翻譯能力,這種巧思必須給產品經理加個雞腿。

VideoChat 視頻通話

在多模態的各個方面大秀肌肉後,小編心想這不就是GPT-4o的各種能力都具備了?果不其然!周靖人宣布了,通義版GPT-4o——VideoChat視頻通話功能上線了,大模型能聽能看能說,實時的理解和交互再也不是問題。

在千問家族強大的AI基礎能力之上,阿里雲的百鍊大模型服務平台的出現則為進一步豐富模型應用生態添磚加瓦。大模型服務平台聯通了大模型進入企業的最後五公里,讓通用模型+垂直模型矩陣的實現更容易了!

這裡不得不提,除了市面上通常看到的工作流、智能體編排工具,阿里團隊還提供了精細化的運營工具,輔助觀測和優化引用效果,不僅可以覆蓋大模型應用各個組件的執行過程,還能讓全部過程可觀測、可分析、可評價、可干預,獨立開發者和企業都可以無後顧之憂。

在大會上,周靖人宣布兩款推薦模型 Qwen-Plus 及 Qwen-Turbo 再次降價,降價幅度超過85% ,做到了業界最低,並提供免費試用。周靖人表示,希望足夠低的價格能吸引更多開發者入局大模型,這樣才能進一步激活大模型創作者的活力,推動AI領域的創新。

三、雲棲大會的三場圓桌:AI明星談大模型、自動駕駛、具身智能

這還沒完,三場圓桌Panel同樣精彩。三場重磅圓桌,分別圍繞著吳泳銘演講的重點領域:大模型、自動駕駛、機器人展開。在圓桌的討論中,楊植麟、姜大昕、何小鵬等重磅AI大咖紛紛發表自己的觀點以及對AI未來的預測,觀點的碰撞讓人直呼過癮!

1.大模型

階躍智能的創始人姜大昕:AI沒有涼,仍處於一個加速發展期

姜大昕認為AI在廣泛領域取得了突破,正在一個加速發展的過程中。從數量的角度來看,每個月都會有新的模型、新的產品、新的應用湧現出來。而從質量上看,GPT-4o、特斯拉FSD V12、OpenAI o1的發布具有重要的價值和意義。

月之暗面創始人楊植麟:o1拉高了大模型的上限,創業公司迎來新機會

楊植麟表示,OpenAI o1發布確實意義很大,他提到「AI的歷史上,唯一有效的就是Scaling law」。因此,從GPT1到GPT4是確定性的提升,但o1並不是完全確定性的,它提升了AI的上限,初步解決了進一步Scaling的問題。而且這個方法在一個初期階段,因此,能對很多產業格局會產生影響,會產生很多新的創業機會。

至於對產品的影響,楊植麟表示,AI產品更多是靠技術驅動,現在的技術發展,帶來了探索PMF的機會。雖然o1的思維鏈會使用戶獲得相應的速度變慢,但長期來看增量價值將大於體驗損失。

此外當被問及哪類初創企業更容易被融到錢時,楊植麟坦言:這跟AI本身關係不大。首先產品本身滿足市場需求,數據指標比如產品的留存是要關注別的,此外要看市場規模一定是有增量的。他認為,prompt engineering未來可能就不需要了,是一個越來越小的市場。

生數科技首席科學家朱軍:未來一年半,AI進入L3階段完全有可能朱軍提到,在AI的L1-L5的級別中,o1突破了L1階段,向追求進行更複雜的推理和決策制定能力的L2階段轉變。展望未來的18個月,朱軍認為L3即AI智能體的實現是值得期待的。

下半年,生數科技也會為用戶們提供更加可控的視頻生成功能。

2.自動駕駛

小鵬汽車董事長、CEO何小鵬:年產量100萬AI車,才配留在牌桌上

何小鵬表示,大模型可分為數字世界、物理世界和仿真世界三類,這三類模型將在未來相互融合。不過,從硬體角度看,這一融合過程的速度將較為緩慢。相較於數字世界的快速變化,物理世界的變革步伐將更為穩重。

談及特斯拉 FSD 入華對行業的影響時,何小鵬表示,「我覺得我們需要不一樣的很好的技術來衝擊市場,能夠讓我們看到市場的變化,我覺得未來在牌桌上的玩家會比較少。」至於判斷標準,何小鵬認為:誰能做到年產量100萬台純AI車,誰就有資格。

他指出,端到端的模型下限能力有望在明年快速提高,一旦提高後,不用2年時間,在全球範圍內就可以做到超越L4標準的能力。據悉,何小鵬駕駛「全球首款AI汽車」P7+亮相2024雲棲大會,這款車搭載了業內領先的端到端大模型。

上圖:「全球首款AI汽車」P7

3.機器人/具身智能

北大-銀河通用具身智能聯合實驗室主任王鶴:通用和零代碼是兩大方向王鶴指出,人形機器人的技術含金量可以總結為兩個方面:第一,它的泛化性到底有多強,是不是真正能通向未來的通用。第二,它能不能跟人之間用自然語言來溝通,實現零代碼的部署。

逐際動力創始人張巍:「雙腿」對人性機器人至關重要張巍提到,「我覺得人類機器人之所以是一個新的物種,它不是一個傳統機械臂公司的延續,它的本質就是要長出兩條腿來,我覺得腿是能是機器人具有通用能力的一個基礎。那看腿要看什麼呢?主要看兩點,一個就是腿他有沒有完成他本能的一些本職的工作,就是地形的泛化能力。第二點也很重要,就是看他能不能支撐雙臂去完成全身協同的這樣一個通用的操作,這也是腿存在的一個重要的價值。」

四、寫在最後:AI加強版的阿里,已來

從通義千問的發布再到如今阿里版的國產AI基建、阿里版的GPT-4o、通義全家桶、中國最大的開源模型社區魔搭,「用戶為先,AI驅動」戰略正在重塑一個AI加強版的阿里。

此次雲棲大會的各種發布就是一個最好的證明,它不負「AI硬科技盛宴」的稱號!在首日奉獻了一場讓人目不暇接的科技饕餮。

阿里在AI領域的持續深耕,不僅磨礪了強勁的技術,更為推動AI生態的成長和完善貢獻了一份不可小覷的推動力。

在AI圈頻繁的被「泡沫即將破滅,Super APP遠未到來」的焦灼刺痛之時。

吳媽的一句「AI最大的想像力不在手機螢幕,而是改變物理世界」,不只是一劑有力的強心針,更是帶來了高屋建瓴般的震撼和暢快。

我們有理由相信,AI在未來世界扮演著重構者的重要角色。而我們正在向著未來飛奔,見證著國產AI力量的崛起。一切都值得期待。

文章來源: https://twgreatdaily.com/zh-mo/cbf268ed8093e0d6ffb5ab39ddc5eb76.html