國產開源,GitHub 標星 47000+ ,百度飛槳從打響第一槍到戰役突圍

2020-09-22     AI科技大本營

原標題:國產開源,GitHub 標星 47000+ ,百度飛槳從打響第一槍到戰役突圍

作者 | 阿司匹林

出品 | AI科技大本營 (ID:rgznai100)

封圖 | CSDN付費下載自視覺中國

打響第一槍:占領高地

從 PaddlePaddle 到飛槳

2016 年,百度 PaddlePaddle 打響了國產 AI 框架開源的第一槍。

作為最早研究深度學習技術的公司之一, 百度早在 2013 年即設立了深度學習研究院,並於 2016 年正式開源深度學習框架,而 PaddlePaddle 也身負百度搶占人工智慧時代高地的重要使命。

2018 年 7 月,李彥宏在百度 AI 開發者大會上喊出了要讓「Everyone Can AI」的口號,其實這句口號後面還要加上一個限定——「通過百度的 AI 平台」。 這也意味著,PaddlePaddle 就是這場攻堅戰中的突破點之一。

2019 4 月,時任百度高級副總裁(現百度CTO )王海峰在Wave Summit 深度學習開發者峰會上,為深度學習框架PaddlePaddle 在百度內部的戰略地位進行了定調。PaddlePaddle 發布中文名飛槳開始強調自己更懂中國開發者,以及更加專注於深度學習模型的工業生產和部署。

隨著 AI 成為國家戰略,在自主可控的號召下,作為底層的深度學習框架更受關注,相比於國內的同行,百度更早的邁出了這一步,也就有了先發優勢。

經過 4 年的發展,飛槳在 GitHub 上已經有 62 個 Repositories,共收穫 47000+ Star,成為國產開源項目的佼佼者。

而 CSDN 聯合職場社交平台脈脈聯合發布的 2020 年《中國 AI 應用開發者報告》也顯示,百度飛槳已經成為最受中國開發者歡迎的國產深度學習開源框架。

戰役突圍:研發攻堅

打造四大「秘籍」

2007 Theano 誕生以來,經過十餘年發展,深度學習技術與應用突飛猛進,深度學習框架也處在不斷疊代與進化的過程

作為我國首個開源開放、功能完備的產業級深度學習平台,飛槳想要保持自己的地位,也必須要有自己獨特的優勢。那麼要如何定義飛槳的優勢?總的來說,飛槳有以下4 大領先技術。

第一,同時支持動態圖和靜態圖的編程,能夠兼顧易用性和效率。在整個開發過程當中,算法工程師既需要方便的接口,同時也需要高效的底層平台的支持。飛槳平台結合了動態圖的易用性和靜態圖的高性能,使開發者可以兼顧兩者的優勢。對開發者來說,這是大大降低了寫程序的成本和複雜度。

第二,針對大規模的工業化場景,飛槳提供大規模分布式訓練能力,在真正的工業場景應對自如。飛槳平台推出了支持萬億規模參數模型的實時更新能力和訓練能力。面對大型分類任務時可以進行模型並行訓練,在訓練層面也可以支持數據並行訓練。

第三,端到端的部署是應用深度學習的一個非常關鍵的環節,飛槳提供非常完備的支持各種硬體的端到端的部署能力,能夠使得開發者推理、預測的過程足夠順暢。在移動端部署的模型體積上,飛槳可以縮減到非常小,眾多開發者可以更好地把模型用在相應場景的終端設備上。

第四,飛槳有大量在產業實踐當中沉澱出來的模型,並提供官方的支持,能夠保證開發者的應用效果是最佳的、真正可靠的。據悉,飛槳平台上目前開源了 140+ 的模型,而且還有工業級的預訓練模型。在預訓練模型基礎上,開發者在使用時只要針對自己的場景進行小數據量的遷移學習就可以使用。

此外,飛槳也在迅速疊代,近日飛槳在動態圖和 API 體系剛剛進行了一次全面的升級。

升級之後,飛槳將提供更加完備和性能更優的動態圖功能,以及更全面的動態圖轉靜態圖運行功能, 在開發上實現「動靜統一」。「動靜統一」的優勢是開發者可以兼顧效率與靈活度。在動轉靜方面,飛槳現在已經支持完備的語法覆蓋和帶控制流的任務,且僅需一個裝飾器就可以觸發操作,統一的接口可以讓模型保存加載實現自動適配。在動態圖方面,飛槳提供了比靜態圖更簡潔靈活的混合精度訓練接口,並且實現媲美靜態圖的混合精度與量化訓練效果。

另外,飛槳還形成了貼合用戶使用習慣的全新 API 體系,目錄結構更清晰,對用戶更加友好;為了減少開發者的工作量,飛槳提供了包含視覺、NLP 等領域的模型和工具封裝的高層 API,以及最經典的模型結構;在兼容性上,飛槳可兼容 1.X版本的 API,並配備了完善的教程幫助用戶自主順利升級至新版 API,獲得更佳的體驗。

而且飛槳已可適配 22 種晶片型號,覆蓋英特爾、英偉達、瑞芯微、寒武紀等15家硬體廠商,且對國產硬體的支持力度業界第一。

為了進一步實現軟硬結合,加速 AI 的發展,百度還先後推出了兩代崑崙晶片。目前,百度崑崙晶片一代已經大規模部署,在百度搜尋引擎及雲計算任務上部署了 2 萬片。 據介紹,百度崑崙晶片在百度搜尋引擎等部署場景中,相比英偉達T4 GPU 性能在不同模型下提升 1.5-3 倍。

而在剛剛過去的百度世界 2020 上, 百度智能晶片總經理歐陽劍還預發布了國內首款雲端通用AI處理器「百度崑崙2」,採用更先進的 7nm 工藝,性能最高可超過前代 3 倍,預計明年初量產。

百年樹人:培育生態

做 AI 人才的「黃埔軍校」

為了擴大自己的生態圈,吸引更多的開發者,百度也在持續建設自己 AI 生態系統,希望跟更多產業合作共贏,實現百度 AI 生態合作的長遠計劃。

除了 AI 技術,既懂應用場景又懂 AI 技術的復合型人才也是 AI 產業化過程的關鍵。

2019 年 1 月 19 日,百度宣布成立「黃埔學院」,開展深度學習架構師培養計劃。並借鑑了黃埔軍校大門對聯的橫批「革命者來」,將口號設置為「革新者來」。黃埔學院的宗旨是「為中國產業界培養第一批首席 AI 架構師」。

2020 年 9 月,百度黃埔學院第三期 65 位學員畢業,創辦以來已向業界輸出 135 位 AI 落地產業的高端人才。

此外,百度和各高校合作開設人工智慧課程,培養了上千名 AI 專業教師。同時也面向產業 AI人群,培養更多復合型人才。截止目前,百度已經培養 AI 人才超過 100 萬。未來 5 年 ,百度還計劃培養 500 萬 AI 人才。

人能盡其才,物能盡其用,則為富強之大經。AI 人才正成為企業核心競爭力,更推動著中國技術革命與產業智能化發展持續向前全速前進。

今天,在飛槳平台已經有 230 萬的開發者使用,服務到了 9 萬家企業,創建了 31 萬個模型。過去半年多的時間裡,有 40% 到 50% 的增長,而這就是生態的力量。

從個人開發者,到高校開發者,再到企業開發者,一切都是為了壯大飛槳的生態圈,促進百度的 AI 落地。

合縱連橫:開源開放

創造產業升級的加速度

開源開放,是人工智慧發展的重要趨勢之一。

在近期舉行的2020中關村論壇上, 百度 CTO 王海峰表示,人工智能高速發展,已成為新一輪科技革命和產業變革的重要驅動力量。這其中,人工智慧技術的開源創新起到了很大的作用。 一方面,開源創新可以加速技術的創新發展,不斷拓展人類認知邊界和技術邊界; 另一方面,所有開發者都可以基於開源開放的成果開發自己的項目、產品及業務,更便捷、高效、安全地推進技術創新與應用。

實際上,從十年前布局人工智慧開始,百度即本著開源開放的精神,開放AI 核心技術供全社會使用。早在2012 年,百度就開放了翻譯的API 。如今,百度翻譯每天的翻譯量已經達到了1000 億字符。2013 年,百度又開放了語音平台,現在每天的調用量超過150 億。2016 年,在開源飛槳的同時,百度也開放了百度大腦的AI 能力,現在每日調用量超過1 萬億次。

作為開源軟體,飛槳一直在建設開源社區。目前,飛槳已經凝聚了 230 萬開發者,服務超過 9 萬家企業,創造出 31 萬多個模型。而飛槳推出的飛槳開發者 PPDE 計劃也共建了開源社區,組建了 22 個飛槳地方社群,100 多個高校社群。

而隨著開源開放的進一步推動,人工智慧已成為新一輪科技革命和產業變革的重要驅動力量。2019 年 10 月,百度公司董事長兼執行長李彥宏在第六屆世界網際網路大會上提出,我們正在迎來智能經濟時代。 智能經濟會催生很多新的業態,產業智能化也將成為新的潮流。

在產業與AI 結合實現產業智能化的進程中,AI 平台起著越來越重要的作用,飛槳的作用也越來越突顯。在業務實踐中,類似飛槳這樣成熟可靠,已被大量產業級應用驗證的開源平台,不僅為技術開發和企業創新不斷降低著門檻,更為整個產業智能化升級不斷加速。

例如在工業安全領域,飛槳攜手國家電網和山東信通打造電網智能巡檢方案,分析準確率達到90%,報警響應速度從小時級提升為秒級;在林業巡檢領域,普宙飛行器科技有限公司基於飛槳深度學習技術,專門為森林巡檢行業定製開發了一款無人機自主飛行+應用管理平台,可實現大範圍森林的自主巡邏、火情監測、非法入侵、森林樹木砍伐監測等功能,目前已阻止10餘起非法砍伐……

只有當技術滲透進這個社會方方面面,被組織或個人所「感知」,AI 才能真正民主化,賦能千行萬業。而以百度飛槳為代表的人工智慧技術,正在致力於與產業深入融合,幫助開發者們以一種史無前例的方式攻克產業難關,把過去的一個個「不可能」變成今天中國產業智能化的現實。讓每個普通人都可以真實地讀懂 AI,利用 AI,讀懂中國智能時代的黎明。

這場持久戰,百度已經悄悄突圍。

文章來源: https://twgreatdaily.com/nBANtnQBd8y1i3sJ748g.html










CSDN湘苗培優

2020-12-24