作者 | 蔣寶尚、青暮
編輯 | 叢 末
7月9日,世界人工智慧大會開啟了一場跨洲連線,參與連線的有六位嘉賓,他們就主題《人工智慧的未來挑戰與突破》進行了圓桌討論。
其中香港科技大學講席教授楊強作為主持人,其他五位嘉賓分別來自亞洲、歐洲和大洋洲:第四範式創始人戴文淵;新南威爾斯大學Toby Walsh;香港科技大學張潼教授;英國帝國理工學院數據科學研究所所長、英國皇家工程院院士郭毅可;札幌市立大學校長中島秀之。
在討論環節中,各位嘉賓認可了人工智慧現有的一些突破進展,也對人工智慧當下的挑戰進行了思辨。
楊強教授表示,AI舉一反三的能力以及隱私保護是當下難點;戴文淵從企業的角度分析得出AI當下的挑戰分別是,認知門檻、人才缺乏、企業部署AI的成本太大;中島秀之表示,AI原始數據的處理方面還存在不足;張潼說,人工智慧在遷移學習和小數據上還有很長的路要走;郭毅可提到,如何在數據和知識之間做區分和連接是AI的基礎挑戰。
1
人工智慧目前的技術熱點
楊強:今天要探討三個話題:第一,人工智慧目前的技術熱點;第二,人工智慧遇到的挑戰;第三,對人工智慧的未來進行展望。
今天的幾位嘉賓在業界和學界都有著長時間的從業經歷,見證了人工智慧和深度學習產生的深遠的影響與重大突破。那麼,該如何看待現在人工智慧的技術突破呢?下面有請第四範式創始人戴文淵教授談談他的觀點。
戴文淵:大部分人工智慧領域方面的突破和應用確實取得了積極的進展,例如在中國已經可以看到許多落地應用。
我們最初進行的AI應用落地研究的大方向是嘗試將人工智慧、科技與網際網路行業相互結合。探索是從搜尋引擎領域開始,將人工智慧和搜尋引擎相互結合之後,搜尋引擎的性能表現提高了8倍。
七年前,我們開始將AI技術應用到金融等行業,做更好的營銷、更好的銷售預測以及反欺詐、反洗錢等業務應用。五年前,我們又將AI應用到零售行業和能源行業。
所以,人工智慧的應用突破在不斷的湧現,或許在明年就會看到更多應用場景,我們也正在努力把人工智慧技術應用到更多實際的場景中去。
楊強:感謝戴文淵,請Toby Walsh教授談一談人工智慧的技術突破。
Toby Walsh:在我是一個小男孩的時候,就曾讀到了關於人工智慧方面的一些內容,它對於我來說很有意思,激動人心。
人工智慧對於人類的智能來說是有益的補充,在很多領域它可以幫助人類的智能。但是它跟人類的智能又有很大的不同,例如對數據進行一點噪音添加之後,一隻貓就會被識別為公共汽車。
另外一個局限性,就是微感受。人類的意識、潛意識的東西無法被機器所習得,雖然也有相關的研究領域,但是並不突出。當然,我對於現在人工智慧方面的進展很有信心,但未來還任重而道遠。
楊強:感謝Toby Walsh教授,請張潼教授談一談。
張潼:對於現在AI或者機器學習的突破,應用落地最好的方向就是:簡單的任務,簡單環境,有大數據支持。例如遊戲領域,在打遊戲的過程中可以收集到很多的數據,而且具有非常明確的結構化環境,在這種情況下AI很強,已經帶來了巨大的突破。
另外在一些類似的確定性高的環境中,AI的表現也不錯。例如語言的識別,在擁有某些具體數據集的情況下,機器可以比人類表現更好。所以如果用當前最先進的深度學習技術,結合具體的結構化環境和具體的任務,人工智慧表現會非常優秀。
在技術層面,最近幾年,AI已經開始學習「未標註」的數據。例如在自然語言處理方面的Bert技術。
還有一個技術在理論方面也有了重大進展,例如神經網絡的運行模式,這也是未來的研究重點,可以讓我們了解如何訓練神經網絡。
從工業化的角度看,技術發展前景明朗的領域都是和「終端」有關,包括硬體層面,模型層面。以終端為導向的機器學習,能夠降低人工智慧工具的門檻。例如在硬體方面:雲計算、邊緣計算、車載工具甚至其他的一些硬體設備等等,能夠讓AI變得更加「親民」。
楊強:感謝張潼教授。接下來讓我們有請英國帝國理工學院郭毅可教授。
郭毅可:人工智慧在過去十年取得了比較巨大的進步,主要體現在兩方面:第一是自動特徵提取,第二是我們可以從很多壓縮數據中進行學習。
這兩方面的進步促使人工智慧能夠「識別」,從而也做出了一些非常出色的應用,例如AIphaGo。當然在線學習也是非常大的進步,例如AIphaGo在圍棋上打敗了人類。
我們現在處於一個數據驅動的AI時代,所有人都覺得數據越多越能促進AI的發展。其實從人類自身角度看,人類不是一個以數據為驅動的體系,我們是通過不斷的學習知識來豐富自己對世界的認知。所以,只有將機器自動化和知識結合起來才能創造更大的效能,當前已也經有相關研究把一些模型和知識結合起來。
另外,我們非常重視的一點是人工智慧要做正確的事情,但正確到底是什麼意思呢?機器又如何能夠識別哪些是正確的,哪些是不正確?當前的一些工作表示,在很多的虛擬環境當中,機器都能夠做出正確的選擇。但是在真實的世界當中,正確和不正確之間的邊界是很模糊的。
所以,這一代的人工智慧在「識別」方面取得了進展,而「認識」屬於下一代的AI領域。
2
人工智慧遇到的挑戰
楊強:郭毅可提到了很好的問題,我們如何讓人工智慧領會錯誤和正確之間的區別呢?這也是當前人工智慧的一個「短板」。
關於「短板」,我談一下我自己的經驗,人工智慧在學習現有經驗,然後適應不斷變化的環境方面(舉一反三的能力),其實進展並不順利。也就是說機器現在還無法有效的從小數據當中或者從經驗的例子當中進行舉一反三推理。
另外,還有在隱私方面,我們從第三方獲取數據的時候往往會碰到困難,別人不想和我們分享數據,這也是對人工智慧的一個挑戰。畢竟,當前的人工智慧訓練還是需要大量的數據。
現在我把問題拋給各位嘉賓,你認為人工智慧的一個大的挑戰是什麼?先從戴文淵開始。
戴文淵:第一個挑戰是AI認知門檻,這是企業在AI應用中面臨的普遍問題。我舉一個例子,我昨天去拜訪了一家餐飲巨頭,他們想要把線下的業務放到線上,改變業務模式。傳統上,他們進行線下業務管理,但是疫情後,他們發現只有5%的營收是來自於線下的,95%的營收是通過線上數字化渠道來的。此前他們的營銷模式是讓門店員工給線下客戶派送消費券,再給客戶做一些產品推薦和附加服務,需要花費很多的人力和物力。如果是通過線上化渠道,這樣大的任務量,是不可能通過人工來完成的。所以,這是個非常適合AI的場景,可以通過AI讓機器來完成線上化的營銷、推薦等,不需要由人來做。
但核心問題是,這些AI應用需要數據科學來構建,但傳統企業沒有足夠的數據科學家,就沒有辦法解決這些問題。我們現在數據科學家數量遠遠不夠,就算是MIT的數據科學家也不能解決所有企業的所有需求。所以,需要讓普通開發者或者JAVA工程師,也能夠開發AI應用。這也是為什麼過去五年我們把很多的時間都花在了自動機器學習(AutoML)的研究上。因為它能夠讓普通開發者去學習構建足夠好的AI應用。所以,現在的數據科學家太少了,我們必須要努力發展低門檻的AutoML技術。
第二個挑戰是即使我們有足夠多的數據科學家,即使我們可以通過讓普通人開發AI技術,如果缺乏高質量的數據,AI也無法實現。這就需要我們通過遷移學習把數據中的知識從一個領域遷移另一個新領域,保證AI在新領域的應用及效果。過去我們一直努力發展遷移學習算法,有很多優秀的遷移學習算法。我們發現開發的遷移學習系統,雖然性能非常好,但有隱私的問題。
AI基於數據得出的一些結論被應用是可以被大家接受的方式,前提是這些結論並沒有記錄個人具體的數據。最近幾年我們在遷移學習隱私保護領域取得了比較大的突破,聯邦學習在隱私保護的基礎上賦能數據共享,能夠把知識從一個領域遷移到另外一個領域,同時也不會導致隱私暴露。
第三個挑戰是成本的問題,頂尖的網際網路公司,需要有很多伺服器支撐AI業務,很少有公司能夠承受這些成本。所以我們也必須研究如何降低伺服器的成本費用。AI不僅是硬體系統,還有軟體系統,是硬體和軟體深度融合的體系,軟體設計必須要基於硬體的特點,硬體設計也必須結合軟體的需求,並且做進一步的優化。
軟硬體深度融合優化是一個降成本方向。以第四範式服務的某零售企業推薦場景為例,過去需要採用88台傳統伺服器才能支撐AI業務,採用軟硬一體的方式後降為8台,TCO(總擁有成本)降低了90%。
中島秀之:深度學習是一種非常新的技術, 但是在原始數據的處理方面還存在不足。如果你給模型錯誤的數據,模型就會做出錯誤的事情。
此外,我們在邏輯推理的研究上已經有了很長的歷史。我認為應該把數據處理和邏輯推理兩者結合起來,有機發展。
深度學習的應用非常廣泛,但目前普遍適用性還不高,未來深度學習應該變得更加普通性、大眾化一些。
Toby Walsh:我認為存在四個挑戰。第一點,是讓機器理解語言。如果機器能夠理解語言,在解決其它問題時就很簡單。
第二點,是常識問題。常識沒有一定的規律,並且機器和人擁有不同的感官系統,所以不可能直接學習人類的常識,但這又是非常有必要的。
第三點,是小數據學習。人類可以從個例當中進行學習,可以舉一反三,能夠抗拒環境的變化或者靈活地根據環境做出不同的反應,而機器目前做的還不夠。
第四點,是人工智慧的情緒感知。人有情感的感受,而機器沒有。如果機器想和人進行溝通,首先要理解人的語言,理解人的情緒。
張潼:人工智慧在具體的應用層面上表現非常不錯,這是在擁有大數據的具體環境的前提下。目前在一般的任務上,人工智慧的表現還很差。
但是在解決一般的任務之前,人工智慧在遷移學習、小數據學習、常識學習上還有很長的路要走,所以我非常同意Toby Walsh的觀點。
第一點,目前更加緊迫的挑戰是遷移學習問題。人工智慧解決了單一任務後,如果換到不同的環境中,表現就變得很差,人類則很少出現這種困難。這個挑戰更多和領域適應或者遷移學習相關。未來10年人工智慧應該關注這類更加具體的問題。如果能實現這一點,工業化的應用會變得更加簡單,這對於更加普遍和更加安全的人工智慧應用非常有意義。
第二點,即如何從大數據學習轉向到小數據學習。我們需要藉助知識、特定的表征等方法,來解決小數據學習問題。
第三點,即常識問題。我們希望能夠將常識注入到人工智慧系統分,讓它在進行邏輯推理時變的更好。目前,人工智慧其實並沒有依託人類的常識,而是依託數據做出機率的推測。
最後一點,即更加廣泛協同的人工智慧應用。我們需要讓來自不同的組織機構在不同的終端設備之間取得協同,以達成合作。同時還要關注如何讓人工智慧做正確的事情,包括隱私問題、責任問題和公平性問題。這些是更加廣泛意義上的社會問題,解決這些問題可以幫助我們把人工智慧應用到社會場景當中。
郭毅可:我同意剛才嘉賓們所談到的所有挑戰,但是我認為最基本的挑戰是,在人工智慧時代如何在數據和知識之間做區分和連接。
這有點像一個物理學問題。在物理學中,我們會進行觀察,然後根據觀察數據得出一個模型。我們首先是基於常識來進行觀察,得到一些小數據,然後再進行遷移。這個過程基於數據和知識之間的連接,涉及小數據學習、領域適應和遷移學習。
以前我們更多關注模型,在觀察之後得出一些邏輯推論。之後人們開始更多關注大數據,根據數據得到機率分布。兩者都存在問題,所以從根本上來講,我們需要將知識和數據能夠完完全全的結合起來。
3
人工智慧的未來展望
楊強:最後一個問題是展望未來。請想像一下,人工智慧在未來50年會是什麼樣子?或者跳出思維框架,會有哪些其它科學核心技術取得突破,進而促進人工智慧的發展,比如腦機接口、5G技術、物聯網、量子計算等等。
中島秀之:目前的人工智慧比較局限於處理單一的任務,但未來它的功能會更加強大,需要人類和人工智慧系統更多地進行交流和互動。所以我們需要判斷整個人工智慧系統的價值系統是什麼。人工智慧不會按照人類的方式去生活,所以不能和人類共享相同的價值系統,或者擁有相同的常識。我們需要理想的交流系統,向人工智慧提供人類的價值系統。
Toby Walsh:人工智慧技術進一步成熟之後,人類可能會變得更加懶惰。歷史上,每當一種新科技成熟之後,人類都會變得更懶。這帶來的風險是:人類可能會不由自主地放棄以前不太願意做的一些事情。
郭毅可:我認為在未來10年或者15年,人工智慧會取得比較長足的進步,尤其是基礎理論方面。
健康醫療領域將會取得巨大進展。現在大部分醫療行業都是靠大數據驅動,在未來醫療行業會變得非常個性化。現在我們的醫療成本非常高,但在15年之後,人工智慧技術能夠幫助我們改善醫療環境。我相信人工智慧能夠真真切切的在醫療行業幫助人類。
戴文淵:我相信5G技術和物聯網技術將會助力人工智慧的發展。目前人工智慧是從人類身上獲取數據進行學習,但有了5G技術和物聯網技術之後,我們可以獲得更多的數據量,讓人工智慧進行更好的場景學習。
張潼:我相信在未來幾十年有幾個重點發展方向。第一點,解決人工智慧處理單一任務、單一場景的問題,人工智慧變得更加大眾化,魯棒性更強,變得更加強勁、更加安全,
第二點,我們會更加關注知識,讓人工智慧夠實現邏輯推理。但是這也帶來了不確定性,因為我們不知道會發生什麼。
第三點,物聯網技術、5G技術最終將會和人工智慧技術一起,實現設備之間的溝通、學習、合作,並且以協同的方式發展。
楊強:由於物聯網技術、5G技術的發展,會有很多機構展開合作,但是會存在某些限制。例如隱私方面的限制或者出於商業的利益考慮,他們無法完全的把數據進行共享,但又不得不進行合作。這種既需要隱私保護又需要合作的技術是一個新的市場,聯邦學習正好滿足了「合作」和「隱私」的技術需要。