WAIC匯聚全球頂級科學家,暢談人工智慧的未來挑戰與突破

2020-07-11     AI科技大本營

原標題:WAIC匯聚全球頂級科學家,暢談人工智慧的未來挑戰與突破

7月9日,2020世界人工智慧大會(WAIC)正式拉開帷幕。當天下午,2020世界人工智慧大會科學前沿全體會議召開,作為今年WAIC唯一一場聚焦前沿科技的大會,邀請了世界範圍內最頂級的AI專家探討技術趨勢。

其中,「人工智慧的未來挑戰與突破」圓桌論壇由AAAI2021大會主席、香港科技大學教授楊強教授主持,對話嘉賓包括第四範式創始人兼執行長戴文淵博士、香港科技大學張潼教授、新南威爾斯大學的Toby Walsh教授、札幌市立大學校長中島秀之以及英國帝國理工學院數據科學研究所所長郭毅可。

「人工智慧的未來挑戰與突破」圓桌論壇現場

本次討論有 3 個主題:

  1. 探討當前人工智慧的突破點在哪裡?
  2. 人工智慧所面臨的挑戰和局限性有哪些?
  3. 展望未來,共同探討未來可能有哪些偉大的成就。

以下為本場對話實錄:

人工智慧的突破點

楊強(主持)請各位嘉賓為大家分享下,您認為當今人工智慧的突破點在哪裡?有哪些實戰經驗可以分享?

戴文淵:在我看來AI最大的突破就是深度學習。當今人工智慧已經被用於各個領域,在中國也可以看到很多行業的AI應用。10 年前第四範式已經開始嘗試讓 AI技術落地,首先應用的是網際網路領域,讓 AI 幫主搜尋引擎精準地投放廣告。AI應用到在線廣告之後,廣告效果提高了800%。

7年前,開始將AI技術應用到金融等行業,做更好的營銷、銷售預測及反欺詐、反洗錢等業務應用。5年前,我們又將AI應用到零售行業和能源行業。今天,AI應用隨處可見,或許明年我們看到的 AI 應用會是今年十倍多。我們對此充滿信心。

Toby Walsh:人工智慧對於人類的智能來說是一個非常有益的補充,但是它跟人類的智能有很大的不同。比如我們剛才看到的案例,加了一點噪音之後,一個貓就會被識別為公共汽車。所以我們人類應該感到非常的自豪,我們的識別方法和機器識別不一樣,非常先進。

另外一個局限性,就是微感受。讓機器能夠更好的理解這個世界,理解語音,理解文本,理解圖像。但在一些推理方面進展不大,我們還有很多事情可以做。其實還有很多人類下意識、潛意識的東西並無法被機器所習得,所以這也是現在研究的一個領域。 當然,我對於現在人工智慧方面的進展很有信心,我覺得未來還任重而道遠。

張潼:關於現在AI或機器學習的突破 ,我覺得落地最好的地方就是簡單的任務,簡單環境,有大數據支持。比如說打遊戲這種非常明確的結構化的環境,在這種情況下AI很強,已經帶來了巨大的突破。 另外在一些類似的確定性高的環境中,AI的表現也不錯,如語言的識別。然它也有一些局限性。最近幾年,它開始學習很多沒有加標籤的數據。比如說在自然語言方面,代表性的工作就是BIRD、GDT可以用於學習很多沒有加標籤的數據,它可以應用到很多的任務中,甚至將來可以被運用到超能力的任務當中去,可以加到有標籤的數據當中。

在計算機視覺方面也有很大的突破,可以看到很多沒有加標籤的數據、任務,這些技術很有用。不用去給所有的數據加上標籤才能用於人工智慧領域,這是我看到很有前景的領域,接下來幾年是發展的重點。

在理論方面有更大的進展,可以更好的理解如神經網絡的運用模式。希望在接下來的十年中會有更多的進展,更好的理解神經網絡的利用。可以讓機器學習更容易應用落地,可以採用與解決不同的問題。只要加上一些黑河的參數調整,可以降低使用這些工具的阻礙,降低門檻用到不同的設備,高能設備。雲計算、(iH)、邊緣計算,或者是手機上還有其他一些設備。這是我覺得未來非常有前景的一些技術領域,可以讓AI更具可獲得性,更方便於應用落地。

郭毅可現在AI有了新的進展,AI方面的發展是關注於認知,模式識別,圖像識別更加精確,過去 10 年終我們看到的進展有兩個方面,第一是自動特徵的提取,這就是卷積神經網絡的進展,可以發現自動的識別一些物體的特徵,基於這些進展出現了很多新的模型,代表性現在可以學到很多不同的物品,抽象代表性的特徵可以被學習到。

在線學習也是非常大的進步,包括識別領域,比如AlphaGo等。我們處於一個數據驅動的AI時代,所有人都覺得越多越好。對於認知方面的人工智能能力,當然可以達到某種智能程度,但現在任務遠遠沒有完成,這只是一個序幕。當你認識一個東西的時候,要真正的理解這個東西,然後還要推理,然後基於某些模型獲得決定。

但人類完全不是一個光從數據驅動決定的模式,人工智慧也是如此。所以,我們的人類的智慧不僅僅是「識別」而已,孩童可以在早年的時候習得這個能力,但成人的智慧是結合我們已知的知識進行推理,現在很多的進步都是在這個領域,是一個非常積極的象徵。 人工智慧要做正確的事情,正確到底是什麼意思呢?我們這個機器又如何能夠識別哪些是正確的,哪些是不正確的事情呢?現在有很多的工作都在這個領域當中做,在很多的虛擬的環境當中,機器都能夠做出正確的選擇。但是在真實的世界當中,正確和不正確之間的邊界是很模糊的。

所以如果覺得人工智慧的領域已經到來的話,有點天真了。人工智慧現在是所謂的識別一些事物,要真正的認識一些事物是下一代的領域。

人工智慧所面臨的挑戰和局限性有哪些?

楊強(主持):正如郭 毅可提到了很好的關於「正確」和「不正確」的問題, 我們如何讓人工智慧領會錯誤和正確之間的區別?接下來要討論的是「人工智慧所面對的一些短板」,也許這些短板能夠激勵我們推動下一個十年的人工智慧的發展。

例如,人工智慧「舉一反三」的能力真的是好的嗎?在隱私方面,獲取別人的數據其實是需要面對風險的,如果放不願意分享數據,這也是對人工智慧的一個挑戰。所以請各位講講,你覺得人工智慧一個大的挑戰是什麼?

戴文淵:第一個挑戰是AI認知門檻,這是企業在AI應用中面臨的普遍問題。如今人工智慧應用越來越多也越來越重要。很多企業在數字化轉型的過程中希望使用 AI 來解決一些人工的問題。但核心問題是,這些AI應用需要數據科學來構建,傳統企業是很難解決這個問題的。現在數據科學家數量遠遠不夠,就算是MIT的數據科學家也不能解決所有企業的所有需求

所以,我們認為需要讓普通開發者或者JAVA工程師,也能夠開發AI應用。然而JAVA工程師會說他沒辦法做到,因為人工智慧太難了。這也是為什麼過去五年我們把很多的時間都花在了自動機器學習(AutoML)的研究上,它是一個學習框架,能夠讓普通開發者去學習構建足夠好的AI應用。我們必須要努力發展低門檻的AutoML技術,這是第一個挑戰。

第二個挑戰是,即使有足夠多的數據科學家、即使可以通過普通人開發AI技術,如果缺乏高質量的數據,AI 也無法實現。這就需要通過遷移學習把數據中的知識從一個領域遷移另一個新領域,保證AI在新領域的應用及效果。AI基於數據得出的一些結論被應用是可以被大家接受的方式,前提是這些結論並沒有記錄個人具體的數據。最近幾年我們在遷移學習隱私保護領域取得了比較大的突破,聯邦學習在隱私保護的基礎上賦能數據共享,能夠把知識從一個領域遷移到另外一個領域,同時也不會導致隱私暴露。今年年初,第四範式先知率先通過了歐盟GDPR認證,成為國內第一款通過該認證的AI平台產品。

第三個挑戰是成本問題,頂尖的網際網路公司需要有很多伺服器來支撐AI業務,很少有公司能夠承受這麼大的成本。所以我們也必須要去花費一些精力研究如何降低伺服器的成本費用。AI不僅是硬體系統,還有軟體系統,是硬體和軟體深度融合的體系,軟體設計必須要基於硬體的特點,硬體設計也必須結合軟體的需求,並且做進一步的優化。

中島秀之:現在AI的形式是:深度學習的發展讓AI有了很大的進步,但是對於機器學習本身來說,它還是有很多的限制。第一個是一定要有數據,你先要有數據才能夠獲得分析和信息,我們對於AI應用是有很多的知識和積累的。要把應用和現在的基礎領域結合起來。AI 的挑戰方面,要加強深度學習的能級。在這方面技術還有待改良和增進,需要把這些技術能夠在更高領域的任務上能夠進行應用。

Toby Walsh:第一個挑戰是語言是一個基礎的引擎,讓機器能夠聽懂我們的指令和人類的語言是非常重要的,它沒有語義層面上理解人類的話,只是表面理解,我覺得人類的語言是機器的智能體現。

第二個是「常識」,可能最有名的一個例子就是:你可以去某個城市的某所學校,問該校學生一些學校相關的歷史問題,學生可能會非常清楚,但是如果讓AI做的話,有一些東西會混淆,因為他缺乏這樣一個基本的常識。

第三點就是有關於情感的問題,有的時候就是人的智力能夠感受到的這些情感,並不是AI能夠做到的一個問題。機器沒有辦法產生感情,沒有辦法產生通情或者和人的相關的互動和交互,這是一個比較大的挑戰。

張潼:我非常同意的一點就是:我們沒有辦法做自然語言和語義的識別。但如果需要人工智慧去推動相應的發展其實不太可行,一般來說,我們真正的目標是希望AI 能夠做普通的任務、常見的任務,而不是一些專業特定的任務。比如希望能夠將常識注入人工智慧裡面,

如說我們希望能夠將常識注入到人工智慧裡面,讓它在進行邏輯推理的時候變的更加好的話,這是非常難的事情。

還有一個任務,即使我們有一個單個的任務,有不同的域名、域場和不同的、相應的環境,AI不可能在不同環境下勝任同樣的任務,這也是我們現在做的事情。這一點是有關於域場、域名適應的過程。這也是我們的一個挑戰,對於我們來說雖然普通任務、通識任務是挑戰,未來十年當中單個任務的適應是非常重要的事情。 有的時候在圖像識別當中有些系統可以做很好的訓練圖像識別,但是放到室外的場景應用,你就要做一些相應的適應,同樣的無人駕駛也是如此。

此外,如何能夠在特定的挑戰當中獲得相應的建樹,這也是未來十年當中所要做的一個工作,如果說我們能夠做到這一點,很多行業的應用就會變的非常的簡單。這樣的話,我們的人工智慧能夠使用的範圍更廣,而且使用安全性更高。

還有一個是關於隱私,如何在不同機構使用人工智慧,智能體之間如何協作,也是很重要的問題。判斷未來什麼是最重要的,還有解決公平的問題, 正如楊強教授剛才提到的,如何能讓AI做正確的事情,有正義觀是非常重要的,這也是具有更廣泛的社會意義的問題。

郭毅可:我非常同意剛才各位講者所提到的這些挑戰,但是我認為從根本上來說就有一個挑戰,如何能夠識別知識和數據的一個互動?如何通過觀察來獲得相應的數據和知識。很多時候涉及到常識的問題,包括遷移學習。 比如說你學習到一些知識,你如何能夠舉一反三,觸類旁通。還有就是有關於這個小數據的一個學習,你都必須要讓這個數據和知識之間交融,通過學習知識會不斷增加,但是你必須清楚這方面的知識,如何將數據和知識結合起來、融合起來非常重要。

這個方面,其實也涉及到控制理論還有其他的一些自動化理論等等,觀察能夠獲得的數據。我們覺得如果你要解決這樣一系列的挑戰,根本上最大的挑戰就是知識和數據的融合。我們應當雙管齊下,同時關注數據和知識的融合,這樣才能更好的做建模,能夠有更好的邏輯。

還有現在我們在這樣的一個基礎之上,就可以規約不同的數據。 從根本上來說,如何能夠打造一個系統,保證知識和數據互相豐富,互相融合,是非常重要的一個挑戰,也是我們一直想實現的目標。

所以從根本上來說,如果能夠同時解決數據工作和知識工作的話,我覺得我們能夠做到更好的突破。

展望:AI 未來五十年

楊強(主持)最後一個問題,更有意思一些。展望未來五十年,其他的知識加上AI,我們會有怎樣的進步呢?比如說馬斯克在做神經連接,想把一個晶片放到人腦當中去提升人們和AI機器之間的一個連接。我們今天有5G技術,之後很有可能會有更加強大的通訊工具,我們有量子計算也是呼之欲出了。所以,現在會有一些新的外部知識能夠幫助人工智慧更好的發展,我想要聽一聽大家的意見。

中島秀之:目前為止數據能夠應用的 場景還是比較有限的,未來它應當是以一種更加智能的方式進行更好的應用,而且人和AI能夠有更好的溝通和交互。我們更好的給AI賦予價值系統和價值觀,是非常重要的,對於我們的日常生活也是非常重要的。但是對於AI來說的話,它是沒有辦法更好的理解,所以我們需要訓練AI,更好的讓它有這樣的價值觀。

但無論如何,在未來50年當中應當有一個更好的溝通系統,讓人把我們的價值賦予給相應的人工智慧。我不知道其他的技術能否幫助我們,但是我覺得賦予價值觀是非常重要的一件事情。

Toby Walsh:我們現在太懶惰了,有的時候會讓我們的機器來接管我們的部分工作。但是如果機器做了所有的事情的話,我們真的會變的一無是處。對於我們的挑戰是保證機器不會徹底取代人類,不會接管人類所有的事情,我們還必須要有掌控。

郭毅可:我認為未來十年或者是五年,AI會有很多進展。特別是在基礎或者理論方面,AI可以發揮重要的領域就是醫療,醫療系統將變成數據驅動,有很多超級設備應運而生,用於某一些醫療事件。我們未來的醫療很大程度上是數據驅動,另外它還會個性化。那時我們的醫療成本會很高,十五年以後在AI的幫助下會帶來巨大的突破。

戴文淵:我相信應該是5G和IoT。現在AI從人類身上學,很多標籤數據是通過人點擊網頁及軟體,讓機器去學習做某些事情。有了5G、IoT之後,AI可以從它們那兒學習。全球人口數量為幾十億,而IoT有萬億級,5G加上IOT的發展會帶來更多數據,便於人工智慧進行更好的場景學習,為AI發展帶來更大的飛躍。

張潼:在將來的十年,我之前也談過,解決單域的問題,AI可以從一個專才變成通才,還有範式的進步,你可以更魯棒的學習,更好的處理量化問題、量子問題,這在我看來是最急迫的、亟待解決的問題,讓整個系統更加魯棒,易於使用,使用起來更加安全。

另外一點,我們未來還要納入知識,希望加上一些推理能力。但是我覺得最近可能很難,因為我們還不知道怎麼做。當前,所謂的協調學習、合作學習現在有很多局限,現在有很多的客戶端自己學習、自己進化,這會很大程度上提高聯合協作的能力,可以看一看最後能夠進化出來怎樣的AI能力,這是我預計在將來幾十年可以看到的進展。

楊強(主持):張潼談到很有意思的領域,5G和網際網路的發展,我們看到越來越多的物品之間會相互的交流、溝通、協調,在某些限制的條件下,隱私性的限制或者因為某些商業領域,他們沒有辦法相互之間打通,另一方面也要兼顧到隱私還有其他的一些考量,這是一個全新的市場,由AI創建的市場和人類共生、共存, 所以我們把它叫做協作式學習。這是我們現在做的一件事,激動人心。

文章來源: https://twgreatdaily.com/zh-my/qBK8PXMBnkjnB-0zP5dm.html










CSDN湘苗培優

2020-12-24