來源:量子認知
近年來,人工智慧推動了高性能自動學習技術的發展。但是,這些技術通常是基於逐個專項任務要求而應用的,這意味著為某一專門任務訓練的智能體在面對其它任務,甚至是非常相似的任務時,的執行效果會很差。
儘管近年來人工智慧領域取得了巨大進步,但我們離人類智能還很遠。當前的人工智慧技術允許訓練計算機智能體可以專門有針性地對它們進行人工訓練,以更好地執行某項特定任務。但是,一旦這些智能體處於與經歷過的條件(甚至略有不同)的條件下時,它們的性能在訓練中通常非常令人失望。
通過使用一生中獲得的技能,人類能夠非常有效地適應新情況。例如,一個學會在客廳里走路的孩子也會很快學會在花園裡走路。因為所學習得的走路的技能與大腦突觸的可塑性有關,突觸可塑性改變了神經元之間的聯繫,而在客廳學習到的行走技能與在花園中行走所需的快速適應技能則與神經調節過程相關。神經調節通過化學神經調節介質調整神經元本身的輸入-輸出特性。
模擬人腦神經突觸的可塑性是當今人工智慧所有最新進展的基礎。然而,到目前為止,還沒有科學研究成果提出將神經調節機制引入到人工神經網絡的方法。
為了攻克這個難題,一個由人工智慧專家和神經科學家組成的科學團隊的研究人員,開發了一種基於人腦功能機制的新算法 ,稱為神經調節算法。 這個新穎而卓越的算法可以創建能夠執行訓練期間未遇到的任務的智能體,使智能主體能夠自動適應未知情況。
在神經科學中,神經調節 (Neuromodulation)指一種神經傳導過程。在此過程中,一個特定神經元使用一個或多個神經傳導物質來控制一系列神經元。被一小群神經元覆蓋住的神經傳遞介質會在神經系統中大範圍地被釋放出來,進而影響到許多的神經元。在中樞神經系統中,神經傳遞介質包括如多巴胺。神經調節與傳統突觸傳導過程不同。傳統突觸傳導描述神經傳導過程為一個突觸前神經元直接影響另一個突觸後神經元。
研究人員開發出了完全原始的人工神經調節網絡體系結構,引入了兩個子網之間的交互作用。第一個網絡考慮與要解決的任務有關的所有處境場合信息,並在此信息的基礎上以大腦化學神經調節介質的方式對第二個子網進行神經模塊化。由於神經調節,第二個子網決定了智能體要執行的動作,因此可以非常迅速地適應當前任務,這使智能體可以有效地面對與解決新任務。
神經調節由處理某些處境場合信息信號的神經調節神經網絡(上圖頂部)和塑造某些輸入輸出功能的主神經網絡(上圖底部)的相互作用組成。下圖為神經調節的激活函數σNMN的計算圖,其中ws和wb是分別控制激活函數σ的比例因子和偏移的參數,z是由神經調節網絡計算的處境場合信息上下文(context)相關變量。
這種創新的架構已經成功地針對需要適應環境的導航問題進行了模擬測試。尤其是,訓練有素的智能體,能夠適應因風向變化極大幹擾其運動的情況下,自適應避開障礙物朝目標移動。
論文作者之一、人工智慧專家、達米恩·恩斯特(Damien Ernst)教授說:「這項研究的新穎性是,神經科學領域所發現的認知機理首次在多任務環境下發現了新的算法應用。這項研究為利用人工智慧更好地模擬人腦神經調節功能機制的關鍵打開了新視野。」
參考:Nicolas Vecoven et al. 「Introducing neuromodulation in deep neural networks to learn adaptive behaviours」, PLOS ONE (2020)。
(圖文來自網絡,僅供學習與交流,版權歸原作者所有,如有侵權請聯繫刪除)