皮笑肉不笑?讀取情緒的AI說:我太難了

2020-08-26     造就

原標題:皮笑肉不笑?讀取情緒的AI說:我太難了

數以百計的人臉圖像出現在螢幕上,一個接著一個。有的眼睛圓睜,有的眉頭緊鎖,有的開懷大笑,有的抿緊嘴唇。

對於每一張圖像,你必須回答一個簡單的問題:圖片中的人是高興還是難過?

在這項2018年的研究中,心理學家瑞秋·傑克(Rachael Jack)和同事招募了80人參加這個測試。這個來自英國格拉斯哥大學的研究小組招募了來自西方和東亞的參與者,共同探討一個長期令人困惑的問題:通過面部表情判斷情感真的可靠嗎?

幾十年來,研究人員探索人們從面部能夠感知到什麼情緒。美國心理學家保羅·埃克曼(Paul Ekman)在20世紀60年代和70年代進行了頗具影響力的調查,結果顯示,世界各地的人們可以從面部表情中可靠地推斷出情緒狀態——這意味著情感表達是普遍的。

專家曾普遍認為,可以從面部表情中可靠地推斷出情緒狀態

這一想法在很長一段時間內沒有受到挑戰。但是,一批新的心理學家和認知科學家正在重新審視這些數據,並質疑這些結論。

許多研究人員現在認為,實際情況要複雜得多,因為面部表情在不同的背景和文化中差異很大。例如,瑞秋的研究發現,雖然西方人和東亞人在表達痛苦時有著相似的面部表情,但他們對快樂的表達卻差異極大。

研究人員對埃克曼結論的質疑越來越多。但是這場辯論並沒有阻止公司和政府接受「臉是情感窗口」的結論,在西方許多法律制度中,解讀被告的情緒是審判的一部分。美國最高法院法官安東尼·甘迺迪(Anthony Kennedy)在1992年曾寫道,這樣做對於「了解罪犯的心靈」是必要的。

埃克曼為TSA(美國運輸安全管理局)設計並於2007年推出了一個有爭議的培訓計劃,解碼情緒就是該計劃的核心。這項名為SPOT(通過觀察技術對乘客進行篩查)的計劃,旨在教導TSA人員如何監控乘客是否有幾十個可疑的信號,這些跡象代表了壓力、欺騙或恐懼。但是,該計劃受到了科學家的廣泛批評,認為其不準確、且帶有種族偏見。

科技公司已經開始利用AI來進行情緒識別

這種擔憂並沒有阻止科技公司利用這一理念。一些公司已經開發了APP來感知情緒,這些系統被用於求職者評估、測謊、增加廣告的吸引力,甚至是診斷痴呆症、抑鬱症等疾病。

據估計,該行業的價值為數百億美元。包括微軟、IBM和亞馬遜在內的科技巨頭,都在開發通過面部檢測情緒的算法。

由於研究人員仍在爭論人們面部表情對於傳達情緒的保真度,許多該領域的人認為,試圖讓計算機自動做到情緒識別還為時過早——尤其是當該技術可能產生破壞性影響時。紐約大學的研究中心AI Now研究所甚至呼籲禁止在諸如招聘或執法等敏感情況下使用情感識別技術。

俄亥俄州立大學的專家阿萊克斯·馬丁內斯(Aleix Martinez)說,面部表情很複雜,即使人也經常出錯。考慮到這一點,他說,鑒於自動化的趨勢,「我們應該非常謹慎」。

01 情緒和表達只隔一層皮膚

人的面部有43塊肌肉,能夠形成多種表情。但長期以來科學家們一直認為,某些表達方式能傳達出特定的情感。

推動這一觀點的先驅是查爾斯·達爾文(Charles Darwin)。他在1859年出版的《物種起源》堪稱觀察學的大師級別,他在1872年的第二部作品《人類與動物的情感表達》則更加鮮明地表達了這一觀點。

達爾文指出,靈長類動物的面部動作看起來像人類的情感表達,如厭惡或恐懼,並認為這些表情必須具有一定的適應功能。

例如,嘴唇彎曲、皺起鼻子和眯起眼睛這種與厭惡相關的表達,可能起源於保護個體免受有害病原體的侵害。只有當社會行為開始發展時,這些面部表情才會起到交際的作用。

達爾文關於情緒的論文中提到很多情緒的表達方式,圖為受試者盡力作出悲傷的表情

埃克曼在20世紀60年代進行的第一次跨文化實地研究也支持了這一假設。他測試了世界各地對六種主要情緒——幸福、悲傷、憤怒、恐懼、驚訝和厭惡——的表達和感知。

埃克曼說,這些早期研究證明了達爾文進化論所預言的普遍性。後來的研究支持了這樣的說法,即一些面部表情可能會帶來適應性優勢。

波士頓東北大學的心理學家麗莎·費爾德曼·巴雷特(Lisa Feldman Barrett)說:「長期以來的假設是,面部表情是潛意識的動作。」

換句話說,我們的臉無力隱藏我們的情緒。這個假設的問題在於,人們可以假裝情緒,可以產生感情而不露聲色。

「我們盡最大的努力,拋開以前研究的影響,」巴雷特說,他們不是從假設開始,而是從數據入手。「當出現分歧時,我們擴大了對證據的搜索範圍。」

他們最終閱讀了大約1000篇論文。兩年半後,研究小組得出了一個鮮明的結論:幾乎沒有證據表明,人們能從一組面部動作中可靠地推斷出別人的情緒狀態。

面部表情其實並不能準確地傳達情緒

缺乏普遍表達的一個原因是,面部不是人類表達情緒的全部。

身體姿態、個性、語氣和膚色的變化,都在我們感知和表達情緒方面起著重要的作用。例如,情緒狀態的變化會影響血液流動,反過來又會改變皮膚的外觀。

除了面部表情,人類還有很多表達情緒的方式

02 情緒是複雜的

加拿大哥倫比亞大學的心理學家傑西卡·特蕾西(Jessica Tracy)認為,根據一些反例就判定埃克曼的普遍性理論錯誤,是有失偏頗的。她說,一個人種或文化對是什麼使憤怒的面孔有了略有不同的想法,並不能推翻整個理論。

她補充說,大多數人看到一張憤怒的臉時都會認出來圖片上的人很生氣,「大量證據表明,世界上大多數文化中的大多數人確實認為這種表達方式是普遍的。」

特蕾西爭辯說,巴雷特將他們的結論描繪成六種情緒和面部動作之間的一對一的硬性映射。「我相信情感科學領域的任何研究人員都不會認為這是事實。」

特蕾西認為,理解面部表情所需要的是一種更豐富的情感分類法。比如,研究者不應該把幸福視為一種情感,而應該將情感類別分為幾個組成部分,幸福應該包括快樂、快樂、同情、驕傲等等,每種表達可能不同或是重疊。

特蕾西認為,理解面部表情所需要的是一種更豐富的情感分類法

辯論的核心是:特徵達到什麼標準才算是顯著的。

在一項研究中,參與者為所見到的每張臉選擇六個情感標籤之一,一些研究人員可能會認為,選擇超過20%的選項具有顯著的共性。其他人可能認為20%遠遠達不到標準。傑克認為埃克曼的門檻太低了。

她說:「這些上世紀六七十年代的圖表,每一張都顯示出文化認知的巨大差異。沒有數據顯示情緒得到了普遍認可。」

除了顯著性之外,研究人員還必須與主觀性作鬥爭:許多研究中實驗者在測試開始前就給情感打了標籤,以便對最終結果進行比較。因此,巴雷特、傑克和其他人正試圖找到更中性的方法來研究情緒。

巴雷特正在研究生理測量,希望為憤怒、恐懼或喜悅提供一個指標。而傑克不使用人為拍攝的照片,而是使用電腦隨機生成的面部表情,以避免情緒固定在常見的六個人身上。其他研究者則要求參與者將人臉分為他們認為的情感類別,或者讓來自不同文化背景的參與者用自己的語言標記圖片。

03 矽基世界中的情緒

在算法的世界,不能存在這麼多模糊和不確定性。

一個典型的人工智慧程序,需要從數以百萬計的圖像和數百小時的視頻片段的面部表情中識別特徵,把每個情緒標記出來,讓AI從中辨別。

Affectiva公司說,它的軟體已經經過了來自87個國家的700多萬張人臉的訓練,準確率達到了90%,但該公司拒絕對其算法背後的科學原理髮表評論。

Affectiva承認,面部表達情感的方式存在差異,「但當一個人有情緒要表達時,這些表達在面部發生的頻率要比其他方式多」。然而,研究人員對這種軟體持懷疑態度,一方面出於對用於訓練算法的數據的擔憂,一方面是其背後的科學問題仍在爭論。

埃克曼說,他直接質疑了這些公司的主張。他已寫信給幾家「世界上最大的軟體公司」,要求查看其自動化技術能夠發揮作用的證據,但沒有得到任何答覆。「據我所知,他們所聲稱的是毫無根據的東西,」他說。

馬丁內斯讓步說,自動情緒檢測也許能夠判斷出一組人的平均情緒反應。例如,Affectiva向營銷機構和品牌銷售軟體,以幫助預測客戶群對產品或營銷活動的反應。

自動情緒檢測也許能夠判斷出一組人的平均情緒反應

如果這個軟體犯了一個錯誤,那麼代價是比較低的,無非廣告效果可能比預期的要差一點。但是,如果算法被用於可能對人們的生活產生重大影響的領域,例如在工作面試和入境檢查中,情況就不是如此了。

去年,匈牙利、拉脫維亞和希臘試行了一種對旅行者入境預篩查的系統,旨在通過分析面部微表情來檢測欺騙行為。

解決情緒表達的爭論還在繼續。巴雷特經常被要求向科技公司介紹她的研究,她認為研究人員需要像達爾文撰寫《物種起源》時所做的那樣:觀察、觀察、再觀察。

觀察人們在現實生活中是如何通過面部和身體表達情緒的——而不僅僅是在實驗室里,然後使用機器記錄和分析真實世界的素材。

(本文未經造就授權,禁止轉載。)

文章來源: https://twgreatdaily.com/zh-cn/_jZhLHQBLq-Ct6CZJlD5.html