特朗普演講逼瘋AI？從頭學習了1100萬字後，AI能讀懂「川言川語」嗎

2020-06-22 大數據文摘

大數據文摘出品

作者：劉俊寰、Bing

最近，美國前國家安全顧問約翰‧博爾頓出版了他的新書The Room Where It Happened，在書中，博爾頓寫道，特朗普很容易受威權式領導人影響，經常被他自己的顧問鄙視。

面對這項「指責」，特朗普坐不住了，在接受《華爾街日報》採訪時，特朗普直接說，「博爾頓是個騙子」，「白宮每個人都討厭他」。

特朗普的這一說法尚未得到博爾頓發言人的回應。

特朗普這類迷惑言論對全世界民眾來說也是見怪不怪了，不過，不知道你有沒有想過，如果用AI識別這些特朗普的「川言川語」，會是什麼情形？

別急，我們先回到三年前，當時特朗普正在針對第二次世界大戰發表演講，那時特朗普式英語才面世不久，及其狂野的遣詞造句、隨意切換的時態和主語、扭曲的語法、前後衝突的連詞、滿天飛的介詞，從句套從句、括號套括號，還多少讓人有些不適應。

可能美國觀眾聽了也蒙蔽一片。

不過也正是在那個時候，Bill Frischling就開始讓他的AI機器人Margaret去轉錄特朗普講話中一段127字的內容，當特朗普第四次提到「獲勝」時，Margaret崩潰了。Frischling回憶說：「它仍然試圖像處理普通英語那樣給這段話添加標點符號，而不是處理『特朗普式英語』。」

科羅拉多大學人工智慧與機器人技術實驗室的負責人Frischling是一個自學成才的程式設計師，疫情期間他在維吉尼亞州的家中工作。

鑒於此，Margaret不得不重新設定特朗普模式，從頭開始學習「川言川語」，於是Frischling聘請了一位有自動標點博士學位的計算機專家來教Margaret「忘記」正常語法，轉而學習分析特朗普的講話。

特朗普生氣了嗎？

首先需要糾正一個說法，特朗普並不是AI學習的第一位美國總統，此前就有不少學者利用AI從各個角度分析了林肯的《葛底斯堡演說》，雖然整個演說只有272個單詞，但相關研究書籍可以說能塞滿整個圖書館。

面對「正統」的歷任美國總統們，AI還能算是遊刃有餘，但是特朗普是普通人嗎？因此要學習「川言川語」，難度可不是一般的大。

比如，在4月23日，特朗普在白宮舉行了新冠病毒的簡報會，那天特朗普建議醫生應考慮向患者注射家用消毒劑以殺死病毒。會議開始後第52分鐘，《華盛頓郵報》記者Philip Rucker正在質問特朗普，他是否承認曾不負責任地大肆宣傳未經證實的關於熱和陽光可以治癒冠狀病毒的消息。

特朗普回擊道：「我是總統，而你才是在製造假新聞！」

讓我們再往前看看，2018年中期選舉後的一場新聞發布會上，特朗普與CNN記者Jim Acosta發生了一場令人難忘的對峙，當天共和黨損失慘重。

對話初期，特朗普針對Acosta就移民問題向他施壓時怒吼道，「夠了」！隨後他下台。

這兩場發布會上，特朗普都真的生氣了嗎？

Margret的答案是，在新冠簡報會上，特朗普真的生氣了，在2018年的新聞發布會上，特朗普也真的生氣了，但是當他下台後，他的情緒發生了「明顯的變化」，他在享受這場衝突。

要學習「川言川語」，到底難在哪？

某種程度上，在Margaret眼中，特朗普是完全可以預測的。

幾乎所有情況下，特朗普在脫稿時說話更快，大約每分鐘220字，作為對比美國人均速度為每分鐘110-150字；同時，大多數人在要說假話時語速會放慢，吞吞吐吐或者感覺很不自在，但是特朗普相反，他會開始加快語速，而且會用一些「虛詞」過渡，比如「首先」，「人們在說」等，然後逐步放緩到正常語速。

Frischling把這種速度變化稱為特朗普的「推銷員模式」。

當對著提詞器讀稿時，特朗普的語速會減慢到每分鐘111字，對於這類準備好的演講，特朗普說話聽起來很單調麻木，在重點處隨意發揮，好像是第一次見到稿子一樣。特朗普之前說過，對於競選總統的人來說，讀稿是非法的。

Frischling總結道：「你可以把這個過程想像成是開車，一般人是正常行駛，特朗普則是超速行駛。」不過，他認為，這個結果並不能說明特朗普話語中的真假成分，在這方面，他會單獨請人在核查事實後，再對數據進行交叉檢查。

除了語言上的不同，肢體上呢？在這我們就可以解答一下上面的答案了。

特朗普真正生氣時，他的話也會隨之變得簡潔，揮舞著的手臂也會靜止下來，「當他停止做手勢時，那就意味著該小心了。無論要發生什麼事，請保持警惕。」

根據Margret用曲線描繪的特朗普壓力水平變化情況，在新冠簡報會上，他和《華盛頓郵報》記者對峙時，曲線突然飆升。不過根據以往的經驗，特朗普在面對「假新聞」這類攻擊時，他的內心其實是毫無波動的，「聲音、語速、說話方式…..一切都和說『天氣怎麼樣』時一樣」，Frischling說。

而在選舉後的新聞發布會上，當特朗普在台上的時候，曲線也處於十分高的水平，但當他戲劇性地走下講台並交叉雙臂時，壓力曲線下降到了平均值，這正是他在享受這場衝突的標誌。

學習了1100萬字的內容後，Margret比特朗普還了解自己

迄今為止，Margaret已經學習了超過1100萬字的特朗普講話、推文、書籍、集會、視頻、廣播和電視剪輯，這些資料可以追溯到1976年，特朗普第一次在紐約時報發表公開信的時候。

如今Margaret比許多美國人更能理解特朗普的講話模式，甚至更理解特朗普，他的用詞，他的下意識的表達，他的傾向和習慣。說Margret是這個世界上最了解特朗普的人也不為過。

而且她還有著極強的耐心和學習能力，她不會因為特朗普的演講而歡呼、嘲諷或轉台，她只是在那裡靜靜地分析特朗普的每一句話和他說話的方式，再用算法從一個存有四十多年語言資料的資料庫中收集信息，試圖解讀他「不穩定的內心」。

Margaret的一項重要發現就是，特朗普之所以可以快速地說出一些明顯很荒謬的假話，是因為他根本不在乎。

Frischling解釋道：「大多數人在不說實話時，不會感覺更自在，反而會感覺不太舒服。但特朗普正相反。」Margaret可以評估出特朗普的壓力水平，他是否冷靜，是真的生氣，還是只是在表演，甚至還可以模擬特朗普的公開講話。

為了得出這些結論，Margret會追蹤特朗普說話的停頓、手勢、語速，他使用的形容詞類型，他是否在使用他的常用詞彙，以及他的語氣等等。

「他說的每個字都使Margaret變得更聰明，並讓她能夠聽出更微妙的區別。」Frischling說。

MIT學生：建立特朗普模型？太簡單！

特朗普被分析也不是最近才出來的。

早在2016年，一位麻省理工學院的研究生Bradley Hayes就創造了一個發推特的機器人@DeepDrumpf，這個機器人能用混亂的語言來模仿特朗普在社交媒體中的發言，比如「我們必須製造美國。他們做不到。因為我要為這個國家付出代價」。

由於在一條推文中，該帳號提到將釋放暴力恐怖分子來威脅前總統歐巴馬，Hayes不得不屏蔽一條推文。不過他表示，如果有更多的時間、更好的數據，這個機器人將會變得更強大。

Hayes在接受採訪時坦言道，特朗普的語言比其他人更簡單，因此在建模上，特朗普的模型是最容易建立起來的。如果能與某一天之內所有人與特朗普談話過的人進行交流，那麼你很有可能會建立一個更加準確的模型，更好地預測他將要談論的內容和他的立場。

Hayes表示，他們只讓AI學習了幾個小時的特朗普演講內容，然後隨機選擇字母作為句子的開頭，逐個字母進行構建。比如，如果AI首先選擇了字母「M」，它可能會在其後馬上跟上字母「A」，然後「K」，直到整個單詞和句子能夠闡明特朗普最喜歡的口號，「再次使美國變得偉大」（Make America Great Again）。

一個特朗普，竟然要AI與其他多領域專家共同聯手

AI技術顯然提升了研究的手段和標準。

Margret是新聞工作者、學者和政治家的首選資源，亞馬遜的數百萬個語音激活的Alexa設備，也會利用Margaret獲取特朗普的日程安排和最新推文。在新冠病毒危機中，為期數周的每晚簡報為分析提供了最典型的素材，他肆無忌憚地宣稱自己取得了成功，並完全無視對政府錯誤應對的質疑。

至此，為了研究特朗普非正統的講話風格，AI與語言學家、認知專家、理論心理學家和政治學家建立了合作關係。

計算機科學家認為，人工智慧可以檢測對人類大腦而言過於複雜的大量數據，從中發現模式。情報專家懷疑，外國間諜服務正在將AI分析與人格特徵和傳統的基於個人的研究方法相結合，以分析特朗普和其他世界領導人。

「一開始，特朗普把所有人都搞暈了」，前中央情報局特工John Sipher說道，他幾十年來一直被部署在俄羅斯和其他國家，「現在大家才開始理解他在想什麼」。

麻省理工學院可部署機器學習中心的教授Aleksander Madry警告說，這項技術並非萬無一失，而且通過機器學習發現的模式「通常不是我們想像的那樣。」

一些程式設計師曾使用機器人偽造特朗普演講，而這些「假貨」擁有可能攪亂美國政治的能力。這種應用是一個危險的信號。

Bradley Hayes表示，幾乎每個擁有大型數據集的人都可以使用AI機器人得出有意義的結論——或者歪曲這些結論。

如果說特朗普的語言通常可以預測，那麼他的決定有時似乎完全是隨機的。

Frischling為他的私人客戶研究過一些國會議員，他認為他們在決定轉變政策之前會有一些預兆，比如會就某些話題發表更多的公開評論，或者改變說話方式。但這些關係在特朗普身上幾乎沒有看到。

Frischling表示，「對於一項政策提議，他可以先是說『我認為這太糟糕了』，然後又在10小時之內簽署一條行政命令批准這項政策。」Margaret仍在努力理解這一點。

或許可以說，特朗普的種種迷惑行為也正「歪打正著」地保護著美國。

相關報道：

https://www.latimes.com/politics/story/2020-05-07/cant-decipher-trump-speak-meet-margaret-the-computer-bot

https://qz.com/631497/mit-built-a-donald-trump-ai-twitter-bot-that-sounds-scarily-like-him/

特朗普演講逼瘋AI？從頭學習了1100萬字後，AI能讀懂「川言川語」嗎

等等，那頭豬還不想被吃！這個系統能讀懂豬的6種情緒，讀圖3780張，成功率85%

感受百年前五四運動的青年力量！用AI上色黑白影像，網友：感受到了覺醒與抗爭

從抖音起名說起，位元組跳動解密數據驅動的正確打開方式

中科院博論致謝登上熱搜：計算機終成一生事業與希望！網友：他把自己活成了光

你的每個哈欠老闆都知道！被AI攝像頭全天盯緊，亞馬遜快遞小哥不幹了

這個無人機會射箭！80多次反覆測試，精度±10cm，主要用於發送傳感器到危險區

SpaceX工程師在「暗網」用股票內幕消息換比特幣，獲利27000美元，已被起訴

數據時代的產品經理，通過這些能力站上C位！

疫苗亂局，拜登被驚動！創造谷歌微軟的美國，卻建不出一個靠譜的疫苗預約網站

矽谷公司公開存儲密碼，使15萬攝像頭被入侵！中槍的特斯拉：已停止攝像頭聯網

全球首台，基於5G的遠程紋身機問世！光學跟蹤結合C++，英國極客耗時6周打造

恢復哆啦A夢聽覺！實裝蝗蟲耳朵，生物機器人可以聽到聲音，還能區分和響應

用佳能單反運行我的世界伺服器，Reddit點贊37.4K，本人：相機可能變板磚

上交友軟體先測謊？日本大學生開發匹配模型，60個問題綜評價值觀，精度達75%

黑吃黑？俄羅斯四大黑客論壇相繼遭黑客攻擊，網友：小丑竟是我自己

女子被困浴室超30小時，危急情況AI能否救人於水火？

100美元賭你用這根撞球杆還能不進球！百發百中系列更新，網友：我沒進化完全

從簡筆畫到數據科學，Kaggle冰川圖像分類比賽如何征服「輪船剋星」

幫紐約警察營救人質！被征警的波士頓動力狗，會成為沒有感情的「監視工具」嗎

萬物數字化的時代，開發者的「變」與「不變」

一文帶你重溫去年最難忘的10個數據泄露事件

數據解讀「特殊」春運：「返鄉過年」人數同比降五成，這些人成今年春運主力

貝佐斯卸任亞馬遜CEO，安迪·賈西接任，卸任後將更多關注基金會和航天事業

睫毛長度精準復刻！掃描面部數據，用特殊技術和3D列印製作人臉，畫皮直呼內行