美國大選在即,用數據解讀歷年總統演講:從華盛頓到特朗普,他們都在說什麼?

2020-11-03     大數據文摘

原標題:美國大選在即,用數據解讀歷年總統演講:從華盛頓到特朗普,他們都在說什麼?

大數據文摘出品

來源:medium、eurekalert

編譯:千雪、張秋玥、夏雅薇

「演講就是力量:演講是說服,是皈依,是強迫。」——拉爾夫·沃爾多·愛默生。

在美國2020年總統大選結果揭曉之際,想必拜登和特朗普都已經起草好了自己的那份總統就職演講,希望以勝利者的姿態對全世界發表感言。

其實自美國誕生以來,總統的演講既是對國家現狀的反映,也是對總統認為國家應該走向何方所需變革的呼籲。

從1789年喬治·華盛頓的第一次就職演講,到1977年吉米·卡特關於全國能源問題的演說,再到2019年唐納德·特朗普的國情咨文,迄今為止(2020年)每一位總統都有自己獨特的演講風格。文摘菌也想看看,運用自然語言處理和主題建模,能否分析出美國總統歷史中演講詞彙所傳達的信息、情感和複雜性

通過使用數據科學技術進行自然語言處理和無監督學習,本文作者研究了990多篇總統演講表達的情感、演講內容的複雜程度和關注重點,以便更好地了解總統們對演講能力的運用。然後根據時間線和不同政黨的區分,試圖找出他們的演講趨勢、模式,還有其他見解。本項目將對美國歷史上所有總統的演講進行分析。

以下是一些值得一看的結論:

美國總統們的情緒:特朗普語氣更積極更快樂,內容上則更固執己見

使用的工具:TextBlob的情緒性和主觀性。

語言情緒的測量方式有兩種:情緒性(從消極/悲傷的語氣轉變為更積極/快樂的語氣)和主觀性(從表達客觀事實轉變為輸出更多個人觀點)。

下面是情緒分析的結果,每個點代表一個不同的總統,每種顏色代表一個政黨。

正如你在圖表中所看到的,沒有明顯的顏色簇,這意味著總統們的情緒不會因為黨派不同而出現區分,在其中影響更多的似乎是個人的情緒轉變。

分開來,我們來看看共和黨總統們的情緒。

圖中你可以看到總統的名字。

從這些圖表中我們可以看到,與其他美國總統相比,富蘭克林·皮爾斯的語氣更消極更悲傷,內容上則更真實,這一方面與他個人性格有關,另一方面也與當時的時代大背景相關;而唐納德·特朗普的語氣更積極更快樂,內容上則更固執己見。

請記住,情緒性和主觀性並不能告訴我們總統在說什麼;一個總統可以說一些積極的話,但這些話對人們產生的影響可能是負面的。這種情緒分析只能告訴我們,某位總統是如何傳達他想表達的內容的,以及他們是使用客觀事實還是使用個人觀點來支持他們的聲明。

哪些美國總統的演講最老練?演講用詞趨向簡單化,情感表達更強烈

使用的工具:textstat的等級分析。

「語言的複雜程度」是基於一個人要讀懂一篇文章所需要的學歷層次衡量標準——這裡的標準是聽到一篇演講時,可以完全理解它的平均學歷層次。

下圖顯示了多年以來,每一篇演講都被評為了什麼層次。我們仍然用不同的顏色來代表政黨。

從圖中我們可以看出,在美國早期,總統的演講技巧更為高明。

平均而言,需要大學水平或更高學歷的人才能理解。到了20世紀20年代左右,演講的複雜程度開始下降,這種趨勢一直延續到今天。這樣做的一個潛在原因可能是受總統自己詞彙量的影響,也可能是一個經過深思熟慮的決定;20世紀20年代,收音機在普通家庭中逐漸普及,越來越多的人可以聽到總統演講。

那麼,總統們是否主動改變了他們的詞彙,使他們能夠與更廣泛的聽眾有所共鳴?這一分析並不能明確地告訴我們答案,但這絕對是一個值得探索的有趣領域。

還要注意的是,各個級別的政黨層次不齊,這表明各政黨在演講技巧方面沒有明顯差別。

已有其他研究驗證了這一觀點:當今美國政壇演講用詞趨向簡單化,情感表達更強烈。

堪薩斯州立大學校內一個計算機科學研究團隊分析了1873年至2010年共和黨與民主黨議員的近200萬次國會演講的內容。他們的分析表明,當今政治演講的風格實際上與幾十年前的國會政治演講風格已經截然不同

在最近發表在Heliyon期刊上的研究論文「138年來國會演講的數據分析」中,堪州計算機科學專業的學生Ethan Tucker和Colton Capps以及計算機科學副教授Lior Shamir使用自動文本分析算法來分析各個年份的國會演講。

研究表明,自1980年代初以來,與女性身份有關的單詞(例如she,her,hers,woman,women等等)的出現頻率一直在增加,而與男性相關的單詞出現頻率則在下降。與1950年代相比,與21世紀女性身份相關的單詞出現頻率高出五倍,但仍低於與男性身份相關的單詞出現頻率。自1990年代以來,與共和黨議員的演講相比,民主黨議員的演講中有關女性身份的用語出現得更為頻繁。

研究還表明,這些年來的閱讀難度水平也發生了顯著變化。該分析測量了Coleman-Liau可讀性指數,該指數可估計特定文本的閱讀難度水平並將其與教育水平相關聯。分析表明,共和黨和民主黨議員的國會演講的閱讀難度從18世紀的八年級水平一直提高到1970年代的十年級。但是自1976年以來,政治演講的閱讀水平一直在下降,到21世紀,它已經低於九年級水平。直到1970年代初,國會議員在演講中所使用的詞彙也存在同樣的趨勢。那之後的閱讀難度至今依然在下降。

研究人員對演講的分析還顯示,與18世紀和19世紀初國會演講相比,最近的國會演講表達了更強烈的情緒,無論是積極還是消極情緒。政治演講中的情緒逐漸變得更加積極,並在1960年代達到頂峰,但在1970年代間突然變得非常消極。而自1970年代以來,在國會演講中表達的情緒又重新變得越來越積極。

根據這項研究,演講的閱讀水平和詞彙量的下降可能與1970年代開始在國會在大眾傳媒中的曝光率增加(包括現場廣播和電視報道)有關。國會議員開始逐漸調整他們的演講風格,通過媒體向公眾講話,而不是與其他立法者講話

美國總統演講的主題:從法律、公權力到就業家庭

使用的工具:使用gensim的LDA模型進行無監督主題建模。

現在讓我們來試著更好地理解總統演講的內容。

使用潛在Dirichlet分配(LDA)主題建模,確定了7個總統演講的主題:

1.美國就業和家庭的幫助&需求

2.法律、憲法和權利

3.法律、條約和行動

4.公共權力&職責

5.美國自由之戰

6.工作&商業

7.用戰爭&武力實現世界和平

在這些主題之間需要注意的是詞語的定位和平衡,比如「美國自由之戰」和「用戰爭&武力實現世界和平」,其中一個目標與其他目標相互緩衝,比如「發動戰爭可以獲得美國自由」,或者「尋求世界和平,但也會有戰爭發生」。

以下是這七個話題多年來在總統演講中的流行趨勢:

我們再次看到,在演講的主題上,政黨之間並沒有太多的區別,相反,隨著時間線的推移,反而出現了越來越大的差異。在美國發展的早期,我們看到「法律、條約和行動」與「公共權力&職責」更加普遍。最近幾年,我們看到「美國就業和家庭的幫助&需求」,「用戰爭&武力實現世界和平」,「美國自由之戰」更受總統歡迎。

讓我們用另一種角度來審視這些話題,即根據美國不同的歷史時期,看一個話題在美國歷史上的哪個時期出現過。顏色代表每個政治演講題目:

從這張圖中我們可以看出,某些歷史時期似乎是總統演講主題結束或到來的時期。例如,在新政時期,我們第一次看到「美國就業和家庭」上升為總統演講的主要話題,此後幾乎每個時代我們都會看到它的出現。

綜述

綜上所述,這個項目的分析告訴我們:

  • 情緒似乎因總統而異,而非政黨。
  • 在演講中使用複雜詞彙這一潮流已經過時多年。
  • 演講主題多年來變化較大,但各個政黨之間的主題差別不大。
  • 演講主題與國家狀況和公眾關注的方面有關。

歷史事件可能會成為一種催化劑,促使幾代人的演講主題發生轉變。

最後,我想再次強調,這一分析顯示了一些總統演講的趨勢和模式,但同樣重要的是,它向我們表明,從表面上看,總統之間、政黨之間的講話基調和定位都可能存在相似之處。有鑒於此,我們更需要關注總統演講的深層實質內容,為總統進行知情投票和知情支持。

相關報道:

https://www.eurekalert.org/pub_releases/2020-08/ksu-ast081820.php

https://towardsdatascience.com/us-presidential-voices-over-the-ages-35678518f82b

文章來源: https://twgreatdaily.com/zh-my/SSP6jHUBUvjGtfAdafs4.html