大数据文摘出品
来源:medium、eurekalert
编译:千雪、张秋玥、夏雅薇
“演讲就是力量:演讲是说服,是皈依,是强迫。”——拉尔夫·沃尔多·爱默生。
在美国2020年总统大选结果揭晓之际,想必拜登和特朗普都已经起草好了自己的那份总统就职演讲,希望以胜利者的姿态对全世界发表感言。
其实自美国诞生以来,总统的演讲既是对国家现状的反映,也是对总统认为国家应该走向何方所需变革的呼吁。
从1789年乔治·华盛顿的第一次就职演讲,到1977年吉米·卡特关于全国能源问题的演说,再到2019年唐纳德·特朗普的国情咨文,迄今为止(2020年)每一位总统都有自己独特的演讲风格。文摘菌也想看看,运用自然语言处理和主题建模,能否分析出美国总统历史中演讲词汇所传达的信息、情感和复杂性。
通过使用数据科学技术进行自然语言处理和无监督学习,本文作者研究了990多篇总统演讲表达的情感、演讲内容的复杂程度和关注重点,以便更好地了解总统们对演讲能力的运用。然后根据时间线和不同政党的区分,试图找出他们的演讲趋势、模式,还有其他见解。本项目将对美国历史上所有总统的演讲进行分析。
以下是一些值得一看的结论:
美国总统们的情绪:特朗普语气更积极更快乐,内容上则更固执己见使用的工具:TextBlob的情绪性和主观性。
语言情绪的测量方式有两种:情绪性(从消极/悲伤的语气转变为更积极/快乐的语气)和主观性(从表达客观事实转变为输出更多个人观点)。
下面是情绪分析的结果,每个点代表一个不同的总统,每种颜色代表一个政党。
正如你在图表中所看到的,没有明显的颜色簇,这意味着总统们的情绪不会因为党派不同而出现区分,在其中影响更多的似乎是个人的情绪转变。
分开来,我们来看看共和党总统们的情绪。
图中你可以看到总统的名字。
从这些图表中我们可以看到,与其他美国总统相比,富兰克林·皮尔斯的语气更消极更悲伤,内容上则更真实,这一方面与他个人性格有关,另一方面也与当时的时代大背景相关;而唐纳德·特朗普的语气更积极更快乐,内容上则更固执己见。
请记住,情绪性和主观性并不能告诉我们总统在说什么;一个总统可以说一些积极的话,但这些话对人们产生的影响可能是负面的。这种情绪分析只能告诉我们,某位总统是如何传达他想表达的内容的,以及他们是使用客观事实还是使用个人观点来支持他们的声明。
哪些美国总统的演讲最老练?演讲用词趋向简单化,情感表达更强烈使用的工具:textstat的等级分析。
“语言的复杂程度”是基于一个人要读懂一篇文章所需要的学历层次衡量标准——这里的标准是听到一篇演讲时,可以完全理解它的平均学历层次。
下图显示了多年以来,每一篇演讲都被评为了什么层次。我们仍然用不同的颜色来代表政党。
从图中我们可以看出,在美国早期,总统的演讲技巧更为高明。
平均而言,需要大学水平或更高学历的人才能理解。到了20世纪20年代左右,演讲的复杂程度开始下降,这种趋势一直延续到今天。这样做的一个潜在原因可能是受总统自己词汇量的影响,也可能是一个经过深思熟虑的决定;20世纪20年代,收音机在普通家庭中逐渐普及,越来越多的人可以听到总统演讲。
那么,总统们是否主动改变了他们的词汇,使他们能够与更广泛的听众有所共鸣?这一分析并不能明确地告诉我们答案,但这绝对是一个值得探索的有趣领域。
还要注意的是,各个级别的政党层次不齐,这表明各政党在演讲技巧方面没有明显差别。
已有其他研究验证了这一观点:当今美国政坛演讲用词趋向简单化,情感表达更强烈。
堪萨斯州立大学校内一个计算机科学研究团队分析了1873年至2010年共和党与民主党议员的近200万次国会演讲的内容。他们的分析表明,当今政治演讲的风格实际上与几十年前的国会政治演讲风格已经截然不同。
在最近发表在Heliyon期刊上的研究论文“138年来国会演讲的数据分析”中,堪州计算机科学专业的学生Ethan Tucker和Colton Capps以及计算机科学副教授Lior Shamir使用自动文本分析算法来分析各个年份的国会演讲。
研究表明,自1980年代初以来,与女性身份有关的单词(例如she,her,hers,woman,women等等)的出现频率一直在增加,而与男性相关的单词出现频率则在下降。与1950年代相比,与21世纪女性身份相关的单词出现频率高出五倍,但仍低于与男性身份相关的单词出现频率。自1990年代以来,与共和党议员的演讲相比,民主党议员的演讲中有关女性身份的用语出现得更为频繁。
研究还表明,这些年来的阅读难度水平也发生了显著变化。该分析测量了Coleman-Liau可读性指数,该指数可估计特定文本的阅读难度水平并将其与教育水平相关联。分析表明,共和党和民主党议员的国会演讲的阅读难度从18世纪的八年级水平一直提高到1970年代的十年级。但是自1976年以来,政治演讲的阅读水平一直在下降,到21世纪,它已经低于九年级水平。直到1970年代初,国会议员在演讲中所使用的词汇也存在同样的趋势。那之后的阅读难度至今依然在下降。
研究人员对演讲的分析还显示,与18世纪和19世纪初国会演讲相比,最近的国会演讲表达了更强烈的情绪,无论是积极还是消极情绪。政治演讲中的情绪逐渐变得更加积极,并在1960年代达到顶峰,但在1970年代间突然变得非常消极。而自1970年代以来,在国会演讲中表达的情绪又重新变得越来越积极。
根据这项研究,演讲的阅读水平和词汇量的下降可能与1970年代开始在国会在大众传媒中的曝光率增加(包括现场广播和电视报道)有关。国会议员开始逐渐调整他们的演讲风格,通过媒体向公众讲话,而不是与其他立法者讲话。
美国总统演讲的主题:从法律、公权力到就业家庭使用的工具:使用gensim的LDA模型进行无监督主题建模。
现在让我们来试着更好地理解总统演讲的内容。
使用潜在Dirichlet分配(LDA)主题建模,确定了7个总统演讲的主题:
1.美国就业和家庭的帮助&需求
2.法律、宪法和权利
3.法律、条约和行动
4.公共权力&职责
5.美国自由之战
6.工作&商业
7.用战争&武力实现世界和平
在这些主题之间需要注意的是词语的定位和平衡,比如“美国自由之战”和“用战争&武力实现世界和平”,其中一个目标与其他目标相互缓冲,比如“发动战争可以获得美国自由”,或者“寻求世界和平,但也会有战争发生”。
以下是这七个话题多年来在总统演讲中的流行趋势:
我们再次看到,在演讲的主题上,政党之间并没有太多的区别,相反,随着时间线的推移,反而出现了越来越大的差异。在美国发展的早期,我们看到“法律、条约和行动”与“公共权力&职责”更加普遍。最近几年,我们看到“美国就业和家庭的帮助&需求”,“用战争&武力实现世界和平”,“美国自由之战”更受总统欢迎。
让我们用另一种角度来审视这些话题,即根据美国不同的历史时期,看一个话题在美国历史上的哪个时期出现过。颜色代表每个政治演讲题目:
从这张图中我们可以看出,某些历史时期似乎是总统演讲主题结束或到来的时期。例如,在新政时期,我们第一次看到“美国就业和家庭”上升为总统演讲的主要话题,此后几乎每个时代我们都会看到它的出现。
综述综上所述,这个项目的分析告诉我们:
情绪似乎因总统而异,而非政党。 在演讲中使用复杂词汇这一潮流已经过时多年。 演讲主题多年来变化较大,但各个政党之间的主题差别不大。 演讲主题与国家状况和公众关注的方面有关。历史事件可能会成为一种催化剂,促使几代人的演讲主题发生转变。
最后,我想再次强调,这一分析显示了一些总统演讲的趋势和模式,但同样重要的是,它向我们表明,从表面上看,总统之间、政党之间的讲话基调和定位都可能存在相似之处。有鉴于此,我们更需要关注总统演讲的深层实质内容,为总统进行知情投票和知情支持。
相关报道:
https://www.eurekalert.org/pub_releases/2020-08/ksu-ast081820.php
https://towardsdatascience.com/us-presidential-voices-over-the-ages-35678518f82b
责任编辑: