有人量化分析了200年来历届美国总统就职演讲风格 #川普会上套么?

嗯,川普要上台了,在奥黑farewell address明里暗里黑完川普之后,火箭君对新一任美国总统的就职演说风格充满了好奇——这不,有人的好奇劲比火箭君更足,竟然定量分析了历年美国总统的就职演说稿,想要了解演说风格的影响因素——火箭君今天决定把这篇论文翻出来和大家一起看一看~!

论文说了点啥?

整篇论文分析了过去200多年来总计57篇美国总统的就职演说 从乔治华盛顿到巴拉克奥巴马,所有的就职演说词都被用文体测定索引(stylometry indices)的方法进行分析。整个分析希望能够发现政治和历史特点(比如战争、金融危机、意识形态等特点)是不是会影响美国总统就职演说的风格。

为了定量分析出就职演说的特征,学者Miroslav Kubát提出了3个重要指标: 1.演说中使用词汇的丰富程度(人话:是不是词汇贫乏) 2.演说主题的集中程度(人话:是不是乱开无轨电车) 3.描述性用词的多少(人话:是不是干货够多)

# 火箭君结论先行,但是看到最后总是有彩蛋的# 学霸通过追溯两个多世纪一来的总统演说,发现: 总统的就职演说没有明显受到任何政治和历史的特点影响,反倒是非常取决于每个总统自身的性格 战争也好、经济萧条也罢可能会在某些方面影响演说的用词,但是,总统就职的时候要怎么说话,主要还得看总统的喜好~

分析维度说明

A. 演说中使用词汇的丰富程度(是不是用词贫乏) 为了知道一篇演说的用词丰富程度,我们使用MATTR(Moving Average Type-Token Ratio)的办法分析演说的用词丰富程度。这种办法通过滑动平均的方法测算一篇文章的词汇丰富度 例如:

如果有一篇7个短语(N=7)组成的文章:a,b,c,a,a,d,f。设定观察窗口为3个词(L=3) 首先找出文章中的词汇窗口,分别是a,b,c | b,c,a | c,a,a | a,a,d | a,d,f,一共5个 这篇文章的词汇丰富度 = (每个窗口中不重复的词汇之和) / L(N-L+1)

在这个例子中,这篇文章的用词丰富度就等于0.87

B. 测算演说主题的集中程度(是不是无轨电车乱开) 文章用Secondary thematic concentration (STC)这个指标来表达演说主题集中程度。 STC指标可以表现出演说者的演说有多关注于一个(或者多个)特定主题 譬如有些领导的风格是一说起话来就无轨电车乱开,这个指标就会很低…… 具体算法太复杂了,火箭君懒得看更懒得写了……

C. 测算描述性用词的多少 这个计算火箭君举个例子大家就明白了: 林肯的就职演说(1865年)中,一共使用了102个动词,36个形容词 行动力指标(Q)= 102/(102+36) = 0.74 代表这是一篇对行动力要求非常高的就职演说

历年总统的就职演说

嗯,所以,历年美国总统的就职演说的各项指标就这么可以列出来啦!!!! 奥黑成为了100年来最能开无轨电车的总统

最后彩蛋,历年总统就职演说KPI~可以打开收藏哦~