追随2018年选举新闻的每个人都看到这个由三部分组成的新闻周期: “众议院民意调查显示,共和党人正在飙升!” “等等,现在民主党正在进行一些好的民意调查!” “一切都恢复正常 - 我想这都是噪音!” 而现在,看起来我们可能处于另一轮的后端。共和党人在上周获得了一些良好的通用选票民意调查(这些调查基本上都是调查问题,询问选民是否会在即将举行的众议院选举中投票给民主党或共和党人),但像CNN和昆尼皮亚克这样的民意调查者刚刚发布了一些民意调查。对民主党人来说效果很好。像RealClearPolitics和FiveThirtyEight这样的主要平均水平表明民主党人已经回到了大约七八点的领先地位 - 关于特朗普时代的大部分时间。 那么为什么我们要继续经历这种奇怪的可预测的媒体周期呢? 有明显的人为原因。如果通用选票确实向右移动,那么首先发现这种趋势并找到合理解释方式的分析师将获得读者并赢得同行的赞扬。这不是一件坏事 - 我们都试图弄清楚政治在特朗佩拉的运作方式,对新数据进行检查和理论化是这一过程的关键部分。在新的民意调查中,还有一个(在我看来是坏的)市场激励,可以编写简短的,无背景的,clickbait故事(Plummet!Surge!)。 但这些新闻周期并非都是市场力量和人性。有同样的新闻周期不断发生的真正的数学,甚至是哲学的原因。我们可以通过做一些基本的(不完整的)数学来处理这个问题(请注意,上次有短暂的GOP激增时,我以一种不同的方式讨论了这些问题)。 第一步是查看原始数据。 此散点图显示我们的朋友在周四早上在FiveThirtyEight收集的所有通用选票(不包括追踪民意调查)。每个点都是民意调查。该图将就职日固定为第零天,并按时间顺序从左向右移动。垂直位置显示民主党边缘民意调查显示,民主党领先的人数更高,而共和党领导的民意调查则低于零线。 你可以在这些原始数据中找出一些趋势,但它有点像罗夏测试(那些墨水印迹总是看起来像你父母的战斗)。十个不同的人可以查看这些数据,每个人都画出不同的一行。 这就是为什么统计学家试图发明数学方案,让你通过数据客观地画出“好”的线条。 在数据中绘制直线的最简单(也是最糟糕的)方法是在整个时间跨萬博体育网站,萬博体育网站下载,萬博体育网站官方下载度内采用简单的平均值。 这条线让我们了解特朗普时代的正常民意调查结果(大约七点民主党的优势)。但它根本不会对随时间的变化做出反应。 另一种(仍然不是很好但是说明性的)方法是采用简单的五天平均值。 这里有一个权衡。与第一张图片不同,这条趋势线移动并捕捉到公众舆论的一些真正变化。但所有民意调查都附加了一些随机误差,第二个趋势线追逐噪音,有时会失去数据所说的内容。 这种权衡推动了我们今年看到的一些“离群调查 - >疯狂的新闻报道 - >恢复正常”的新闻周期。有些人更愿意以诡异的方式思考公众舆论,接受过度反应新数据的风险,以便尽早发现趋势。在这种权衡中,我认为没有必要的正确答案。在某种程度上,这是一个价值问题。如果你不把它们拉得太远,这两种观点都有效。 但是有些答案比其他答案要好,我们可以用数学来得到一些更好的答案。 这是一个GAM(一种通用的附加模型,跟踪轮询下加权统计详细信息)。基本上它使用复杂的数学来试图充分利用两个世界:平衡摆动与一致性并获得数据实际所说的内容。 GAM描绘了舆论正在发生的事情。到目前为止,它没有看到共和党的激增(现在或今年夏天更早)。 随着特朗普的(短暂)蜜月期结束,通用选票大幅下降,并在2017年的大部分时间内落到6到8点(横向黑线)。在2017年年中中期,共和党失势,但他们重新获得了2018年和民主党人基本上全部在2018年举行了六到八次领先。这些趋势是有道理的 - 国会共和党人在2017年经历了一个粗暴的秋冬季节(推动一个不受欢迎的奥巴马医改人员收费造成了损失,税收改革法案变得更加它在12月通过后很受欢迎,但从那时起,特朗普的批准已经向上移动了一些,他们已经脱离了新闻。这让趋势线更接近民主党人的七分优势。 GAM趋势线表明,尽管我们在过去18个月中看到了政治事件的疯狂过山车,但公众舆论相对稳定。 这条趋势线并不完美。有人可以创造一个完全合理的趋势线,比这个更抽搐或更稳定。此外,我的GAM没有考虑其他趋势线可能的因素(过去的民意测验精确度,样本大小,哪些民意调查来自同一个民意调查员等)。 但趋势线并不一定是完美的。这是一个合理的数据读取,它表明,再一次,在顶线的众议院数字没有发生变化。