5 月 4 日,Google 宣布他们将推出新的核心更新。到 5 月 7 日,尘埃似乎已经基本落定。这是MozCast的11天视图:

我们测量了 5 月 4 日至 6 日期间相对较高的波动性,5 月 5 日达到 112.6° 的峰值。请注意,5 月 4 日之前的 30 天平均值处于历史高位 (89.3°)。

兼容之前的核心更新比较如何?值得注意的是,最近的气温明显高于历史平均水平,2020 年 5 月的核心更新是我们迄今为止第二受欢迎的核心更新,仅次于 2018 年 8 月的“Medic”更新。

谁“赢得”了五月核心更新?

在重大更新后报告赢家和输家是很常见的(通常由我自己完成),但一段时间以来我一直担心这些分析只会占用少量时间。每当我们比较两个固定时间点时,我们都会忽略搜索排名的自然波动和关键字之间的内在差异。

这一次,我要好好研究一下陷阱。我将专注于获胜者。下表显示了 1 天(5 月 5 日)获胜者在 MozCast 跟踪集中的 10,000 个关键字中的总体排名。 5月4日,我只列出了排名至少为25的子域:

抛开常见的统计问题(某些关键字的样本量小、数据集的独特优势和劣势等),这个分析有什么问题?当然,有多种报告“% gain”的方法(例如,绝对变化与相对百分比),但我诚实地报告了绝对数字,相对变化是准确的。

问题是我们急于计算一天后的数据,忽略了大多数核心更新都是多天的现实(从我们原来的图表来看,5月核心更新的趋势似乎还是续)。我们也没有考虑排名历史上可能不稳定的域(稍后会详细介绍)。如果我们比较 1 天和 2 天的数据呢?

我们在讲哪个故事?

下表添加了2天内获得的相对百分比。我保留了相同的 25 个子域,为了保持一致性,我将继续按照我得到的 1 天百分比对它们进行排序:

即使只是比较发布的前两天,我们也可以看出故事发生了很大的变化。问题是:我们要讲哪个故事?通常,我们甚至不查看列表,而是查看基于我们自己的客户或精选数据的轶事。考虑这个故事:

如果这个是我们对数据的唯一看法,我们可能会得出结论,在两天内,更新加强了,第二天有更多有价值的网站。我们甚至可以开始撰写有关应用程序需求如何增长或某些新闻网站如何获得回报的故事。这些故事可能有些道理,但事实是我们仍然无法仅从数据中获知任何信息。

现在,让我们选择三个不同的数据点(全部来自前 20 个):

从这个有限的角度来看,我们可以得出结论,谷歌认为核心更新有问题,并在第二天撤消了。我们甚至可以得出结论,某些新闻网站受到处罚是有原因的。这讲述了一个与第一组轶事截然不同的故事。

2020 年 5 月的数据掩盖了一个更奇怪的故事。考虑一下:

LinkedIn 是在第一天表现出轻微的提升(我们通常忽略这一点),然后在第二天失去 100% 的排名。哇,五月核心更新真的让我印象深刻!事实证明,LinkedIn 可能不小心取消了他们网站的索引——他们在第二天恢复了它,而且这个巨大的变化似乎与核心更新无关。一个简单的事实是,这些数字很少告诉我们网站排名提高或下降的原因。

我们如何定义“正常”?

让我们仔细看看 MarketWatch 的数据。 Marketwatch 的 1 天数据上涨了 19%,但 2 天数据下跌了 2%。这里的问题是,我们无法根据这些数字了解 MarketWatch 的正常 SERP 流量是什么样的。这是5月4日(核心更新开始)前后7天的走势图:

仅查看少量历史数据,就可以看出 MarketWatch 与大多数新闻网站一样,经历了极大的波动。 5 月 5 日的“盈利”只是由于 5 月 4 日的亏损。事实证明,5 月 4 日之后的 7 天平均值 (45.7) 仅比 5 月 4 日之前的 7 天平均值 (44.3) 略有增加,给出MarketWatch 的相对收益为 +3.2%。

现在,让我们来看看 Google Play,两天后它是明显的赢家:

您甚至不需要计算就能发现这里的差异。将 5 月 4 日之前的 7 天平均值 (232.9) 与 5 月 4 日之后的 7 天平均值 (448.7) 进行比较,Google Play 在 5 月核心更新后经历了 93% 的显着相对变化。

对比前后7天LinkedIn事件如何处理?这是为两种方式添加虚线的前后图表:

虽然这种方法确实补偿了单日异常,但我们仍然显示 -16% 的前后变化,这是不正确的。您可以看到自 5 月核心更新发布以来的 7 天中有 6 天高于 7 天平均值。请注意,LinkedIn 在其短期历史中的波动性也相对较低。

为什么我会选择我的新指标不够用的极端例子?我希望很清楚,没有任何一个指标可以说明全部情况。即使我们考虑了差异并进行了统计测试,我们仍然遗漏了很多信息。前后的明显差异并不能告诉我们实际发生了什么,只是核心更新的时间发生了变化。这是有用的信息,但在我们得出详尽的结论之前,还需要进一步调查。

总的来说,这种方式肯定比单日切片要好。使用前 7 天和后 7 天的平均比较计算历史数据和更新后的完整 7 天。如果我们将 7 天时间段的比较扩展到更大的数据集会怎样?这是我们带有新数字的原始“获奖者”名单:

显然,在一张表中需要消化的内容很多,但在某些情况下,我们可以开始查看前后指标(7 天均值之间的相对差异)以不同方式显示的位置需要 1 天或 2 天-天视图。让我们继续根据百分比变化前后重建前 20 名:

一些大玩家是一样的,但我们也有一些新人 - 包括似乎在第一天就失去人气,但在第 2 天和第 7 天积累收益的网站。

让我们快速浏览一下我们最初的大赢家(winnerer?winetest?)Parents.com。第一天成交量增长100%(能见度翻倍),但第二天成交量相对较少,前后涨幅几乎是第一天涨幅的一半。这是前后7天:

这里很容易看出单日跳升是短期异常,部分原因是 5 月 4 日的下跌。对比7日均线似乎更接近真相。这不仅是对像我这样的算法追踪者的警告,也是对可能看到 +100% 并急于告诉他们的老板或客户的 SEO 的警告。不要让好消息变成你无法兑现的承诺。

为什么我们要继续这样做?

如果我觉得我是在指责这个行业,请注意我在这里直言不讳。尽早发布分析的压力很大,不仅仅是因为它等同于流量和链接(坦率地说,确实如此),还因为网站所有者和 SEO 确实需要答案。正如我最近所写,我认为过度解释短期损失并解决错误的事情。然而,我认为夸大短期收益并期望这些收益是永久性的也存在真正的危险。这可能导致同样危险的决定。

都是废话吗?不,我不这么认为,但我认为暴风雨过后很容易离开人行道进入泥土,至少我们需要等待地面变干。在 Twitter 和 24 小时新闻周期的世界里,这不是一件容易的事,但获得多天的视图是至关重要的,特别是因为如此多的大型算法更新在很长一段时间内推出。

我们应该相信什么数字?从某种意义上说,所有这些,或者至少是我们可以充分验证的所有这些。没有单一的指标可以描绘出完整的画面,在急于在获奖者名单上庆祝自己之前,重要的是采取下一步行动并真正了解历史趋势和任何胜利的背景。

谁想要一些免费数据?

考虑到分析的范围,我没有在这篇文章中涵盖 2020 年 5 月核心更新失败者,也没有突破前 20 名,但您可以在此处下载原始数据。如果要编辑它,请先复制一份。赢家和输家位于不同的选项卡上,它涵盖了 5 月 4 日在我们的 MozCast 10K 数据集中排名至少为 25 的所有域(仅 400 多个域)。