2001年,一个名为 Internet Archive 的非营利组织发布了一个名为 Wayback Machine 的新工具,网址为:archive.org。
互联网档案馆的使命是创建互联网历史的数字图书馆,就像报纸的纸质副本被永久保存一样。
由于网页不断变化,Wayback Machine 爬虫会频繁访问并缓存存档页面。
他们的目标是让这些内容可供后代的研究人员、历史学家和学者使用。但这些数据对营销人员和 SEO 专业人员同样有价值。
每当我从事的项目涉及到我的核心网站或竞争对手的流量发生剧烈变化时,我首先查看缓存页面的地方之一就是流量变化前后。
即使您不对网站进行取证分析,只要能够访问网站的变更日志也是一个有价值的工具。
您可以找到旧内容,甚至可以回忆起去年进行的促销活动。
使用 Wayback Machine 进行故障排除
就像查看实时网站一样,缓存页面将提供所有可用于解释流量变化的可用信息。
整个网站(包括所有 HTML)都包含在缓存中,这使得识别明显的结构或技术更改变得相当简单。
比较我的网站或竞争对手的前后图像之间的差异时,我会寻找以下问题:
- Page meta.
- 内部链接。
- 图像使用。
- 甚至可能已添加或删除的页面的任何动态部分。
以下是使用 Wayback Machine 进行故障排除的步骤。
1.将您的 URL 放入 Archive.org 的搜索框
这不一定是主页。它可以是网站上的任何 URL。
2 .选择您认为代码可能已更改的日期
注意日期的颜色编码:
- 红色表示错误。
- 绿色表示发生了重定向。
- 蓝色表示页面缓存良好。
你您可能需要继续选择日期,然后深入研究每个版本,直到找到值得进一步研究的有趣内容。
对于较大的站点,您会发现主页每天缓存多次,而其他站点一年只缓存几次
3.来自 archive.org 的缓存页面看起来像将它加载到您的浏览器中,就像任何网站一样,除了它的标题是 Archive.org
寻找结构和内容的明显变化,这些变化可能导致搜索可见性。
4.打开页面源码,搜索:
- Title
- Description
- Robot
- Dress
- JavaScript
5.比较与当前站点不同的任何内容并分析因果关系或相关性
没有详细信息太小,无法调查。查看交叉链接、页面上使用的词等内容,甚至查看网站可能在特定时间段内遭到黑客攻击的证据。
您甚至应该查看任何号召性用语中的特定语言,因为此处的更改可能会影响转化,即使现在的流量高于 Wayback Machine 的缓存时间。
机器人文件故障排除
Wayback Machine 甚至可以保留快照 robots.txt 文件,因此如果抓取权限发生变化,证据很容易获得。
当网站似乎神秘地退出索引而没有明显的惩罚、垃圾邮件攻击或当前可见的 robots.txt 文件出现问题时,此功能对我来说非常有用。
要查找机器人文件历史记录,只需将机器人网址输入搜索框即可
之后选择一个日期并对当前机器人文件进行差异分析。网上有很多免费工具可以比较两组不同的文本。
反向链接研究
Wayback Machine 的另一个不太明显的用例是确定竞争对手过去如何建立反向链接。
使用像 Ahrefs 这样的工具,我查看网站的“丢失”链接并将它们放入 Wayback Machine 以查看它们如何链接到目标网站。
自然链接不应该真正“丢失”,这是查看链接可能消失原因的好方法。
灰帽使用
除了这些使用 Wayback Machine 解决 SEO 问题的非常有用的方法之外,还有一些更隐蔽的方法来使用这些数据。
对于那些正在为反向链接构建私人博客网络 (PBN) 的人来说,存档网站是从最近购买的过期域名中恢复内容的好方法。
然后,恢复的站点将填充指向网络中其他站点的链接。
附属机构
另一种方式,同样从阴暗面来看,人们使用这些恢复的内容是将其变成该类别的会员网站。
例如,如果有人为银行购买过期域名,他们会恢复内容,然后在整个网站放置 CTA 以填写抵押表格。
客户可能认为他们正在与银行取得联系。然而,实际上,他们的联系信息正在被拍卖给各种抵押贷款经纪人。
不要以黑暗的音符结束,有一种使用 Wayback Machine 的终极惊人方式,这就是本网站的创建者的意图。
这是网络上所有内容的存档,如果有人通过网站在过去二十年的发展来研究亚马逊的大气增长,他们会在这里找到亚马逊图片上的第一个和随后的每个主页.
除Shady 用例,Wayback Machine 是您数字营销工具库中最好的免费工具之一。世界上几乎所有网站都拥有 18 年的历史,简直没有任何其他工具能够与之媲美。
图片来源
所有截图均为作者2019年5月截取