了解搜索 查看引擎过去如何分析链接并将其与搜索引擎当前如何分析链接进行比较很重要。但历史鲜为人知。
因此,对 Google 如何处理链接存在误解和曲解。某些 SEO 认为正确的一些概念已被证明已经过时。
阅读实际算法的作用以及它们何时被更好的算法取代将使您成为更好的搜索营销人员。它可以让您更好地了解什么是可能的,什么不是。
链接分析算法
大约在 2004 年,Google 开始采用链接分析算法来尝试发现不自然的链接模式。它在 2005 年的 PubCon 营销会议上宣布了 Meet the Engineers 活动。链接分析包括创建链接模式的统计图表,例如每页的入站链接数、主页与内部页面链接的比率、每页的出站链接,以及更多的。
当这些信息填充到图表中时,您可以看到绝大多数站点倾向于形成一个集群。有趣的是,链接垃圾邮件发送者倾向于聚集在大集群的外边缘。
到 2010 年,链接构建社区通常更善于避免许多链接垃圾邮件信号。于是在 2010 年,微软研究人员在 Statistical Link Analysis 中发表了这样的声明,承认统计分析不再有效:
“……垃圾网站的链接结构似乎越来越像正常甚至是好的网站,通过改革他们的网站
垃圾邮件技术。因此,从 Web 图中自动检测链接垃圾邮件是非常具有挑战性的。”
上面的论文叫做,让网络垃圾邮件发送者暴露自己。这是一个数据挖掘/机器学习练习它在七个 SEO 论坛中抓取 URL,丢弃导航 URL 和来自非活跃成员的 URL,并专注于来自活跃成员的 URL。
他们发现,他们能够发现无法检测到的链接垃圾邮件网络传统的统计链接分析方法。
这篇论文很重要,因为它提供的证据表明到 2010 年统计链接分析可能已经达到极限。
该文档引起关注的另一个原因是它表明搜索引擎正在开发超越统计链接分析的垃圾链接检测方法。
这意味着如果我们希望了解链接算法的最新技术水平,那么我们必须考虑到某些方法超出了统计链接分析的范围统计范围分析并给出适当的分析。
今天的算法可能超越统计分析
我相信企鹅算法不仅仅是统计分析。在之前的一篇文章中,我深入研究了一种分析链接的新方法,在我看来,这种方法很适合 Penguin 算法。
这是一种新的测量可信站点种子集距离的方法,一种链接距离排名算法。这些算法超出了统计链接分析的范围。
上面引用的 Microsoft 研究论文得出结论,14.4% 的链接垃圾邮件属于高质量网站,这些网站被人类质量评估员认为是高质量的。
虽然这个统计有些陈旧,但它仍然很重要,因为它表明大量高质量的网站可能由于链接操纵方法而被排出,或者更可能的是,这些操纵链接被忽略了。
Google 的 John Muller 表示相信绝大多数垃圾邮件链接都会被忽略。
Google 忽略链接
我们中的许多人已经凭直觉知道 Google 会忽略垃圾邮件链接和后企鹅算法,Google 透露 Live Penguin 正在以前所未有的规模捕获垃圾邮件链接。像 Gary Illyes 这样的 Google 员工曾表示,在他检查过的数百个负面 SEO 案例中,没有一个受到垃圾链接的影响。
实时企鹅
几年前,我发表了第一篇文章,将最新的链接排名算法与我们对企鹅的了解联系起来。如果您是算法极客,那么这篇文章适合您:谷歌的企鹅算法到底是什么? (研究)
Penguin Still Improving
Gary Illyes 宣布实时 Penguin 算法将会改进。它已经很好地捕获了垃圾邮件,并且在撰写本文时,新的和改进的 Penguin 可能已经处于活动状态。
Gary 没有说改进是什么,但假设可以识别垃圾链接的速度以及将数据合并到算法中可能是一个可能的领域,这可能是不现实的。
阅读:Google 的 Gary Illyes 关于 Live Penguins、负面 SEO 和退出
锚文本算法更改
Google 处理链接方式的最新进展是使用锚点文本。 Bill Slawski 指出,该专利已经更新,包括一种使用锚文本链接周围的文本来赋予链接意义的新方法。
阅读:添加到您的样式指南注释文本:锚文本的新方法
我接着阅读了一篇文章,探讨了该算法对改进链接构建的影响。
阅读:Google Patent Update Proposes Change to Anchor Text Signal
建议链接
一些研究论文提到了隐含链接。在 Ryan Rossi 发表的题为“Discovering Latent Graphs with Positive and Negative Links to Eliminate Spam in Adversarial Information Retrieval”的研究论文中可以看到一个明确的解释
研究人员发现发现垃圾网页可以通过创建他所谓的东西来改进潜在链接。基本上,他使用站点之间的链接模式来暗示具有公共链接的站点之间的链接关系。将这些虚拟链接添加到链接图(Internet 地图)中会使垃圾链接变得更加突出,从而更容易将它们与正常的非垃圾站点隔离开来。
虽然算法不是来自谷歌员工,但我在文章中描述的专利,谷歌的网站质量算法专利,是由谷歌发布的,它包含对隐含链接的引用。
BackRub
Google最初推出它的原始算法被昵称为Backrub。这篇研究论文被称为大型超文本网络搜索引擎的剖析。这是很久以前的一篇有趣的研究论文。
每个从事搜索营销的人都应该至少读一遍。任何关于链接算法的讨论都应该包括这一点,即使只是因为保证会有人抱怨它没有被涵盖。
所以对于那个吹毛求疵的人来说,这个链接是给你的。
带走
这不是对链接关联算法的全面回顾。这是对我们目前所处位置的精选评论。也许链接中最显着的变化是距离排序算法,我认为它可能与企鹅算法有关。
图片来自 Shutterstock,经作者编辑