站点分页是一个巧妙的变形器。它的使用范围很广,从在类别页面上显示项目,到文章存档,画廊幻灯片和论坛主题。
对于SEO专业人员而言,这不是您是否必须处理分页问题,而是时间问题。
在某个增长点,网站需要将内容划分为一系列组成页面,以用于 用户体验 (UX)。
我们的工作是帮助搜索引擎抓取并了解这些URL之间的关系,以便它们索引最相关的页面。
随着时间的流逝,分页处理的SEO最佳实践不断发展。在此过程中,许多神话都将自己描述为事实。但是不再。
本文将:
- 揭穿分页如何伤害SEO的神话。
- 介绍管理分页的最佳方法。
- 复查错误理解或低于标准的分页处理方法。
- 研究如何跟踪分页的KPI影响。
分页如何伤害SEO
您可能已经读过,分页对SEO不利。
但是,在大多数情况下,这是由于缺乏正确的分页处理而不是分页本身的存在。
让我们看一下分页的所谓弊端,以及如何克服它可能引起的SEO问题。
分页导致重复的内容
如果分页未正确实现,则更正,例如“查看全部”页面和分页页面均没有正确的rel = canonical,或者除根页面之外还创建了page = 1。
当您进行SEO友好分页时不正确。即使您的H1和meta标签相同,实际的页面内容也会有所不同。所以这不是重复。
是的,很好。如果您不小心在完全分开的页面上使用重复的标题和说明,则可以获取反馈,这很有用,但是对于分页编排来说,这是正常现象,应该使用相同的标题。
-?约翰(@JohnMu) 2018年3月13日
分页创建稀薄的内容
如果您已将文章或图片库拆分为多个页面(以通过增加浏览量来增加广告收入),而在每个页面上保留的内容太少,则更正此问题。
当您将用户的愿望轻松消费到横幅广告收入或人为夸大的页面浏览量之上时,这是不正确的。放一个 UX友好的内容量 在每一页上。
分页稀释了排名信号
正确。分页会导致内部链接公平性和其他排名信号(例如反向链接和社交份额)在页面之间分散。
但是只有在单页面内容方法会导致不良用户体验(例如,电子商务类别页面)的情况下,才可以通过使用分页来将其最小化。并且在此类页面上,添加尽可能多的项目,而不会将页面速度降低到明显的水平,以减少分页页面的数量。
分页使用抓取预算
如果您允许Google抓取分页页面,则更正。在某些情况下,您想使用该预算。
例如,对于Googlebot而言,它通过分页URL来访问更深的内容页面。
设置时通常不正确 Google Search Console 如果您希望保留更重要页面的抓取预算,则将分页参数处理设置为“请勿抓取”或将robots.txt设置为禁止。
根据SEO最佳做法管理分页
使用爬网锚链接
为了使搜索引擎有效地检索分页页面,该网站必须具有指向这些分页URL的带有href属性的锚链接。
确保您的网站使用 用于内部链接到分页页面。不要通过JavaScript加载分页的锚链接或href属性。
另外,您应该使用rel =“ next”和rel =“ prev”属性在分页系列中指示组件URL之间的关系。
是的,即使在Google臭名昭著的Tweet之后,他们也不再使用这些链接属性。
春季大扫除!
在评估索引信号时,我们决定停用rel = prev / next。
研究表明,用户喜欢单页内容,在可能的情况下尽量做到这一点,但对于Google搜索来说,多部分内容也可以。了解并做最适合您的*用户! #春天来了 pic.twitter.com/hCODPoKgKp-Google网站管理员(@googlewmc) 2019年3月21日
此后不久,Ilya Grigorik澄清说,rel =“ next” /“ prev”仍然很有价值。
不,使用分页。让我重新构造一下。Googlebot足够聪明,可以通过查看页面上的链接来找到您的下一页,我们不需要明确的“上一个,下一个”信号。是的,还有其他一些重要原因(例如a11y)说明为什么您仍需要或仍然需要添加这些原因。
-伊利亚·格里戈里克(@igrigorik) 三月22,2019
Google不是城里唯一的搜索引擎。这是Bing对这个问题的看法。
我们使用rel prev / next(与大多数标记一样)作为页面发现和网站结构理解的提示。目前,我们还没有基于这些页面将页面合并在一起,也没有在排名模型中使用上一页/下一页。 https://t.co/ZwbSZkn3Jf
—FrédéricDubut(@CoperniX) 2019年3月21日
使用自引用rel =“ canonical”链接对rel =“ next” /“ prev”进行补充。因此,/ category?page = 4应该相对于/ category?page = 4是“规范”的。
这是适当的,因为分页更改了页面内容,该页面的主副本也是如此。
如果网址中有其他参数,请将其包含在rel =“ prev” /“ next”链接中,但不要将其包含在rel =“ canonical”中。
例如:
这样做将指示页面之间的明确关系,并防止潜在的重复内容。
要避免的常见错误:
- 将链接属性放在 内容。仅搜索引擎中的搜索引擎支持它们 HTML部分。
- 将rel =“ prev”链接添加到系列中的第一页(也称为根页),或者将rel =“ next”链接添加到末尾。对于链中的所有其他页面,两个链接属性都应存在。
- 当心您的根页面规范URL。可能在?page = 2上,rel = prev应该链接到规范页面,而不是?page = 1。
的
一个四页系列的代码如下所示:- 根页面上的一个分页标记,指向系列的下一页。
- 第2页上的两个分页标签
- 第3页上的两个分页标签
- 第4页上的一个分页标签,分页系列的最后一页。
修改分页页面页面元素
约翰·穆勒 已评论,“我们对分页没有不同的对待。我们将它们视为普通页面。”
意味着分页页面无法像之前所建议的那样被Google识别为合并为一个内容的一系列页面。每个分页页面都有资格与根页面竞争排名。
为了鼓励Google在SERP中返回根页面并防止Google Search Console中出现“重复的元描述”或“标题标签重复”警告,请对您的代码进行简单的修改。
如果根页面具有以下公式:
连续的分页页面可以具有以下公式:
这些分页的URL页面标题和元描述故意不理想,以阻止Google显示这些结果,而不是根页面。
即使进行了这样的修改,分页页面仍在SERP中排名,请尝试其他传统的页面SEO策略,例如:
- 取消优化分页的H1标签。
- 将有用的页面文字添加到根页面,但不要添加分页页面。
- 将具有优化文件名和alt标记的类别图像添加到根页面(而不是分页页面)。
不要在XML Sitemap中包含分页页面
分页网址从技术上来说是可索引的,但花在抓取预算上并不是SEO优先事项。
因此,它们不属于您的XML网站地图。
在Google Search Console中处理分页参数
如果可以选择,请通过参数而不是静态URL运行分页。例如:
example.com/category?page=2超过example.com/category/page-2
尽管出于排名或爬网的目的而使用另一种方法没有优势, 研究 已显示Googlebot似乎猜测基于动态URL的URL模式。因此,增加了迅速发现的可能性。
不利的一面是,如果网站呈现的空白页不属于当前分页系列的内容,则可能导致爬网陷阱。
例如,假设一个系列包含四个页面。
包含内容的URL停在www.example.com/category?page=4
如果Google猜测www.example.com/category?page=7并加载了实时但空的页面,则该漫游器会浪费抓取预算,并有可能迷失在无数个页面中。
确保为不属于当前系列的任何分页页面发送了404 HTTP状态代码。
参数方法的另一个优势是能够根据您希望使用的方式将Google Search Console中的参数配置为“分页”,并随时更改向Google发出信号以抓取“每个URL”或“没有URL”的信号搜寻预算。无需开发人员!
切勿将分页的页面内容映射到片段标识符(#),因为它不可抓取或无法建立索引,因此对搜索引擎不友好。
针对分页内容的误解,过时或错误的SEO解决方案
没做什么
Google相信Googlebot足够聪明,可以通过链接查找下一页,因此不需要任何明确的信号。
向SEO传达的信息本质上是无所事事处理分页。
尽管此声明具有真理的核心,但您无所事事就是在与SEO赌博。
许多网站都看到Google选择了一个分页页面来对搜索查询的根页面进行排名。
向爬虫提供清晰的指导始终是有价值的,您希望它们如何索引和显示内容。
规范化到查看所有页面
“查看全部”页面的构想是在单个URL上包含所有组件页面的内容。
所有分页页面的“查看全部”页面具有rel =“ canonical”,以合并排名信号。
这里的论点是,搜索者倾向于在单个页面上查看整篇文章或类别项目列表,只要它加载速度快且易于导航即可。
这个概念是,如果您的分页系列有一个替代的“查看全部”版本,可以提供更好的用户体验,那么搜索引擎将倾向于将此页面包含在搜索结果中,而不是分页链的相关细分页面。
这就提出了一个问题–您为什么首先要对页面进行分页?
让我们简单点。
如果您可以在提供良好用户体验的同时在单个URL上提供内容,则无需分页或“查看全部”版本。
举例来说,如果您无法提供包含数千种产品的类别页面,那将是非常荒谬的事情,并且加载时间太长,因此无法进行分页。查看全部不是最佳选择,因为它不能提供良好的用户体验。
同时使用rel =” next” /“ prev”和“查看全部”版本并没有明确授权搜索引擎,这将导致爬虫混乱。
不要做
规范化到首页
一个常见的错误是将所有分页结果中的rel =“ canonical”指向系列的根页。
一些消息不灵通的SEO人士建议,这是一种将权限跨页面集合并到根页面的方法,但这是错误的。
如果对根页面的规范化不正确,则可能会导致误导搜索引擎,使其认为您只有一页结果。
然后,Googlebot不会索引沿链条出现的页面,也不会确认从这些页面链接的内容的信号。
您不希望您的详细内容页面由于分页处理不佳而退出索引。
分页系列中的每个页面都应具有自引用规范,除非您使用“查看全部”页面。
错误地使用rel = canonical,Googlebot可能会忽略您的信号。
Noindex分页页面
解决分页问题的经典方法是使用机器人的noindex标记,以防止被搜索引擎索引分页的内容。
仅依靠noindex标签进行分页处理将导致忽略组件页面的任何排名信号。
但是,此方法的更大问题是,页面上的长期noindex最终会 带领Google nofollow链接 在该页面上。
这可能会导致从分页页面链接的内容从索引中删除。
分页和无限滚动或加载更多
一种新的分页处理形式是:
-
无限滚动,当用户向下滚动时,内容将被预提取并直接添加到用户的当前页面。
-
加载更多,单击“查看更多”按钮即可呈现内容。
这些方法受到用户的赞赏,但是Googlebot?没那么多。
Googlebot不会模仿滚动到页面底部或单击以加载更多内容的行为。意味着没有帮助,搜索引擎将无法有效地抓取您的所有内容。
为了便于SEO,您可以基于具有href属性的可抓取锚链接将无限滚动或将更多页面加载到同等的分页系列中,即使禁用了JavaScript也可以访问。
当用户滚动或单击时,使用JavaScript将地址栏中的URL改编为组件分页页面。
此外,为类似于单击或主动翻页的任何用户操作实现pushState。您可以在 由John Mueller创建的演示。
本质上,您仍在实施上述推荐的SEO最佳做法,只是在顶部添加了其他用户体验功能。
不鼓励或阻止分页爬网
一些SEO专家建议通过简单地阻止Google抓取分页网址来完全避免分页处理问题。
在这种情况下,您可能希望拥有 优化的XML网站地图 确保通过分页链接的页面有机会被索引。
有三种方法可以阻止搜寻器:
-
混乱的方式:将nofollow添加到所有指向分页的链接。
-
较干净的方法:禁止使用robots.txt。
-
无需开发人员的方式:将分页参数设置为“分页”,让Google在Google Search Console中抓取“无URL”。
通过使用这些方法之一来阻止搜索引擎搜寻分页的URL,您可以:
- 停止搜索引擎识别分页页面的排名信号。
- 防止将内部链接资产从分页页面向下传递到目标内容页面。
- 阻碍Google发现目标内容页面的能力。
明显的好处是可以节省搜寻预算。
这里没有明确的对与错。您需要确定网站的优先级。
就个人而言,如果我要对抓取预算进行优先级排序,则可以通过在Google Search Console中使用分页处理来实现,因为它具有改变主意的最佳灵活性。
跟踪KPI分页的影响
因此,现在您知道该怎么办,如何跟踪优化分页处理的效果?
首先,收集基准数据以了解您当前的分页处理如何影响SEO。
KPI的来源可以包括:
-
分页爬网次数的服务器日志文件。
-
网站:搜索运算符(例如site:example.com inurl:page)以了解Google已索引多少个分页页面。
-
Google Search Console搜索分析报告按包含分页的页面过滤,以了解展示次数。
-
Google Analytics(分析)目标网页报告按分页网址进行了过滤,以了解网站的行为。
如果您发现让搜索引擎抓取您的网站分页以到达您的内容的问题,则可能需要 更改分页链接。
启动最佳实践分页处理后,请重新访问这些数据源以衡量工作是否成功。
图片积分
特色图片:Paulo Bobita
后期图片/屏幕截图:作者创建/拍摄的