Jono Alderson
Jono 是一位数字策略师、营销技术专家和全栈开发人员。他致力于技术搜索引擎优化、新兴技术和品牌战略。
如果你在网页 使用元机器人标签,您可以向搜索引擎提供有关如何让它们抓取或索引您网站部分内容的说明。此页面概述了可以包含在元机器人标签中的所有不同值、它们的作用以及哪些搜索引擎支持每个值。
不同的机器人元标签值
以下值(“参数”)可以单独或一起放在标签的内容属性中(以逗号分隔)来控制搜索方式引擎与页面交互。
向下滚动以查看哪些搜索引擎支持哪些特定参数的概览。
index 允许搜索引擎将页面添加到他们的索引中,以便搜索的人可以发现它。注意:如果没有与索引相关的指令,这将用作默认值。 noindex 阻止搜索引擎将此页面添加到它们的索引中,从而不允许它们在结果中显示它。注意:Google 的非官方消息来源表明,如果某个页面长期设置为 noindex,则可能会被视为也设置为 nofollow。确切的机制尚不清楚,也不清楚其他搜索引擎是否有类似行为。 follow 告诉搜索引擎它可能会跟随页面上的链接来发现其他页面。注意:如果没有与下面链接关联的指令,它将被用作默认值。 nofollow 告诉搜索引擎机器人“批准”(通过公平)页面上的所有链接。注意:不清楚(搜索引擎之间也不一致)此属性是阻止搜索引擎跟踪链接,还是只是阻止它们为这些链接分配任何值。 none noindex、nofollow 的快捷方式。所有人都遵循索引的快捷方式。注意:默认情况下,所有页面都采用此方法,如果指定,则不执行任何操作。 noimageindex 禁止搜索引擎索引页面上的图像。注意:如果图像直接链接到其他地方,搜索引擎仍然可以索引图像,因此使用 X-Robots-Tag HTTP 标头通常是更好的主意。 noarchive 阻止搜索引擎在其搜索结果列表中显示此页面的缓存副本。 nocache 与 noarchive 相同,但仅供 MSN/Live 使用。 nosnippet 阻止搜索引擎在搜索结果中显示文本或视频片段(即元描述),并阻止他们在搜索结果列表中显示该页面的缓存副本。注意:片段可能仍会显示图像缩略图,除非也未使用 noimageindex。 nositelinkssearchbox 阻止搜索引擎显示您网站的内联搜索框。 nopagereadaloud 阻止搜索引擎通过语音服务/结果大声朗读页面内容。 notranslate 阻止搜索引擎在其搜索结果中显示页面的翻译。 max fragments: [number]
设置元描述的最大字符数。注意:省略此标记可能会导致隐含值为 0。默认值 -1 应设置为隐含“无限制”。最大视频预览:[number]
设置预览中视频的最大秒数。注意:省略此标记可能会导致隐含值为 0。默认值 -1 应设置为隐含“无限制”。最大图像预览:[设置]
设置预览的最大图像尺寸(无、标准或大)。注意:省略此标记可能会导致隐含值 none。评级表明该页面包含成人内容。 unavailable_after 告诉搜索引擎一个日期/时间,在此之后它们不应出现在搜索结果中; noindex 的“定时”版本。注意:必须采用 RFC850 格式(例如,星期一,2005 年 8 月 15 日 15:52:01 UTC)。 noyaca 阻止搜索结果摘录使用 Yandex 目录中的页面描述。注意:仅 Yandex 支持。 noydir 阻止 Yahoo 使用 Yahoo 目录中此页面的描述作为搜索结果中该页面的摘要。注意:由于 Yahoo 关闭了他们的目录,此标签已被弃用,但您可能偶尔会遇到它。哪个搜索引擎支持哪些机器人元标记值?
下表显示了哪些搜索引擎支持哪些值。请注意,某些搜索引擎提供的文档很少,因此有很多未知数。
机器人值 | 谷歌 | 雅虎 | ing | 问 | 百度 | Yandex | |
---|---|---|---|---|---|---|---|
索引控制 | |||||||
索引 | Y* | Y* | Y* | ? | ÿ | ÿ | |
无索引 | ÿ | ÿ | ÿ | ? | ÿ | ÿ | |
没有图片索引 | ÿ | ñ | ñ | ? | N | N | |
是否应该跟随链接 | |||||||
关注 | Y * | Y * | Y * | ? | ÿ | ÿ | |
Nofollow | ÿ | ÿ | ÿ | ? | ÿ | ÿ | |
no | ÿ | ? | ? | ? | ñ | ÿ | |
all | ÿ | ? | ? | ? | n | ÿ | |
片段/预览控件 | |||||||
归档 | ÿ | ÿ | ÿ | ? | ÿ | ÿ | |
无缓存 | ñ | ñ | ÿ | ? | ñ | ñ | |
片段 | ÿ | ñ | ÿ | ? | ñ | ñ | |
nositelinkssearchbox | ÿ | ñ | ñ | ñ | ñ | ñ | |
nopagereadaloud | ÿ | N | N | N | N | ñ | |
不翻译 | ÿ | ñ | ñ | ? | N | N | |
最大分片:[number] | ÿ | ÿ | ñ | ñ td> | ñ | ñ | |
最大视频预览:[数量] | ÿ | ñ | ñ | ñ | ñ | ||
最大图像预览:[设置] | ÿ | ÿ | ñ | ñ | ñ | ñ | |
各种 | |||||||
得分 | ÿ | ñ | ñ | N | N | N | |
unavailable_after | ÿ | ñ | ñ | ? | N | N | |
Noodp | ñ | Y ** | Y ** | ? | N | N | |
Nodier | ñ | Y ** | ñ | ? | N | N | |
诺亚卡 | N | N | N | N | ñ | ÿ |
*大多数搜索引擎没有这方面的具体文档,但我们假设支持排除参数(例如 nofollow)意味着支持正等值(例如 Follow)。
** 虽然 noodp 和 noydir 属性可能仍然“受支持”,但那些目录不再存在,这些值可能不起作用。
特定搜索引擎的规则
有时,您可能希望向特定搜索引擎提供特定说明,而不是其他搜索引擎。或者,您可能希望为不同的搜索引擎提供完全不同的说明。
在这些情况下,您可以将内容属性的值更改为特定的搜索引擎(例如 googlebot)。
注意:由于搜索引擎会简单地忽略它们不支持或不理解的指令,因此很少需要使用多个元机器人标签来为特定的爬虫设置指令。
冲突的参数和 robots.txt 文件
请务必记住,元机器人标记的工作方式与您的 robots.txt 文件中描述的不同,规则冲突可能会导致意外行为。例如,如果页面通过 robots.txt 被阻止,搜索引擎将无法看到您的元标记。
还应注意避免在meta robots标签中设置冲突的值(例如同时使用index和noindex参数),尤其是在为不同的搜索引擎设置不同的规则时。在发生冲突的情况下,通常会选择最严格的解释(即“不显示”通常胜过“显示”)。
如果您使用的是 WordPress,向您的帖子或页面添加 noindex 或 nofollow 是轻而易举的事。了解如何使用 Yoast SEO 从搜索结果中排除帖子。
搜索引擎资源
来源