解决方案:为重复的内容添加独特的元素

Your go-to forum for bot dataset expertise.
Post Reply
Joywtome231
Posts: 626
Joined: Sun Dec 22, 2024 3:59 am

解决方案:为重复的内容添加独特的元素

Post by Joywtome231 »

这是一个高度优先的问题,尤其是在许多电子商务网站上。关键页面(例如产品说明页面)通常包含与网络上许多其他结果相同或相似的产品说明。如果 Google 认为这些页面与内部或外部的其他页面过于相似,它可能会将它们从索引中完全排除。

如果您认为这种情况适用于您的网站,请按照以下方法进行测试:

截取可能重复的文本片段并将其粘贴到 Google 中。
在 SERP URL 中,将以下字符串附加到末尾:“&num=100”。这将显示前 100 个结果。
使用浏览器的“查找”功能查看您的结果是否出现在前 100 个结果中。如果没有,您的结果可能会被过滤出索引。
返回 SERP URL 并将以下字符串附加到末尾:“&filter=0”。这应该会显示 Google 未过滤的结果(感谢Patrick Stox 提供的提示)。
使用“查找”功能搜索您的 URL。如果您看到您 阿尔及利亚 手机号码数据 的页面现在出现,这是一个很好的迹象,表明您的内容已被过滤出索引。
对“已抓取 - 当前未编入索引”报告中看到的几个可能具有重复或非常相似内容的 URL 重复此过程。
过滤 Google 搜索结果中的重复内容
如果您不断发现您的 URL 被从索引中过滤掉,您需要采取措施使您的内容更加独特。

虽然没有一个通用的标准来实现这一目标,但这里有一些选择:

重写内容,使高优先级页面上的内容更加独特。
使用动态属性自动将独特的内容注入页面。
删除大量不必要的样板内容。模板文本多于独特文本的页面可能会被视为重复内容。
如果您的网站依赖于用户生成的内容,请告知贡献者所有提供的内容都应独一无二。这可能有助于防止贡献者在多个页面或域中使用相同内容的情况。
8. 面向私人的内容
优先级:高
在某些情况下,Google 的抓取工具会访问它们本不应该访问的内容。如果 Google 发现开发环境,它可能会将这些 URL 包含在此报告中。我们甚至看到过 Google 抓取某个客户为 JIRA 票证设置的子域的示例。这导致该网站的抓取量激增,重点抓取了那些不应该被考虑编入索引的 URL。
Post Reply