现在的位置: 首页 > 搜索引擎优化 > 正文

关于重复内容谷歌站长工具的说明【转】

2013年09月01日 搜索引擎优化 ⁄ 共 2178字 暂无评论 ⁄ 阅读 3,761 次

重复内容通常是指域内或多个域之间存在的、与其他内容完全匹配或大致类似的内容。大多数情况下,重复内容本身不具有欺骗性。非恶意重复内容可能包含:

  • 能够生成用于移动设备的常规和简化网页的论坛
  • 通过多个不同网址显示或链接的存储项目
  • 网页的可打印版本

如果您的网站包含多个具有大量重复内容的网页,您可以采用多种方法向 Google 指明您的首选网址(这叫做“规范化”,如设置首先域、采用canonical标签、使用301重定向、提交网站地图、指定忽略参数等)。

然而,在某些情况下,为操纵搜索引擎排名或获得更多的访问量,某些网站所有者会故意在多个域内安插重复内容。此类行为即属于欺骗性行为,这会导致用户的体验非常糟糕:用户在一组搜索结果中会看到大量相同的重复内容。

Google 尽量对具有非重复信息的网页编制索引以及显示此类网页。我们举例说明这种过滤方式:如果您网站上的每篇文章都包含“普通版”和“打印版”,并且两个版本都没有用于阻止抓取的 noindex 元标记,我们会选择列出其中一个。如果 Google 认定显示重复内容是为了操纵我们的排名并欺骗我们的用户,尽管这种情况很少出现,我们也会在将此类网站编入索引和对其进行排名的过程中做出相应的调整。这样一来,网站的排名可能会受到影响,或者我们可能会将网站从 Google 索引中完全删除,网站删除后将不会再显示在搜索结果中。

您可采取某些措施来主动解决重复内容的问题,并确保访问者可看到您希望他们看到的内容。

使用 301 重定向:如果您已重组网站结构,请在 .htaccess 文件中使用 301 重定向 (RedirectPermanent),灵活地重定向用户、Googlebot 和其他信息采集软件。(在 Apache 中,可以使用 .htaccess 文件进行此操作;在 IIS 中,可以通过管理控制台进行此操作。)

保持一致:尽量使您的内部链接保持一致。例如,请勿链接到 http://www.example.com/page/、http://www.example.com/page 和 http://www.example.com/page/index.htm。

使用顶级域:为便于我们选用最恰当的文档版本,请尽量使用顶级域来处理国家/地区特定的内容。例如,http://www.example.de 与 http://www.example.com/de 或 http://de.example.com 相比,更能说明是针对德国的内容。

谨慎联合供稿:如果您在其他网站上将您的内容显示为联合供稿,那么,在每次指定的搜索中,Google 会始终显示我们认为最适合用户的版本,该版本可能是您的首选版本,也可能不是。不过,这有助于确保将您的内容显示为联合供稿的每个网站都包含一个指向您原始文章的链接。您也可以要求其他网站站长对包含您的联合供稿资料的网页使用 noindex 元标记,阻止搜索引擎将此版本编入索引。

使用网站站长工具告诉我们您希望以何种方式将您的网站编入索引:您可以向 Google 说明自己的首选域(例如,http://www.example.com 或 http://example.com)。

最大限度地减少重复的样板文字:例如,不在每个网页的底部添加冗长的版权文字,而只添加一段简短摘要,然后链接到能够提供详细信息的网页。此外,您还可以使用参数处理工具指定您希望 Google 如何处理网址参数。

避免发布空白内容:用户不喜欢看到“空白”的网页,因此请尽量避免使用占位符。例如,请勿发布尚无实际内容的网页。如果您确实创建了占位符页,请使用 noindex 元标记阻止搜索引擎将这些页编入索引。

了解自己的内容管理系统:请务必熟悉内容在您网站上的显示方式。博客、论坛以及相关系统往往会以不同的格式显示相同的内容。例如,某个博客条目可能会显示在博客的主页、存档网页以及具有相同标签的其他条目的网页中。

最大限度地减少相似内容:如果您的多个网页内容相似,那么请考虑扩充每个网页的内容,或将这些网页合并成一个。例如,如果您的旅行网站上包含两个城市的不同网页,但两个网页中的内容相同,那么,您可以将这两个网页合并为一个网页来介绍这两个城市的相关信息,或者您也可以扩充每个网页的内容,使其包含相应城市的独特内容。

Google 不建议使用 robots.txt 文件或其他方法阻止抓取工具访问您网站上的重复内容。如果搜索引擎无法抓取包含重复内容的网页,便无法自动检测这些网址是否指向相同内容,因此,实际上还是被迫将它们视为独立的不同网页。更好的方法是:允许搜索引擎抓取这些网址,但要使用 rel="canonical" 链接元素、网址参数处理工具或 301 重定向将其标记为重复内容。如果重复的内容会导致抓取工具从您网站上抓取的内容太多,您还可以在网站站长工具中调整抓取速度设置。

除非网站上的重复内容看上去意在欺骗用户以及操纵搜索引擎结果,否则,我们不会对含有重复内容的网站采取措施。如果您的网站存在重复内容问题,而您并未遵循上述建议,那么,我们会自行选择要在搜索结果中显示的内容版本。

但是,如果我们经过审查,发现您的网站有欺骗行为,并且我们已将您的网站从搜索结果中删除,那么请仔细检查您的网站。如果搜索结果中已删除您的网站,请参阅网站站长指南了解详细信息。如果您更改了网站内容并确信不再违反指南,请提交网站请求重新审核。

» 声明:本站文章源于个人经验总结或书籍、互联网转载,内容仅用于个人学习,请勿转载,否则后果自负!

给我留言

留言无头像?