避免重复内容(duplicate content)

在网络营销界一直有这样一个专有名词“duplicate content-重复内容”。意思就是你这篇文章其他网站的文章有相似性,导致搜索引擎的惩罚。

什么是重复内容?

重复的内容一般是指在不同域名间存在大量的相同或相似的内容。一些站点为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网 站复制内容。

为什么搜索引擎重视重复内容?

用户运用搜索引擎时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。

搜索引擎的“惩罚”

搜索引擎在抓取网页和获得搜索结果时,总是力图索引并显示内容不同的页面。这种过滤意味着,譬如说,如果你的站点有文章的正常版和打印版,并且你没有在 robots.txt里设定noindex标记,搜索引擎就只会选择一个版本显示给谷歌用户。对于企图运用 复制内容来操控排名,欺骗用户的少数情况,我们会在对有关页面的索引和排名作出适当调整。当然,我们更愿意把重点放在过滤而不是排名调整上。因此,在绝大多数情况下,最坏的结果就是原创者看到了不愿看到的版本出现在我们的索引里。

通过工具对比重复内容

如果你做的是英文站的话,推荐一个网站copyscape.com。在首页输入你的网址可以查出别人是否盗用了你的原创文章。

DuplicateContent.net是另外一个不错的网站,输入两个要比较的网址,比较两个网页的相似性。

相关内容:

  1. robots.txt-告诉搜索引擎哪些网页需要收录

Leave a comment

You must be logged in to post a comment.