现在的位置: 首页 > 搜索引擎优化 > 正文

网站百度收录率及未收录页面快速查询方法

2012年11月21日 搜索引擎优化 ⁄ 共 1558字 评论数 14 ⁄ 阅读 10,869 次

网站收录是百度SEO的一个重要指标,了解网站整体收录及未收录情况可以更好的了解百度的收录规则,以提高网站的收录率,提升SEO效率、效果。

虽然,百度指令(如:site+inurl组合)也可以大致看出网站收录情况,但是,由于其准确性较差以及针对具体栏目区别性小等限制并不太适合用于准确了解网站收录情况。此时,最好的方法只能是将url一个个粘贴到百度搜索栏进行搜索。但此时我们会遇到的问题是一方面内容量大时一个个点开网站收集url较麻烦,另一方面将url一个个在百度搜索栏搜索也是一件让人很头痛的事。

如何快速批量查询百度收录及未收录页面呢?

一、快速获取网站url方法

通过网站地图sitemap我们可以看到网站所有url,所以sitemap就成了我们快速获取url的关键。

1、对于wordpress等可以安装xml地图插件的网站,可以直接通过插件生成sitemap,然后从网站地图复制url,如图(WP程序):

xml-sitemap

复制url时会遇到一个问题,我们会将url后面的链接权重、更新频率、最后更新时间也一并复制出来,如何处理掉后面那些没用的东西呢?此时我们就要用到强大的Excel了,将复制内容粘贴到excel你会惊奇的发现url独自成列了,然后,我们选择列,复制,OK,到此,我们就得到了单纯的url。

下面一步是将复制的url粘贴出来,不能直接粘贴到word里,而使用txt又会出现排版问题,如何得到一份完美的url呢?此时,就要用到笨鸟所准备的在线文字自动排版工具了。直接将复制的内容粘贴进输入框,点击消除空行,我们就完美的得到了网站url。如图:

在线自动排版工具

需要注意的是:一般插件是可以设置xml网站地图里url内容的,如wp程序的tag页、分类页、独立页等,但如何没有选择这些页面,在sitemap中是没有这些url,如果需要请自行添加。

2、对于dede等没有xml地图插件的网站,我们需要借助外部sitemap工具生成网站地图收集网站url。

Sitemap工具有在线版和PC版,在线版如小爬虫和XML Sitemaps Generator,不过前者服务器有问题,经常一抓就死,而后者的免费版又故意抓取不全。所以,PC版是我们的最好选择了。对于PC版我们可以选择SiteMap X,不过其缺点是抓的太深了,连后台页面url也抓。

使用SiteMap X工具:新建工程名(如:大河笨鸟)及组名(如:博客),然后填写域名地址、选择抓取深度(根据网站url结构确定,如:3)、抓取数量、抓取类型,点击抓取即可。

工具抓取耗时较长,需等待抓取完成然后点击下一步,在弹出界面点击‘生成XML文件’,打开文件目录找到sitemap.txt文件,将需要的url整理出来就完美得到了需要的url。

在此,需要注意的是,SiteMap X工具抓取深度过深,在其抓取后台url时可以点击停止,然后直接导出就可以了。

sitemap X工具

二、根据url批量查询网站百度收录情况

直接在百度搜索栏查询过于麻烦,此时我们需要用到SEO工具。将url输入收录批量查询栏,点击查询,稍等片刻即可得到收录结果。笨鸟的一位朋友simen给笨鸟分享了一个百度收录批量查询工具,服务器挺稳定的,分享给大家。

一般工具都有导出为Excel功能,导出后可进行相关分析,如网站整体收录率、某分类下收录率、网站结构优化程度、未收录原因等。 百度收录批量查询工具

百度收录结果导出

三、网站百度收录率正常应为多少?

这个问题不好讲,针对不同类型网站,收录率不近相同。如,页面少的企业站相对收录率会高些,而页面较多的论坛则相对收录率会低一些。一般而言,收录率达到30%算正常,达到50%属于良好,而超过80%则说明网站收录较为优秀。

关于如何提升百度收录率就不再讲了,依然是那些老掉牙的东西。本次关于如何批量查询百度收录及未收录页面的问题至此结束,祝大家网站有个好的收录率!

» 声明:本站文章源于个人经验总结或书籍、互联网转载,内容仅用于个人学习,请勿转载,否则后果自负!

目前有 14 条留言 其中:访客:8 条, 博主:6 条

  1. 笨鸟粉丝团 : 2012年11月22日09:04:18  -49楼 @回复 回复

    笨鸟太有才了,关注关注!


    • 管理员
      大河笨鸟 : 2012年11月22日09:18:29  地下1层 @回复 回复

      靠……老实人,你一点儿也不老实哇……

  2. 游客 : 2012年11月22日12:07:04  -48楼 @回复 回复

    谢谢博主分享,刚好需要这款


    • 管理员
      大河笨鸟 : 2012年11月22日12:23:38  地下1层 @回复 回复

      恶意SEO类留言会清除用户名改为游客并清除url

  3. Jing : 2012年11月22日13:28:06  -47楼 @回复 回复

    还有笨鸟粉丝团 我去。。。


    • 管理员
      大河笨鸟 : 2012年11月22日14:28:51  地下1层 @回复 回复

      朋友开玩笑的

  4. 霍致永博客 : 2012年11月22日14:27:13  -46楼 @回复 回复

    挺详细的,来支持了欢迎来访


    • 管理员
      大河笨鸟 : 2012年11月23日09:00:46  地下1层 @回复 回复

      以互访、SEO为目的的留言,本博客不欢迎,以此为目的的留言本博客将清除用户名改为“游客”并清除url,情者恶劣者将删除留言拉入黑名单,谢谢!

  5. 游客 : 2012年11月22日15:25:23  -45楼 @回复 回复

    哇,好细致啊~~第一次看博主的文章,顶一个!


    • 管理员
      大河笨鸟 : 2012年11月23日09:04:19  地下1层 @回复 回复

      以互访、SEO为目的的留言,本博客不欢迎,以此为目的的留言本博客将更改“用户名”为“游客”并清除url,情者恶劣者将删除留言拉入黑名单,谢谢!

  6. 游客 : 2012年11月23日00:48:46  -44楼 @回复 回复

    我想问一下用 site:***.com 这样查到的页面是这个搜索引擎收录的整个网站的页面个数吗?


    • 管理员
      大河笨鸟 : 2012年11月23日09:08:53  地下1层 @回复 回复

      以互访、SEO为目的的留言,本博客不欢迎,也不会回复问题,以此为目的的留言本博客将更改“用户名”为“游客”并清除url,情者恶劣者将删除留言拉入黑名单,谢谢!

  7. zencart模板 : 2013年11月20日11:58:58  -43楼 @回复 回复

    总结起来其实只需要两部:1,在地图里面利用找出所有的url。2,利用博主说的那个工具检测未收录的网址

  8. 222 : 2015年12月15日14:44:55  -42楼 @回复 回复

    站点整站未收录

给我留言

留言无头像?