连通率
第四步:抓取成功后,也不能说就万事大吉了,还要点击”抓取成功”进去注意:提交网址、抓取网址、抓取UA、网站ip、下载时长、头部信息(服务器返回状态码、gzip等相关信息)、网页源码是否都正常。
特别说明:有很多站长就光注意抓取成功,却不知网站ip可能并非自己的实际ip,被网络商搞到哪里去了都不知道,还可能每隔一段时间都变。当发现ip有问题,及时跟网络商沟通,并在网站ip旁点击“报错”按钮,百度会更新网站ip,但是切记不要ip变化频繁。此外当然还可能出现实际抓取网址、头部信息、网页源码等都不是自己本来设置的。
(二)在抓取
这是反映百度蜘蛛在抓取时的状态,百度的工具显示的数值肯定都是抓取后计算出来的数据,因此任何工具的连通率数据必定存在延迟性,另外这个计算过程也存在一定可能的错误,所以我们看到任何工具中关于连通率的数据,不要说“我网站用抓取诊断等工具检查访问情况都好好的,为什么连通率还是0”,因此除了上述建议的多抓取诊断测试外,自己可以加些监控网站连接状态的措施,笔者本人就曾经接收了不少关于网站连接不通的提醒。这时我会及时跟网络商沟通,然后及时用抓取诊断检查蜘蛛的情况。
(三)N个页面与M个页面
这N、M个页面,可能百度蜘蛛很凑巧就赶上高峰的时候或者一些假死页面(执行时间较长,超过蜘蛛的耐心),那么M这个数值就会很低,统计概率的东西大家都懂的,那么这时网站的连通率依旧很低或为0。因此若连通率为0,我们还可以知道自己应该注意查看访问日志,及时清理死链,或者并发连接数增大,或者增加内存等等。
(四)都能打开并被成功抓取
这里主要注意DNS和空间的稳定性。
1、DNS的问题
——–下方为百度官方资料————-
当心dns服务器不稳导致站点被屏
近期百度站长平台收到多个反馈,称网站从百度网页搜索消失,site查询发现连通率为0。
经追查发现这些网站都使用godaddy的DNS服务器 *.DOMaiNCONTROL.COM,此系列DNS服务器存在稳定性问题,baiduspider经常解析不到ip,在Baiduspider看来,网站是死站点。
此前我们也发现过多起小dns服务商屏蔽Baiduspider解析请求或者国外dns服务器不稳定的案例。
建议站长尽可能使用国内大型服务商提供的DNS服务,如dnspod等,以保证站点的稳定解析。
——–上方为百度官方资料————-
笔者提醒大家注意的是现在不少云类ns服务器,这个过程中由于处理机制问题,包括回源障碍等等,较容易造成这个问题。另外国内大型服务商提供,比如你使用了dnspod,并不代表你的dns就应该是ok的。有的站长存在着对大型服务商的错误认识,如 “新网的dns就是不可靠的,我都用百度云加速”。我们要明白廉价的东西质量都有一定局限性,所以需要自己检查dns解析情况,具体上网找找相关资料或平台,看看dns解析出的ip以及解析延迟情况等等。
2、空间的稳定性
很多人都会用超级ping了,这个不多说了。但是我还要告诉大家有下面两点需要注意:
A、不良的网络商会对不同用户ip进行不同处理,自己可以用VPN等工具观察下不同地区ip段的网站访问情况与返回内容;
B、空间的资源不足,内存、并发连接等等,当访问量很少的时候,自己察觉不出,需要提高访问量,增加连接时间。因此使用一些监控工具时,发现监控工具访问测试量巨大,或者被人刷流量时,你应该庆幸,而不是着急拒绝,因为你可以了解到自己的空间承压能力。
四、连通率问题处理完毕后
如果你的网站索引由于连通率而非惩罚原因被清理了,处理完毕问题,可以在抓取频次工具中提交增加抓取频次的请求,将抓取频次增加到一定额度(建议自己查看工具中对抓取频次的说明后再根据网站实际情况调整),然后增加自己的网站数据更新频率与质量,加强与百度的数据沟通(如url提交、sitemap等等),很快就能恢复。相关工具展示如下(每个工具页面的右侧下方都有相关说明链接,可以点击去了解使用注意事项):
1、抓取频次中的频次调整工具:
2、url提交工具:
3、Sitemap工具中的定期更新、实时推送工具:
4、Ping工具: