前不久百度官方发表了一篇关于百度快照的说明,大体的解释了百度快照更新与倒退原因,并直接指出“网站快照与网站权重没有任何关系”。
由于SEO基础知识的普及度不够,在交换友情链接的时候,还是有很多人拿网站快照作为主要参考标准之一,即使网站排名靠前、PR高,在把百度官方声明发给对方看,对方也很无奈的来了句上边领导要求没办法。
网站百度快照不更新与隔天更新
观察一些企业网站,发现关键词排名差不多的网站,同样是网站内容不更新,但是有的百度快照一直是隔天,有的就固定停在了某一天。
就此问题,笔者做了个测试,发现百度快照不更新并不代表百度没有抓取这个页面,通过网站日志分析出百度蜘蛛抓取首页的时候,一般情况下HTTP 状态代码会返回200或304:
如果是静态页面,百度蜘蛛第一次抓取一个URL地址的时候,服务器端返回的状态码会是200,同时会记录页面的Last-Modified属性标记(页面最后修改时间,可以用之前在Firefox SEO插件里介绍的HttpFox检测),如
在第二次百度抓取这个URL的时候,根据HTTP协议,服务器会先传送If-Modified-Since HTTP头信息给访问端,检查此文件有没有修改,如果未被修改则返回内容为空的304状态码,节省传输数据量。
第一个快照隔天的网站首页是动态网页,即使内容不更新,没有Last-Modified属性,每回返回的也都是200状态码,所以百度快照会是隔天。
第二个快照停滞的网站是静态首页,内容没有更新,百度蜘蛛第二次抓取的时候就会返回304状态码,代表网站没有更新,所以快照日期会停留在Last-Modified那个日期,这也就是为什么百度快照不更新的原因了。
目前而言,百度快照在SEO的作用主要体现在交换友情链接上,所以想让网站快照新,保持动态首页或者定期生成静态首页即可。
原文链接:http://www.seoshan.com/seo-basics/baidu-snapshot-http-304/
标签:西部数码 百度快照 静态首页 百度蜘蛛抓取