2009年12月1日星期二

对于Google伪静态与静态HTML的差别

点石论坛SEO论坛中经常看到类似这样的帖子:

  • 静态HTML和伪静态哪个更好?

  • 我使用Rewrite把URL做成伪静态了,搜索引擎会不会当作静态网页对待?


下面樂思蜀就静态HTML与伪静态问题,发表一下个人看法。

以下内容,仅针对Google,其他搜索引擎未必如此。

首先我们来看哪个更好的问题

就老樂多年对Google的观察,目前Google在这个问题上已经基本完美解决。也就是说,现在对于Google,无论使用伪静态还是静态HTML,基本都能很好的抓取和收录,不会出现几年前那种带多个参数的动态URL就不抓取的现象。

抓取解决了,那么同等情况下,伪静态还是静态HTML针对搜索引擎更好?答案是静态HTML,截止目前是这样,以后不保证(后面的内容会再说这个问题)。

上面所说一定是在同等情况,如前面的一篇文章“Google解说动态、静态、伪静态网址”所说,你要把这样一个URL地址:

http://www.domain.com/read.php?classid=123&lang=en&id=321

Rewrite成:

http://www.domain.com/read-321.html

效果理论来说反而不如上面的动态地址。

接下来我们来看Google看到的伪静态和静态HTML

Google 管理员工具 中增加了“像 Googlebot 一样抓取”功能,对于SEO来说,价值是非常大的,可以直观的看到,Googlebot看到你的网页是什么样的。

为了实验,上传了一个演示xhtml代码的静态HTML网页,与上一篇文章做对比。下面是模拟抓取出来的结果:

像 Googlebot 一样抓取
(点击查看大图)

上图中,左侧是一篇文章的伪静态页面,右侧是一个静态HTML文件,对比一下,能明显看到下面两个差别:

  • Last-Modified:静态HTML有修改时间(对于搜索引擎意味着可直接获取文件修改时间)

  • Content-Length:文件大小(SEO应该清楚,文件大小对于搜索引擎的影响;Googlebot如果能从服务端直接获取文件大小,作为参考,抓取的效率会更高)


下图是静态HTML的文件属性:

静态HTML文件属性

最后,猜测一下Google为什么认为静态HTML优于动态URL

对比一下静态HTML与动态URL的工作方式:

  • 静态HTML:客户端与服务端通讯成功,服务端直接发送文件属性与内容。

  • 动态URL:客户端与服务器端通讯成功,服务端根据客户端请求的内容,产生页面内容,发送服务端信息与请求的内容。


使用动态URL:假如程序出现问题,所有基于些程序的内容将无法访问;假如模板变化,所有信息内容都会发生变化,而真正有价值的内容并没有改变;假如数据库ID不是唯一,新增的内容沿用了被删除内容的ID,将出现URL没有改变而页面完全变化……

而如果是静态HTML,文件只有“存在&不存在”(服务端状态不计算在内),“修改&未修改”(读Last-Modified就好了)。

经过这样的分析,得出的结果是:静态HTML具有更高的稳定性。

这个猜测也能解释SEO经常遇到的一个问题,网站中的一些文档(PDF&DOC&XML)权重相对都较高。

挺长时间没有写博客,语言有些混乱,呵呵 :P

有时间的时候,专门写篇博客,介绍一下Google管理员工具中“像 Googlebot 一样抓取”各标签的意思,刚开始用的朋友可能对这些不是很了解。

22 条评论:

小彭 说...

分析的很不错,希望有空多抽点时间跟大家分享。感谢~~

洪成浩 说...

学习了,谢谢乐老板

lalaha 说...

如果不让web服务器发送Last-Modified,不知道会不会有什么负面影响,理由如下:
相信不少人的站点首页是定时更新的(比如dedecms,调用随即文章),这样生成的首页最后修改时间会一直是一个同一个时间,这样的首页是否会引起se的反感,特别是百度,如果会的话,那么我们可以设置让web服务器head头部发送Last-Modified,但这样会不会有社么负面影响呢?

樂思蜀 说...

是“参考”,Google肯定不会直接拿Last-Modified作为网页的更新时间;但如果Last-Modified每次都是正确的,也未必就不会采纳,当然也不可能完全采纳。CMS最好不要使用调度生成,那样没有意义,使用触发机制,比如添加或修改内容后生成,这样虽然生成很频繁,但确实每次生成后内容都不一样,搜索引擎是不会反感的。

加密狗 说...

分析的很有道理,不过对于我这种菜鸟seo来说还早着了~~支持下@

江门SEO培训 说...

分析的很详细~~~

张何 说...

动态参数尽可能的少,参数连接字符用一些常用词汇。

老白 说...

这个还是不可以一概而论咯~ 有时候如果是静态html 很多已经存在的页面并不能实时更新 需要手动去更新比较麻烦~如果你任由他生成以后不去管~这样收录的这些html页面 搜索引擎就会认为过时了 没有更新的情况出现 就不会继续更新已经收录的 ~ 但是如果是伪静态的 或者是动态的 那结果就不一样了 就算是收录了的页面 他还是会继续更新~ 效果相对要比一个静止不动的页面要好~

成都SEO 说...

写的很好 乐思蜀心很细呀

tent.yo2.cn 说...

随着即时搜索技术的发展,相信搜索引擎会对这方面抓取有所调整的!

hong kong 说...

还不是看的很明白。。。。

电影盒子 说...

感觉引擎不会傻到识别不了动态参数
好像没人能拿出一个确切的证据证明静态的就一定好(只对SEO)

willy 说...

终于有点明白差别了,以前看的文章没有这样详细的实例,谢谢。

广州搬运公司 说...

我用的是纯静态的,这样的好用速度快

工业毛刷 说...

我感觉静动态现在都无所谓了,你看,好多动态网址照样不收录很好。呵呵,个人愚见。

深海鱼油 说...

感觉动态的更好

秦皇岛婚纱摄影 说...

随着搜索引擎技术的发展,动态和静态将会没有分别。

主持人网 说...

这个影响大吗?感觉不是非常重要

北京空调打孔 说...

现在对于google来说,应该动态跟静态一样吧

上海男科 说...

我感觉影响不是很大,做成伪的比较好。

台湾旅游 说...

影响真的非常大耶!

李俊男 说...

能做静态就把它做好

做不好你就动态去吧

这是我的理解。