http://www.admin5.com/article/20120513/430098.shtml
charset 中 gbk 或 utf8 对 seo 的影响
看到有人问 gbk 和 utf-8 对于 seo 的影响,我说点个人看法。
如果网站是面向国人的,建议使用 gbk,理由如下:
1.gbk 采用双字节表示汉字,utf-8 采用三个字节表示汉字,从表示一个汉字所占的字
节数来说,gbk 相对于 utf-8 可以节约 50%的空间。
2.目前开源的程序 gbk 编码相对成熟一些。
3.蜘蛛在爬行某个页面的过程中识别的 charset 属性值如果为 gbk 的话基本上可以确
实为中文类型的网站(无需对后面的内容进行判断),如果为 utf-8 的话还需要进一步判
断(例如检索全文中的字符有多少属于 utf-8 中文字符的范围)。
如果网站是外文的话果断 utf-8 吧。
还有一点需要注意的是由于 gbk 和 utf-8 的编码不同,如果网站在被收录之后更改
charset 的话,蜘蛛在抓取过程中如果不能及时的发现 charset 变动的话就会判定网页内
容发生异常导致页面被 K。
以我自己的论坛为例(以下例子与实际情况还有点出入,仅用来说明大概意思),如
图 1 所示,论坛采用的编码为 gbk,浏览器正常显示。
图 1:
评论0
最新资源