没有合适的资源?快使用搜索试试~ 我知道了~
GBK GB2312 UTF-8 ISO-8859-1区别
需积分: 35 4 下载量 182 浏览量
2012-11-24
11:30:30
上传
评论
收藏 72KB DOC 举报
温馨提示
试读
2页
UTF-8:Unicode Transformation Format-8bit,许多的公司联合决定制定一个包含全世界所有文字的巨大字集,其中也有亚洲的公司参与。
资源推荐
资源详情
资源评论
关于 GBK、GB2312、UTF8 之间的区别
UTF-8:Unicode Transformation Format-8bit,许多的公司联合
决定制定一个包含全世界所有文字的巨大字集,其中也有亚洲的公司参与。用
以解决国际上字符的一种多字节编码,它对英文使用 8 位(即一个字节),中
文使用 24 位(三个字节)来编码。UTF-8 包含全世界所有国家需要用到的字
符,是国际编码,通用性强。UTF-8 编码的文字可以在各国支持 UTF8 字符
集的浏览器上显示。
例:如果是 UTF-8 编码,则在外国人的英文 IE 上也能显示中文,他们无
需下载 IE 的中文语言支持包。
GBK:是国家标准 GB2312 基础上扩容后兼容 GB2312 的标准。GBK 的
文字编码不论中、英文字符是用双字节来表示,为了区分中文,将其最高位都
设定成 1。GBK 包括中日韩字符的大字符集合,包含全部中文字符及容纳
GB2312 字符集范围以外的 Unicode 2.1 的统一汉字部分, 并且增加了部分
unicode 中没有的字符,是国家编码,通用性比 UTF-8 差,不过 UTF-8 占
用的数据库比 GB K大。
GB2312:是 GBK 的子集,是中文简码,GBK 是 GB18030 的子集。
ISO-8859-1: 又称 Latin-1 或“西欧语言”,是国际标准化组织
内 ISO/IEC 8859 的第一个 8 位字符集。它以 ASCII 为基础,在空置的
0xA0-0xFF 的范围内,加入 192 个字母及符号,藉以供使用变音符号的拉
丁字母语言使用。
总结:
gb2312 是简体中文的码
gbk 支持简体中文及繁体中文
big5 支持繁体中文
utf-8 支持几乎所有字符
中文内容多的站点可以考虑用 gbk 或 gb2312,英文内容多的站点还是 utf-
8 好。
不过现在很多论坛的插件一般只支持 GBK。
如果是中文的网站 推荐 GB2312, GBK 有时还是有点问题
为了避免所有乱码问题,应该采用 UTF-8,将来要支持国际化也非常方便
UTF-8 可以看作是大字符集,它包含了大部分文字的编码。
使用 UTF-8 的一个好处是其他地区的用户(如香港台湾)无需安装简体中文
支持就能正常观看你的文字而不会出现乱码。
GBK、GB2312 等与 UTF8 之间都必须通过 Unicode 编码才能相互转换:
通常异种语言之间的转换是通过 Unicode 来完成的。假设有两种不同的语言 A 和 B,
转换的步骤为:先把 A 转化为 Unicode,再把 Unicode 转化为 B。
资源评论
心雨晨
- 粉丝: 4
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功