常用字符集
ASCII ASCII是基于拉丁字母的一套电脑编码系统。它主要用于显
示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,
不过对café naïve这类词无法处理。
iso8859-1 又称Latin-1或“西欧语言”,是国际标准化组织的第一个
8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96
个字母及符号,藉以供使用变音符号的拉丁字母语言使用。
GB2312 适用于汉字处理、汉字通信等系统之间的信息交换,通行于
中国大陆,新加坡等地也采用此编码,共收入汉字6763个和非汉字图形
字符682个。
Big-5 通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码”
GBK共23940个码位,共收录了21003个汉字,完全兼容GB2312,
并包含了BIG5编码中的所有汉字。
UTF-8 是一种针对Unicode的可变长度字符编码,又称万国码。UTF-8
用1到4个字节编码UNICODE字符。用在网页上可以同一页面显示中文简
体繁体及其它语言(如日文,韩文)
第五页,共31页。