ASCII主要用于显示现代英语和其他西欧语言,规定了128个字符的编码,使用一个字节编码,不支持中文;
GBK编码是对GB2312的扩展,完全兼容GB2312。采用双字节编码方案,剔出xx7F码位,共23940个码位,共收录汉字和
图形符号21886个;
Unicode为世界上所有字符都分配了一个唯一的数字编号,采用4个字节编码,意味着一个英文字符本来只需要1个字
节,而在Unicode编码体系下需要4个字节,其余3个字节为空,这就导致资源的浪费;
UTF-8是一种针对Unicode的可变长度字符编码,又称万国码,用1到6个字节编码UNICODE字符;
1
2
3
4