Java中文乱码原因_javaprint不出中文资源-CSDN文库

136 浏览量 2020-12-22 18:38:00 上传评论收藏 50KB PDF 举报

资源详情

资源评论

资源推荐

Java中文乱码原因中文乱码原因

　　Java在中文环境中乱码无处不在，而且出现的时间和位置也包涵广泛，具体的解决方法也是千奇百怪。

　　但是如果能理清其中的脉络，理解字符处理的过程，对于解决问题很有指导意义，不至于解决了问题也不知道为什么。

　　其实，原因不外乎出在String输入时和输出时。

　　首先，Java中的任何String都是以UNICODE格式存在的。

　　很多人因为在GBK环境中使用String，会误以为String是GBK格式，实际上Java的String类中并没有存储CharSet信息的字

段，所有String中的字符只会以UNICODE的2字节形式存在。

　　String在构造时会逐一把字符按指定编码(默认值为系统编码GBK)，转换为UNICODE字符，存入一个Char(无符号16位)数

组中。

　　如:

　　new String(bytes，"gbk");

　　并不是说，生成一个GBK编码的字符串，而是按GBK逐一辨认字节数组bytes中的字符转化为UNICODE。

　　假设，bytes本是按GB编码的，构造方法在发现一个高位为0的byte作为ascii字符处理，高位为1和后面的一个byte合成中

文字符，再转换编码。

　　可以看出，在这个过程中，编码选择错误会导致程序按错误方法辨认bytes，乱码出现了。

　　在这里产生的乱码，很多时候还可以通过.getByte()方法修复，还没有后面的严重。

　　如:

　　"中".getBytes("iso-8859-1");

　　因为iso-8859-1中没有中文，所以"中"的值被替换成63，显示'?'，无法判断以前是什么值。

　　所以如下String将被破坏掉:

　　new String("中文".getBytes("iso-8859-1")，"iso-8859-1");

　　如果目标编码方式支持中文，不会损坏String:

　　new String("中文".getBytes("utf-8")，"utf-8");

　　Java在显示字符时，还需要进行一次转换，把UNICODE字符转换成用于显示的字符编码形式。

　　很多时候，这个过程是自动的，会按系统的默认编码(一般是GBK)转换String。

　　如果和页面编码不一样，会出现乱码，虽然在Java的程序中只有一种编码，输出却可以有不同的编码。

　　有时候，我们需要用 iso-8859-1格式分解String的中文，以便在不支持中文的系统中存储:

　　new String("中文".getBytes("GBK")，"iso-8859-1");

　　先通过GBK等支持中文的编码方式分解为byte数组，再做为iso-8859-1字符组成字符串，避免了被替换为Char(63)。

　　=========================================================================

　　示例程序

public static void main(String[] args)

{

String str = "中国";

printBytes("中国的UNICODE编码："， str.getBytes(Charset.forName("unicode")));

printBytes("中国的GBK编码："， str.getBytes(Charset.forName("GBK")));

printBytes("中国的UTF-8编码："， str.getBytes(Charset.forName("UTF-8")));

}

public static void printBytes(String title， byte[] data)

{

System.out.println(title);

for (byte b : data)

{

System.out.print("0x" + toHexString(b) + " ");

}

System.out.println();

}

public static String toHexString(byte value)

{

String tmp = Integer.toHexString(value & 0xFF);

if (tmp.length() == 1)

{

tmp = "0" + tmp;

}

return tmp.toUpperCase();

}

　　上例的输出结果为：

　　中国的UNICODE编码：

　　0xFE 0xFF 0x4E 0x2D 0x56 0xFD

　　中国的GBK编码：

　　0xD6 0xD0 0xB9 0xFA

　　中国的UTF-8编码：

　　0xE4 0xB8 0xAD 0xE5 0x9B 0xBD

　　本文通过学习WebInject官网教材，然后测试自己开发的WebService。

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

评论收藏

内容反馈

weixin_38726193

粉丝: 12
资源: 936

Java中文乱码原因

评论0

最新资源

Java中文乱码原因

评论0

java中文乱码问题

java中文乱码大全

java 中文乱码 处理

Java中文乱码解决之道

java解决中文乱码问题

Java 中文乱码问题

Java中文乱码

Java 中文乱码

Java 中文乱码的处理

Java开发中文乱码问题解决

Java关于中文乱码问题的多种解决方法

java中文乱码之解决URL中文乱码问题的方法

java中文乱码问题详解--- java中文乱码问题详解

java汉字乱码终极解决代码

Java中文乱码问题研究.pdf

解析Java中文乱码的处理方法

Java的中文乱码及部分解决方法

中文乱码总结出现的原因，及解决方法，包括数据库乱码

Java中URL传中文时乱码的解决方法

java zip解压中文乱码问题

java中文乱码解决问题

java中文乱码分析

JAVA常见中文乱码问题解决方法

JAVA反编译文件解决中文乱码

JSP中文乱码的产生原因及解决方案

Java 中文乱码解决之道 - v1.0.pdf

小结下MySQL中文乱码，phpmyadmin乱码，php乱码 产生原因及其解决方法第1/3页

[Java]PDF转图片解决中文乱码.zip

最新资源

java 中文乱码处理

小结下MySQL中文乱码，phpmyadmin乱码，php乱码产生原因及其解决方法第1/3页