【叶凡网络】怎么去解决Java/JSP的中文乱码问题

2014-01-20 10:14:01 | 新闻来源:叶凡网络 | 点击量:656

Java内核和class文件是基于unicod这使Java顺序具有良好的跨平台性。Java和JSP文件自身编译时产生的乱码问题和Java顺序于其他媒介交互发生的乱码问题。而Java和JSP源文件的保管方式是基于字节流的如果Java和JSP编译成class文件过程中,首先Java包括JSP源文件中很可能包括有中文。使用的编码方式与源文件的编码不一致,就会出现乱码。基于这种乱码,建议在Java文件中尽量不要写中文(注释局部不参与编译,写中文没关系)如果必需写的话,尽量手动带参数-ecodGBK或-ecodgb2312编译;对于JSP文件头加上或基本上就能解决这类乱码问题。即Java顺序与其他存储媒介交互时产生的乱码。很多存储媒介,本文要重点讨论的第二类乱码。如数据库,文件,流等的存储方式都是基于字节流的Java顺序与这些媒介交互时就会发生字符(char与字节(byte之间的转换,具体情况如下:

从页面form提交数据到java顺序 byte>char

从java顺序到页面显示 char?>byte

从数据库到java顺序 byte?>char

从java顺序到数据库 char?>byte

从文件到java顺序 byte>char

从java顺序到文件 char>byte

从流到java顺序 byte>char

从java顺序到流 char>byte

很可能就会出现乱码。如果在以上转换过程中使用的编码方式与字节原有的编码不一致。

如果在其他地方还出现乱码,上面提到方法应该能解决大部分乱码问题。可能需要手动修改代码。解决Java乱码问题的关键在于在字节与字符的转换过程中,必需知道原来字节或转换后的字节的编码方式,转换时采用的编码必需与这个编码方式坚持一致。以前使用Resin服务器,使用smartUpload组件上传文件,上传文件同时传送的中文参数获取没有乱码问题。当在Linux中把Resin设置成服务后,上传文件同时的中文参数获取呈现了乱码。这个问题困扰了很久,后来我分析smartUpload组件的源文件,因为文件上传采用的字节流的方式,里面包括的参数名称和值也是字节流的方式传送的smartUpload组件读取字节流后再将参数名称和值从字节流中解析出来,问题就出现在smartUpload将字节流转换成字符串时采用了系统默认的编码,而将Resin设置成服务后,系统默认的编码可能发生了改变,因此呈现了乱码。后来,更改了smartUpload源文件,增加了一个属性charset和setCharsetString方法,将upload方法中提取参数语句:

m_startData,Stringvalu=newStringm_binA rray.m_endData-m_startData+1;

改成了

 

m_startData,Stringvalu=newStringm_binA rray.m_endData-m_startData+1,charset;

Java/JSP中文乱码的解决方法,如果这些转换过程中容易发生乱码。解决这些乱码问题的关键在于确保转换时使用的编码方式与字节原有的编码方式坚持一致,前面已经提到Java顺序与其他媒介交互时字符和字节的转换过程。下面分别论述(Java或JSP自身发生的乱码请参看第一部分)如果页面参数的编码类型和系统默认的编码类型不一致,JSP获取页面参数时一般采用系统默认的编码方式。很可能就会出现乱码。解决这类乱码问题的基本方法是页面获取参数之前,强制指定request获取参数的编码方式:request.setCharacterEncod"GBK"或request.setCharacterEncod"gb2312"

可以通过设置response.setContentTyp"text/html;charset=GBK"或response.setContentTyp"text/html;charset=gb2312"解决。如果在JSP将变量输出到页面时出现了乱码。

更简洁的方法是使用Servlet规范中的过虑器指定编码,如果不想在每个文件里都写这样两句话。过滤器的web.xml中的典型配置和主要代码如下:

web.xml: 

CharacterEncodingFilter 

net.vschool.web.CharacterEncodingFilter 

encodingGBK 

CharacterEncodingFilter 

/* 

CharacterEncodingFilter.java: 

publicclassCharacterEncodingFiltimplementFilter 

protectStringencod=null; 

publicvoidinitFilterConfigfilterConfigthrowServletException 

this.encod=filterConfig.getInitParamet"encoding"; 

ServletResponsresponse,publicvoiddoFiltServletRequestrequest.FilterChainchainthrowIOException,ServletException 

request.setCharacterEncodencod; 

response.setContentTyp"text/html;charset="+encod; 

respons; chain.doFiltrequest.

}

Java与数据库之间的乱码:所以解决Java与数据库之间的乱码问题比较明智的方式是直接使用unicod编码与数据库交互。很多数据库驱动自动支持unicod如MicrosoftSQLServer驱动。其他大部分数据库驱动,大部分数据库都支持以unicod编码方式。可以在驱动的url参数中指定,如如mmmysql驱动:jdbc:mysql://localhost/WEBCLDB?useUnicode=true&characterEncoding=GBK

Java与文件/流之间的乱码:如果文件内容与系统编码方式不一致,可能会出现乱码。这种情况下,建议使用FileRead和FileWrit父类:InputStreamReader/OutputStreamWrit也是基于字符的但在构造函数中可以指定编码类型:InputStreamReadInputStreamin,Java读写文件最常用的类是FileInputStream/FileOutputStream和FileReader/FileWrit其中FileInputStream和FileOutputStream基于字节流的常用于读写二进制文件。读写字符文件建议使用基于字符的FileRead和FileWrit省去了字节与字符之间的转换。但这两个类的构造函数默认使用系统的编码方式。Charsetcs和OutputStreamWritOutputStreamout,Charsetcs

 

上一篇:【叶凡网络】日本执政党继续参拜靖国神社开会删除不战誓言 下一篇:【叶凡网络】欧美四国领导人缺席,习近平将出席索契冬奥会