java查看编码

发布时间: 2022-04-14 22:52:03

Ⅰ java 怎么获取数据库的编码以及配置信息

Ⅱ Java 用if 查询编码方式

可以通过以下方法来进行编码格式判断，输入一个字符串，之后返回字符串编码类型。 public s

Ⅲ java如何获取正确的字符编码

如果是修改文件的编码方式，可以按以下步骤：
选中文件右键-->Properties-->Resource-->Text file encoding-->选中Other，然后选择自己想要的编码格式就可以了。
如果是修改MyEclipse的编码方式，可以按以下步骤：
菜单栏的Window-->Perferences-->General-->Work Space-->Text file encoding-->选中Other，然后选择自己想要的编码格式就可以了。

Ⅳ java怎么查看一段中文是什么编码格式

Java如何获取文件编码格式
1：简单判断是UTF-8或不是UTF-8，因为一般除了UTF-8之外就是GBK，所以就设置默认为GBK。
按照给定的字符集存储文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就是只要读出文件前三个字节，判定这些字节的值，就可以得知其编码的格式。其实，如果项目运行的平台就是中文操作系统，如果这些文本文件在项目内产生，即开发人员可以控制文本的编码格式，只要判定两种常见的编码就可以了：GBK和UTF-8。由于中文Windows默认的编码是GBK，所以一般只要判定UTF-8编码格式。
对于UTF-8编码格式的文本文件，其前3个字节的值就是-17、-69、-65，所以，判定是否是UTF-8编码格式的代码片段如下：
Filefile=newFile(path);
InputStreamin=newjava.io.FileInputStream(file);
byte[]b=newbyte[3];
in.read(b);
in.close();
if(b[0]==-17&&b[1]==-69&&b[2]==-65)
System.out.println(file.getName()+"：编码为UTF-8");
else
System.out.println(file.getName()+"：可能是GBK，也可能是其他编码");
2：若想实现更复杂的文件编码检测，可以使用一个开源项目cpdetector，它所在的网址是：http://cpdetector.sourceforge.net/。它的类库很小，只有500K左右，cpDetector是基于统计学原理的，不保证完全正确，利用该类库判定文本文件的代码如下：

读外部文件(先利用cpdetector检测文件的编码格式，然后用检测到的编码方式去读文件):

/**
*利用第三方开源包cpdetector获取文件编码格式
*
*@parampath
*要判断文件编码格式的源文件的路径
*@authorhuanglei
*@version2012-7-1214:05
*/
(Stringpath){
/*
*detector是探测器，它把探测任务交给具体的探测实现类的实例完成。
*cpDetector内置了一些常用的探测实现类，这些探测实现类的实例可以通过add方法加进来，如ParsingDetector、
*JChardetFacade、ASCIIDetector、UnicodeDetector。
*detector按照“谁最先返回非空的探测结果，就以该结果为准”的原则返回探测到的
*字符集编码。使用需要用到三个第三方JAR包：antlr.jar、chardet.jar和cpdetector.jar
*cpDetector是基于统计学原理的，不保证完全正确。
*/
CodepageDetectorProxydetector=CodepageDetectorProxy.getInstance();
/*
*ParsingDetector可用于检查HTML、XML等文件或字符流的编码,构造方法中的参数用于
*指示是否显示探测过程的详细信息，为false不显示。
*/
detector.add(newParsingDetector(false));
/*
*JChardetFacade封装了由Mozilla组织提供的JChardet，它可以完成大多数文件的编码
*测定。所以，一般有了这个探测器就可满足大多数项目的要求，如果你还不放心，可以
*再多加几个探测器，比如下面的ASCIIDetector、UnicodeDetector等。
*/
detector.add(JChardetFacade.getInstance());//用到antlr.jar、chardet.jar
//ASCIIDetector用于ASCII编码测定
detector.add(ASCIIDetector.getInstance());
//UnicodeDetector用于Unicode家族编码的测定
detector.add(UnicodeDetector.getInstance());
java.nio.charset.Charsetcharset=null;
Filef=newFile(path);
try{
charset=detector.detectCodepage(f.toURI().toURL());
}catch(Exceptionex){
ex.printStackTrace();
}
if(charset!=null)
returncharset.name();
else
returnnull;
}
StringcharsetName=getFileEncode(configFilePath);
System.out.println(charsetName);
inputStream=newFileInputStream(configFile);
BufferedReaderin=newBufferedReader(newInputStreamReader(inputStream,charsetName));

读jar包内部资源文件(先利用cpdetector检测jar内部的资源文件的编码格式，然后以检测到的编码方式去读文件)：

/**
*利用第三方开源包cpdetector获取URL对应的文件编码
*
*@parampath
*要判断文件编码格式的源文件的URL
*@authorhuanglei
*@version2012-7-1214:05
*/
(URLurl){
/*
*detector是探测器，它把探测任务交给具体的探测实现类的实例完成。
*cpDetector内置了一些常用的探测实现类，这些探测实现类的实例可以通过add方法加进来，如ParsingDetector、
*JChardetFacade、ASCIIDetector、UnicodeDetector。
*detector按照“谁最先返回非空的探测结果，就以该结果为准”的原则返回探测到的
*字符集编码。使用需要用到三个第三方JAR包：antlr.jar、chardet.jar和cpdetector.jar
*cpDetector是基于统计学原理的，不保证完全正确。
*/
CodepageDetectorProxydetector=CodepageDetectorProxy.getInstance();
/*
*ParsingDetector可用于检查HTML、XML等文件或字符流的编码,构造方法中的参数用于
*指示是否显示探测过程的详细信息，为false不显示。
*/
detector.add(newParsingDetector(false));
/*
*JChardetFacade封装了由Mozilla组织提供的JChardet，它可以完成大多数文件的编码
*测定。所以，一般有了这个探测器就可满足大多数项目的要求，如果你还不放心，可以
*再多加几个探测器，比如下面的ASCIIDetector、UnicodeDetector等。
*/
detector.add(JChardetFacade.getInstance());//用到antlr.jar、chardet.jar
//ASCIIDetector用于ASCII编码测定
detector.add(ASCIIDetector.getInstance());
//UnicodeDetector用于Unicode家族编码的测定
detector.add(UnicodeDetector.getInstance());
java.nio.charset.Charsetcharset=null;
try{
charset=detector.detectCodepage(url);
}catch(Exceptionex){
ex.printStackTrace();
}
if(charset!=null)
returncharset.name();
else
returnnull;
}
URLurl=CreateStationTreeModel.class.getResource("/resource/"+"配置文件");
URLConnectionurlConnection=url.openConnection();
inputStream=urlConnection.getInputStream();
StringcharsetName=getFileEncode(url);
System.out.println(charsetName);
BufferedReaderin=newBufferedReader(newInputStreamReader(inputStream,charsetName));

3：探测任意输入的文本流的编码，方法是调用其重载形式：
charset=detector.detectCodepage(待测的文本输入流,测量该流所需的读入字节数);

上面的字节数由程序员指定，字节数越多，判定越准确，当然时间也花得越长。要注意，字节数的指定不能超过文本流的最大长度。

4：判定文件编码的具体应用举例：

属性文件(.properties)是Java程序中的常用文本存储方式，象STRUTS框架就是利用属性文件存储程序中的字符串资源。它的内容如下所示：
#注释语句
属性名=属性值
读入属性文件的一般方法是：
FileInputStreamios=newFileInputStream(“属性文件名”);
Propertiesprop=newProperties();
prop.load(ios);
Stringvalue=prop.getProperty(“属性名”);
ios.close();
利用java.io.Properties的load方法读入属性文件虽然方便，但如果属性文件中有中文，在读入之后就会发现出现乱码现象。发生这个原因是load方法使用字节流读入文本，在读入后需要将字节流编码成为字符串，而它使用的编码是“iso-8859-1”,这个字符集是ASCII码字符集，不支持中文编码，
方法一：使用显式的转码：
Stringvalue=prop.getProperty(“属性名”);
StringencValue=newString(value.getBytes(“iso-8859-1″),”属性文件的实际编码”);
方法二：象这种属性文件是项目内部的，我们可以控制属性文件的编码格式，比如约定采用Windows内定的GBK，就直接利用”gbk”来转码，如果约定采用UTF-8，就使用”UTF-8″直接转码。
方法三：如果想灵活一些，做到自动探测编码，就可利用上面介绍的方法测定属性文件的编码，从而方便开发人员的工作

补充：可以用下面代码获得Java支持编码集合：
Charset.availableCharsets().keySet();
可以用下面的代码获得系统默认编码：
Charset.defaultCharset();

Ⅳ java 中如何查看字符串的编码类型

可以通过以下方法来进行编码格式判断，输入一个字符串，之后返回字符串编码类型。
public static String getEncoding(String str) {
String encode = "GB2312";
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是GB2312
String s = encode;
return s; //是的话，返回“GB2312“，以下代码同理
}
} catch (Exception exception) {
}
encode = "ISO-8859-1";
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是ISO-8859-1
String s1 = encode;
return s1;
}
} catch (Exception exception1) {
}
encode = "UTF-8";
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是UTF-8
String s2 = encode;
return s2;
}
} catch (Exception exception2) {
}
encode = "GBK";
try {
if (str.equals(new String(str.getBytes(encode), encode))) { //判断是不是GBK
String s3 = encode;
return s3;
}
} catch (Exception exception3) {
}
return ""; //如果都不是，说明输入的内容不属于常见的编码格式。
}

Ⅵ 如何查找默认的字符集/编码在Java中

1, Java代码直接设置
System.out.println(System.getProperty("file.encoding"));
或
System.out.println(Charset.defaultCharset());

2，eclipse里面选中工程->properties->Resource:text file encoding 改成你的原文件编码格式即可；
3，一般配置jdbc连接字符串的时候可以指定字符编码集，指定成和数据库的编码一致即可，这样用jdbc读出来的数据就是解码后的正常的数据。当然，不同的数据库产品具体看怎么办。

Ⅶ java判断文件编码格式怎么判断编码格式

UTF-8编码的文本文档，有的带有BOM (Byte Order Mark, 字节序标志)，即0xEF, 0xBB, 0xBF，有的没有。Windows下的txt文本编辑器在保存UTF-8格式的文本文档时会自动添加BOM到文件头。在判断这类文档时，可以根据文档的前3个字节来进行判断。然而BOM不是必需的，而且也不是推荐的。对不希望UTF-8文档带有BOM的程序会带来兼容性问题，例如Java编译器在编译带有BOM的UTF-8源文件时就会出错。而且BOM去掉了UTF-8一个期望的特性，即是在文本全部是ASCII字符时UTF-8是和ASCII一致的，即UTF-8向下兼容ASCII。
在具体判断时，如果文档不带有BOM，就无法根据BOM做出判断，而且IsTextUnicode API也无法对UTF-8编码的Unicode字符串做出判断。那在编程判断时就要根据UTF-8字符编码的规律进行判断了。
UTF-8是一种多字节编码的字符集，表示一个Unicode字符时，它可以是1个至多个字节，在表示上有规律：
1字节：0xxxxxxx
2字节：110xxxxx 10xxxxxx
3字节：1110xxxx 10xxxxxx 10xxxxxx
4字节：11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
这样就可以根据上面的特征对字符串进行遍历来判断一个字符串是不是UTF-8编码了。
举例代码：
java.io.File f=new java.io.File("待判定的文本文件名");
try{
java.io.InputStream ios=new java.io.FileInputStream(f);
byte[] b=new byte[3];
ios.read(b);
ios.close();
if(b[0]==-17&&b[1]==-69&&b[2]==-65)
System.out.println(f.getName()+"编码为UTF-8");
else System.out.println(f.getName()+"可能是GBK");
}catch(Exception e){
e.printStackTrace();
}

Ⅷ 怎么使用java判断一个字符串是属于什么编码

楼上全是傻X, 这样没有的,使用开源组件吧detector.jar

用法很简单

/*------------------------------------------------------------------------
detector是探测器，它把探测任务交给具体的探测实现类的实例完成。
cpDetector内置了一些常用的探测实现类，这些探测实现类的实例可以通过add方法
加进来，如ParsingDetector、 JChardetFacade、ASCIIDetector、UnicodeDetector。
detector按照“谁最先返回非空的探测结果，就以该结果为准”的原则返回探测到的
字符集编码。
--------------------------------------------------------------------------*/
CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
/*-------------------------------------------------------------------------
ParsingDetector可用于检查HTML、XML等文件或字符流的编码,构造方法中的参数用于
指示是否显示探测过程的详细信息，为false不显示。
---------------------------------------------------------------------------*/
detector.add(new ParsingDetector(false));
/*--------------------------------------------------------------------------
JChardetFacade封装了由Mozilla组织提供的JChardet，它可以完成大多数文件的编码
测定。所以，一般有了这个探测器就可满足大多数项目的要求，如果你还不放心，可以
再多加几个探测器，比如下面的ASCIIDetector、UnicodeDetector等。
---------------------------------------------------------------------------*/
detector.add(JChardetFacade.getInstance());
//ASCIIDetector用于ASCII编码测定
detector.add(ASCIIDetector.getInstance());
//UnicodeDetector用于Unicode家族编码的测定
detector.add(UnicodeDetector.getInstance());
java.nio.charset.Charset charset = null;
File f=new File("E://specialCar//test.csv");
try {
charset = detector.detectCodepage(new BufferedInputStream(new FileInputStream(f)),100);
} catch (Exception ex) {ex.printStackTrace();}
if(charset!=null){
System.out.println(f.getName()+"编码是："+charset.name());
}else{
System.out.println(f.getName()+"未知");
}

采纳哈

Ⅸ 怎么知道 java字符串编码格式

这样的测试方法是不正确的。getBytes(charset)是解码，new String(byte[], charset)是编码。new String(str.getBytes(charset),charset)是解码再编码，无论charset是什么编码格式，返回的字符串内容原始str是一致，因此equals方法都是返回true，达不到测试字符串编码格式的目的。个人观点：正确的测试姿势应该是这样的：

Stringcharset="xxx";//假定编码格式
Stringstr="中文"；
booleanflag=str.equals(newString(str.getBytes(),charset));

flag为true则表明str的编码格式是假定的编码格式。其中说明str.getBytes()该方法就是按其自身编码格式去解码。其自身编码格式跟你的操作系统编码格式或你使用的IDE设置的文件的Text file encoding有关。

阅读全文

热点内容

java返回this 发布：2025-10-20 08:28:16 浏览：1082

制作脚本网站发布：2025-10-20 08:17:34 浏览：1359

python中的init方法发布：2025-10-20 08:17:33 浏览：1046

图案密码什么意思发布：2025-10-20 08:16:56 浏览：1221

怎么清理微信视频缓存发布：2025-10-20 08:12:37 浏览：1089

c语言编译器怎么看执行过程发布：2025-10-20 08:00:32 浏览：1440

邮箱如何填写发信服务器发布：2025-10-20 07:45:27 浏览：647

shell脚本入门案例发布：2025-10-20 07:44:45 浏览：543

怎么上传照片浏览上传发布：2025-10-20 07:44:03 浏览：1218

python股票数据获取发布：2025-10-20 07:39:44 浏览：1242

java查看编码

与java查看编码相关的资讯