package com.opslab.util;
import java.io.ByteArrayOutputStream;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;
/**
* Description:
* 编码相关的封装类
*/
public final class CharsetUtil {
/**
* 7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块
*/
public static final String US_ASCII = "US-ASCII";
/**
* ISO 拉丁字母表 No.1,也叫作 ISO-LATIN-1
*/
public static final String ISO_8859_1 = "ISO-8859-1";
/**
* 8 位 UCS 转换格式
*/
public static final String UTF_8 = "UTF-8";
/**
* 16 位 UCS 转换格式,Big Endian(最低地址存放高位字节)字节顺序
*/
public static final String UTF_16BE = "UTF-16BE";
/**
* 16 位 UCS 转换格式,Little-endian(最高地址存放低位字节)字节顺序
*/
public static final String UTF_16LE = "UTF-16LE";
/**
* 16 位 UCS 转换格式,字节顺序由可选的字节顺序标记来标识
*/
public static final String UTF_16 = "UTF-16";
/**
* 中文超大字符集
*/
public static final String GBK = "GBK";
/**
* 将字符编码转换成US-ASCII码
*/
public final static String toASCII(String str) throws UnsupportedEncodingException {
return changeCharset(str, US_ASCII);
}
/**
* 将字符编码转换成ISO-8859-1码
*/
public final static String toISO_8859_1(String str) throws UnsupportedEncodingException {
return changeCharset(str, ISO_8859_1);
}
/**
* 将字符编码转换成UTF-8码
*/
public static String toUTF_8(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_8);
}
/**
* 将字符编码转换成UTF-16BE码
*/
public final static String toUTF_16BE(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_16BE);
}
/**
* 将字符编码转换成UTF-16LE码
*/
public final static String toUTF_16LE(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_16LE);
}
/**
* 将字符编码转换成UTF-16码
*/
public final static String toUTF_16(String str) throws UnsupportedEncodingException {
return changeCharset(str, UTF_16);
}
/**
* 将字符编码转换成GBK码
*/
public final static String toGBK(String str) throws UnsupportedEncodingException {
return changeCharset(str, GBK);
}
/**
* 字符串编码转换的实现方法
*
* @param str 待转换编码的字符串
* @param newCharset 目标编码
* @return
* @throws UnsupportedEncodingException
*/
public final static String changeCharset(String str, String newCharset) throws UnsupportedEncodingException {
if (str != null) {
// 用默认字符编码解码字符串。
byte[] bs = str.getBytes();
// 用新的字符编码生成字符串
return new String(bs, newCharset);
}
return null;
}
public final static String getDefaultCharSet() throws UnsupportedEncodingException {
OutputStreamWriter writer = new OutputStreamWriter(new ByteArrayOutputStream(), CharsetUtil.UTF_8);
String enc = writer.getEncoding();
return enc;
}
/**
* 字符串编码转换的实现方法
*
* @param str 待转换编码的字符串
* @param oldCharset 原编码
* @param newCharset 目标编码
* @return
* @throws UnsupportedEncodingException
*/
public final static String changeCharset(String str, String oldCharset,
String newCharset) throws UnsupportedEncodingException {
if (str != null) {
// 用旧的字符编码解码字符串。解码可能会出现异常。
byte[] bs = str.getBytes(oldCharset);
// 用新的字符编码生成字符串
return new String(bs, newCharset);
}
return null;
}
/**
* Unicode转换成GBK字符集
*
* @param input 待转换字符串
* @return 转换完成字符串
*/
public final static String toGBKWithUTF8(String input) throws UnsupportedEncodingException {
if (StringUtil.isEmpty(input)) {
return "";
} else {
String s1;
s1 = new String(input.getBytes("ISO8859_1"), "GBK");
return s1;
}
}
/**
* GBK转换成Unicode字符集
*
* @param input 待转换字符串
* @return 转换完成字符串
*/
public final static String toUnicodeWithGBK(String input) throws UnsupportedEncodingException {
if (StringUtil.isEmpty(input)) {
return "";
} else {
String s1;
s1 = new String(input.getBytes("GBK"), "ISO8859_1");
return s1;
}
}
}