java编码问题详解

import java.io.UnsupportedEncodingException;
import java.util.Arrays;/*编码: 字符变成字节数组解码: 字节数组变成字符串String --> byte[]  :   str.getBytes()byte[] --> String  :   new String(byte[])*/public class EncodeDemo {public static void main(String[] args) throws UnsupportedEncodingException {/*示例一:用相同的字符集编码和解码(UTF-8)*/String str = "你好";byte[] bytes = str.getBytes("UTF-8");  // 用UTF-8字符集将“你好”转换成字节数组System.out.println(Arrays.toString(bytes));  // 打印编码后的字节数组: [-28, -67, -96, -27, -91, -67]str = new String(bytes, "UTF-8");  // 用UTF-8字符集将字节数组转换成字符串System.out.println(str);    // 你好/*示例二:用UTF-8编码,用UTF-8编码,再用ISO8859-1(拉丁字符集)解码,再用ISO8859-1编码,最后用UTF-8解码,可以再转换成相应的中文。注:ISO8859-1没有中文字符集,会将中文字符转换成不能识别的字符,然后可以再通过编码转换成原来的字节数组,再经过UTF-8解码成原有的中文。*/bytes = str.getBytes("UTF-8");  // 用UTF-8字符集将“你好”转换成字节数组System.out.println(Arrays.toString(bytes));  // [-28, -67, -96, -27, -91, -67]str = new String(bytes, "ISO8859-1");  // ISO8859-1字符集会将一个字节转换为一个汉字,但由于此字符集中没有中文,所以会出现乱码的情况System.out.println(str);  // 打印结果:ä½ å¥½bytes = str.getBytes("ISO8859-1");  // 再将转换后的乱码重新编码,此时又会得到原来的字节数组str = new String(bytes, "UTF-8");  // 再经UTF-8解码以后,又会得到原来的汉字System.out.println(str);  // 打印:你好/*示例三:用GBK编码,用UTF-8解码两种字符集都有汉字编码但是GBK字符集一个汉字会转换成两个字节,而UTF-8字符集有可能是一个,有可能是两个,也有可能是三个那么,UTF-8是怎么确定该字符是由一个字节还是两个或者三个字节来组成的呢?它会根据字节数组的标头来判断:(转换成二进制后)'\u0001' 到 '\u007F' 范围内的所有字符都是用单个字节表示的:即第一个字节以0开头,那么该字符由一个字节组成null 字符 '\u0000' 以及从 '\u0080' 到 '\u07FF' 的范围内的字符用两个字节表示:即第一个字节以110开头,且下一个二进制数以10开头,那么该字符由两个字节组成'\u0800' 到 '\uFFFF' 范围内的 char 值用三个字节表示:即第一个字节以111开头,且后两个字节以10开头,那么该字符由三个字节组成*/bytes = str.getBytes("GBK");  // GBK的汉字编码将一个字符转换为两个字节: [-60, -29, -70, -61]System.out.println(Arrays.toString(bytes));  // [-60, -29, -70, -61]str = new String(bytes, "UTF-8");System.out.println(str);  // 打印结果:���// 注:再将错误的字符用UTF-8编码后,并不能再得到原来的数组,因为在最初的解码时,UTF-8字符集会用一个相似的字符去代替不能正确解码的字符,// 所以再用UTF-8编码时并不能再得到原来的字节数组,继而用原有的字符集解码不能再得到原来的汉字bytes = str.getBytes("UTF-8");System.out.println(Arrays.toString(bytes));  // 打印:[-17, -65, -67, -17, -65, -67, -17, -65, -67]str = new String(bytes, "GBK");System.out.println(str);  // 打印: 锟斤拷锟�}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/557411.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JDK1.8 新特性(全)

JDK1.8 新特性 本文主要介绍了JDK1.8版本中的一些新特性,乃作者视频观后笔记,仅供参考。 jdk1.8新特性知识点: Lambda表达式函数式接口方法引用和构造器调用Stream API接口中的默认方法和静态方法新时间日期API 在jdk1.8中对hashMap等map集…

Java中BigDecimal类介绍及用法

Java中BigDecimal类介绍及用法 Java中提供了大数字(超过16位有效位)的操作类,即 java.math.BinInteger 类和 java.math.BigDecimal 类,用于高精度计算.   其中 BigInteger 类是针对大整数的处理类,而 BigDecimal 类则是针对大小数的处理类.   BigDecimal 类的实现用到了 B…

java中的生产者消费者模式详解

方式 一: Synchronized方式 注:此种方式会造成资源的浪费: 利用锁的notifyAll()方法会将所有的线程都唤醒,会造成资源的浪费 class Resource {private String name;private int count 1;private boolean flag false;public syn…

Python IO 基本编程示例

一. 基本概念 同步和异步 同步:CPU 等待 IO 的执行结果 异步:CPU 不等待 IO 的执行结果 即:同步和异步的区别就是是否等待 IO 执行的结果 回调模式 打个比方:汉堡做好后,服务员跑来告诉你,这就是回调 轮询…

mysql中in的用法详解

mysql中in的用法详解 一、基础用法 mysql中in常用于where表达式中,其作用是查询某个范围内的数据。 select * from where field in (value1,value2,value3,…)当 IN 前面加上 NOT 运算符时,表示与 IN 相反的意思,即不在这些列表项内选择 s…

keyProperty=“id“ 和useGeneratedKeys=“true“作用

keyProperty“id“ 和useGeneratedKeys“true“作用 使用 mysql 自增长序列&#xff0c;新插入一条数据时&#xff0c;怎么得到主键&#xff1f; 加入以下属性即可&#xff1a; useGeneratedKeys“true” keyProperty“id” <insert id"insertSelective" para…

mvn install:install-file将本地一个中央仓库没有的jar包,推到本地仓库----所有依赖不上仓库不能用

mvn install:install-file将本地一个中央仓库没有的jar包&#xff0c;推到本地仓库----所有依赖不上仓库不能用! 前提&#xff1a;maven等环境配置Ok 目标&#xff1a;把中央仓库没有的&#xff0c;部门内部 自研开发的jar&#xff0c;推到私服或者本地服务器&#xff0c;给相…

ZooKeeper 的工作流程

ZooKeeper 集群中的角色简介&#xff1a; Leader&#xff1a; 负责发起投票和决议&#xff0c;更新系统状态Follower&#xff1a;用于接收客户端请求并向客户端返回结果&#xff0c;在选主过程中参与投票Observer&#xff1a; 可以接收客户端连接&#xff0c;将写请求转发给 L…

TikTok真题第4天 | 1366. 通过投票对团队排名、1029.两地调度、562.矩阵中最长的连续1线段

1366. 通过投票对团队排名 题目链接&#xff1a;rank-teams-by-votes/ 解法&#xff1a; 这道题就是统计每个队伍在每个排名的投票数&#xff0c;队伍为A、B、C&#xff0c;则排名有1、2、3&#xff0c;按照投票数进行降序排列。如果有队伍在每个排名的投票数都一样&#xf…

idea Maven图标的使用

idea Maven图标的使用

动态规划算法之数塔问题

package cn.gldwolf.bigdata;/* 3 12 56 23 4 78 34 69 34 19 12 3 54 12 34 *//* 思路&#xff1a;从最底层往上走&#xff0c;判断下层两个节点中的最大值&#xff0c; 并将最大值与上层节点中的值相加得到这一步的最大值&#xff0c; 将最大值保存到新的数塔中 …

Log4j 配置详解

1. Log4j 简介 Log4j 有三个主要的组件&#xff1a; Loggers&#xff08;记录器&#xff09;&#xff1a;日志类别和级别 Appenders&#xff08;输出源&#xff09;&#xff1a;日志要输出的地方 Layouts&#xff08;布局&#xff09;&#xff1a;日志以何种形式输出 1.1 Log…

Iterator主要有三个方法:hasNext()、next()、remove()详解

Iterator主要有三个方法&#xff1a;hasNext()、next()、remove()详解 一、Iterator的API 关于Iterator主要有三个方法&#xff1a;hasNext()、next()、remove()hasNext:没有指针下移操作&#xff0c;只是判断是否存在下一个元素next&#xff1a;指针下移&#xff0c;返回该指…

Java获取登录用户IP地址

Java获取登录用户IP地址 /*** param * return * throws * description * author wqd* date 2021/9/21 13:45*/public static String getIpAddr(HttpServletRequest request) {String ip request.getHeader("x-forwarded-for");if (ip null || ip.length() 0 || &q…

Kafka Shell 基本操作

1. 启动集群每个节点的进程 nohup kafka-server-start.sh \ /home/hadoop/apps/kafka_2.11-1.1.0/config/server.properties \ 1>~/logs/kafka_std.log \ 2>~/logs/kafka_err.log &2. 创建 Topic 解释说明&#xff1a; –create --> 创建 Topic 的选项 –zookee…

Spark 简介

1. 什么是 Spark 官网&#xff1a;http://spark.apache.org Spark 是一个快速、通用、可扩展的大数据分析引擎。 Spark 是基于内存计算的大数据并行计算框架 1.1 Spark 的特点 快&#xff1a;与 Hadoop 的 MapReduce 相比&#xff0c;Spark 基于内存的运算要快 100 倍以上&a…

Linux环境下安装Mysql5.7

本文记录下我近期在Linux环境下安装Mysql5.7的实践经历。 服务器版本Mysql版本Centos 7.65.7.32 1. 下载Mysql 下载地址&#xff1a;https://downloads.mysql.com/archives/community/ 进入页面后选择你需要的版本进行下载&#xff0c;这里提供了2种格式&#xff1a;tar.gz和…

Redis 入门及实战

目录 1. Redis 基本概念 2. Redis 的优势 3. Redis 适用场景 4. Redis-3.2.6 安装(未整理)与测试 5. 使用 Redis 的 Java API 客户端——Jedis 6. 数据结构 6.1 String -- 字符串 6.1.1 String 使用概述 6.1.2 String 常用操作 6.1.3 String 使用案例 6.2 List -- 列…

HBase 简介

HBase 是一个通过大量廉价机器解决海量数据的调整存储和读取的分布式数据库解决方案 HBase 的特点&#xff1a; 高并发&#xff0c;易扩展&#xff0c;解决海量数据集的随机实时增删改查HBase 本质依然是 Key-Value 数据库&#xff0c;不支持 join 等复杂操作不支持复杂的事务…

Flink官网自学笔记

1. What is Apache Flink? Apache Flink 是一款用来进行分布式流数据和批数据处理的开源平台。Apache Flink 是一个对有界数据流和无界数据流进行有状态计算的框架和分布式处理引擎。Flink 被设计用于在所有常见的集群环境中运行&#xff0c;以内存中的速度和任意规模进行计算…