一篇好文:从原理上搞懂编码——究竟什么是编码?什么是解码?什么是字节流?

 

 

encode,即把字符按照指定的<编码gbk utf-8等>编码成该<编码>所表示的字节

 

decode,即把字节根据指定的<编码gbk utf-8等>解码成该<编码>所表示的字符

 

java中的class文件中的字符都是utf-16编码

 

java中String的getBytes(charset)为编码操作,String的new String(bytes, charset)为解码操作

 

 

下面的图片展示了java中字符串编码的转换过程

上面描述不严谨,是因为用了getBytes()方法,而getBytes()方法无参时的默认编码为gbk(windows平台下的)

unicode与gbk编码对照文件:链接:https://pan.baidu.com/s/1tnI1xpuqXLEElIKxKLEAGw 密码:vp7f

unicode与utf-8编码对照网址:https://unicode-table.com/cn/

版权声明:本文为xiayudashan原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/xiayudashan/p/9353885.html