再谈java编码
一篇好文:从原理上搞懂编码——究竟什么是编码?什么是解码?什么是字节流?
encode,即把字符按照指定的<编码gbk utf-8等>编码成该<编码>所表示的字节
decode,即把字节根据指定的<编码gbk utf-8等>解码成该<编码>所表示的字符
java中的class文件中的字符都是utf-16编码
java中String的getBytes(charset)为编码操作,String的new String(bytes, charset)为解码操作
下面的图片展示了java中字符串编码的转换过程
上面描述不严谨,是因为用了getBytes()方法,而getBytes()方法无参时的默认编码为gbk(windows平台下的)
unicode与gbk编码对照文件:链接:https://pan.baidu.com/s/1tnI1xpuqXLEElIKxKLEAGw 密码:vp7f
unicode与utf-8编码对照网址:https://unicode-table.com/cn/