字符编码
作者:互联网
day03:2020.9.2
字符编码:
由于计算机只能识别二进制数据,无法识别8种基本数据类型中的char类型,字符类型其实表示的是汉字,计算机无法识别,因此设计了一种称为字符编码的规则来用二进制符号表示字符(由单引号括住,包括英文字符和中文字符等),这样字符可以用二进制数来表示。
字符------字符编码---->二进制
二进制------字符解码---->字符
计算机为什么能显示中文?汉化包的作用
将二进制与中文相互对应得转化规则打成一个包放在底层,底层根据汉化包的编码和解码规则来分析二进制符号从而解码成中文。
字符编码的种类
类型 | 介绍 |
---|---|
ASCLL码 | 采用一个字节编码,主要针对英文编码 |
ISO-8859-1 | 对西欧语言进行编码,和ASCLL兼容 |
GB2321/GBK/GB18030 | 主要是汉字编码 |
unicode | 全球统一的包括所有语言文字的编码:UTF-8、UTF-16、UTF-32 |
big5 | 支持繁体中文编码 |
注:java语言采用的是unicode编码,所以标识符可以使用中文。
(1)ASCLL码:计算机识别英文。
常用字符 | 对应ASCLL码 |
---|---|
‘a’ | 97 |
‘A’ | 65 |
‘0’ | 48 |
01100001------按照ASCLL解码---->‘a’
‘a’---------按照ASCLL编码-------->01100001
注:编码和解码时必须采用同一套字典对照表,不会出现乱码;否则会出现乱码
**实践:**查看当前网页的编码格式:F12
在控制台console中输入docunmen.charset。显示UTF-8编码
标签:编码,UTF,字符,二进制,解码,ASCLL 来源: https://blog.csdn.net/weixin_42792309/article/details/108361261