汉字编码与格式化输入输出
作者:互联网
概念
1. 汉字编码
为每个汉字编上唯一的代码,方便计算机识别与处理。
2. 国标码
1980年,我国颁布了汉字编码的标准:GB2312-80《信息交换汉字编码字符集》,简称国标码。国标码是4位十六进制数组成。
3. 区位码
GB2312是一种汉字编码方式,具体由区位码实现,GB2312将所有汉字编入一个94*94的二维表中,行和列共同定位一个字,行就是“区”,列就是“位”,合并就为区内码。区位码是一组4位十进制的数,前两位是区码,后两位是位码。
例如:
譬如 “万” 字在 45 区 82 位, 所以 “万” 字的区位码是: 4582.
00-09 区(682个): 是符号、数字、英文字符...制表符等; 10-15 区: 空白, 留待扩展; 16-55 区(3755个): 常用汉字(也有叫一级汉字), 按拼音排序; 56-87 区(3008个): 非常用汉字(也有叫二级汉字), 这是按部首排序的; 88-94 区: 空白, 留待扩展
4. 机内码
机内码是微软为了解决汉字编码与ASCLL编码冲突。从而规定把每个字节的最高位都从 0 换成 1(这之前它们都是 0),或者说把每个字节(区和位)都再加上 80H(128的十六进制表示),从而得到 “机内码”,简称"
概念简介
基础学习阶段:键盘输入,屏幕输出。
从键盘输入数据,以及实现简单的人机交互。
通过格式化的方式输出 整数、浮点数、字符、字符串,以及对数据进行对齐。
PrintWriter
Scanner
在inputStream或Reader上建立Scanner对象可以从流中的文本中解析出以文本表达的各种基本类型
next...()
Stream/Reader/Scanner
标签:机内码,格式化,Scanner,输入输出,GB2312,汉字,区位码,汉字编码 来源: https://www.cnblogs.com/x3449/p/16409017.html