其他分享
首页 > 其他分享> > 汉字编码与格式化输入输出

汉字编码与格式化输入输出

作者:互联网

概念

1. 汉字编码
为每个汉字编上唯一的代码,方便计算机识别与处理。

2. 国标码
1980年,我国颁布了汉字编码的标准:GB2312-80《信息交换汉字编码字符集》,简称国标码。国标码是4位十六进制数组成。

3. 区位码
GB2312是一种汉字编码方式,具体由区位码实现,GB2312将所有汉字编入一个94*94的二维表中,行和列共同定位一个字,行就是“区”,列就是“位”,合并就为区内码。区位码是一组4位十进制的数,前两位是区码,后两位是位码。
例如:
譬如 “万” 字在 45 区 82 位, 所以 “万” 字的区位码是: 4582.

    00-09 区(682个): 是符号、数字、英文字符...制表符等;
    
    10-15 区: 空白, 留待扩展;
    
    16-55 区(3755个): 常用汉字(也有叫一级汉字), 按拼音排序;
    
    56-87 区(3008个): 非常用汉字(也有叫二级汉字), 这是按部首排序的;

    88-94 区: 空白, 留待扩展

4. 机内码

机内码是微软为了解决汉字编码与ASCLL编码冲突。从而规定把每个字节的最高位都从 0 换成 1(这之前它们都是 0),或者说把每个字节(区和位)都再加上 80H(128的十六进制表示),从而得到 “机内码”,简称"

 

概念简介

基础学习阶段:键盘输入,屏幕输出。
从键盘输入数据,以及实现简单的人机交互。
通过格式化的方式输出 整数、浮点数、字符、字符串,以及对数据进行对齐。

PrintWriter

Scanner

在inputStream或Reader上建立Scanner对象可以从流中的文本中解析出以文本表达的各种基本类型

next...()

 Stream/Reader/Scanner

 

标签:机内码,格式化,Scanner,输入输出,GB2312,汉字,区位码,汉字编码
来源: https://www.cnblogs.com/x3449/p/16409017.html