其他分享
首页 > 其他分享> > 计算机中的信息表示

计算机中的信息表示

作者:互联网

数的表示

通常情况下,一个数分位有符号和无符号两种类型。

如果将一个数当作有符号数处理时,则该数的最高位作为符号位。如果符号位为0,则表示该数为正数,如果符号位为1,则表示该数为负数。

对于已知位数的二进制数,它能表示的数的大小范围时有限的。如果是n为有符号二进制数,它能够表示的十进制数的范围是-2n~2n-1-1,如果是n位无符号二进制数,它能够表示的十进制数的范围是0~2n-1

例如:

8位有符号数能够表示的十进制数范围是-128~127,8位无符号数能够表示的十进制数范围是0~255;

16位有符号能够表示的十进制数范围是-32768~32767,16位无符号数能够表示的十进制数范围是0~65535;

小数一般用定点数或浮点数来表示。

原码、反码、补码

正数的原码是转换为二进制位的数,其反码、补码于原码相同

 

负数:

原码是其绝对值转换成二进制位然后在高位补1(负数最高位)的数;

反码是将原码的符号位除外,其余位取反;

补码是其反码的最低位加一。

 


 

信息编码

1、字符编码

西文字符编码常用的

ACSII:采用7位二进制编码,可以表示2即128个字符,占1B。

常见的ASCII码值:空格32   回车13    “A”65   “a“97 ”  “0”48

还有EBCDIC(21进制交换码),用于大型机器中

 

2.汉字编码

汉字输入码:利用键盘输入汉字时对汉字的编码。有音码类,形码类

 

3.汉字国标码和区位码

国家标准汉字编码(国标码GB2312—80),称汉字交换码,简称GB码。

国标码中每个汉字用两个字节表示,每个字节最高位为0。

根据国标码编码规定,所有国标汉字和字符组成一个94*94的矩阵,每一行称为一个“区”,每一列称为一个“位”,即94个区94个列,由区号和位号共同构成区位码,将每个区和每个位分别加上20H,就构成了国标码。例如,“大”位于20区83位,其区位码为2083,十六位进制区位码表示为1453H,国标码为3473H。

国标码=区位码+2020H;

机内码=区位码+A0A0H;

4.汉字机内码

汉字机内码:汉字被计算机系统内部处理和存储而使用的编码。一个汉字国标码占两个字节,每个字节的最高位为“0”,西文字符的机内代码是7位ASCII码,最高位也是“0”。为了区分计算机内部汉字编码和ASCII码,将国标的每一个字节的最高位由“0”变成“1”,即每个字节加80H。如“大”的国标码3473H,机内码B4F3H。

机内码=国标码+8080H;

 

5.汉字字形码

汉字字形码又称为汉字字模,用于汉字显示输出和打印输出。汉字字形码通常有两种表现方式:点阵和矢量。

 

用点阵表示字形时,汉字字形指的就是这个汉字字形点阵的代码。

点阵字模所占字节数=(点阵行数*点阵列数)/8

点阵字模:不易缩放,易失真。

 

矢量表示方式存储的是描述汉字字形的轮廓特征。矢量化字形描述与最终汉字显示的大小、分辨率无关。

矢量字模:易缩放,不易失真。


 

Unicode字符集编码

Unicode是一个国际编码标准。

面前使用的Unicode版本对应UCS-2,使用16位的编码空间,最多表示216(65536)个字符,基本可以满足各种语言使用。

对Unicode的转换格式分为3种格式:UTF-8、UTF-16、UTF-32

 

标签:表示,编码,计算机,符号,区位码,汉字,国标码,信息
来源: https://www.cnblogs.com/ao555/p/16589366.html