#####预习非数值数据的编码方式
作者:互联网
2.5非数值数据的编码表示
2.5.1逻辑值
·逻辑数据:例如“一个n位数据看成由n个一位数据组成,每个取值为0/1;提取一个数据项中的某位进行”置位,清零“等操作”;
·逻辑数据与数值数据的关系:他们都是一串0/1序列,在形式上无差异,需要通过指令的操作码类型来识别他们;
·逻辑运算:按位进行的。“按位与,按位或,逻辑左移去,逻辑右移”,他处理逻辑数据;
2.5.2西文运算符
·西文由拉丁字母,数字,标点符号及一些特殊的符号组成,它们统称为字符;
·字符集中每个字符有一个代码(即二进制编码的0/1序列),构成代码表,简称码表【具有唯一性】;
·广泛西文字符集:ASCII码(见书上p47)
两个规律:1)有利于实现ASCII码与十进制之间的转换 2)方便大小写字母转换。
2.5.3汉字字符
·汉字系统必须处理:输入码,内码,子模点阵码
1·汉字输入码
定义:对每个汉字用相应的按键进行的编码表示方式 ,称为输入码,又称外码。
2.字符集与汉字内码
汉字内码的选择
1)不能有二义性,即不能和ASCII码有相同的编码。
2)要与汉字在字库中的位置有关系,以便于汉字的处理查找。
3)编码尽量短。
3.汉字的字模点阵码和轮廓描述
1)一套汉字的所有字符的形状描述信息集合在一起称为字形信息库,简称字库。
2)汉字字形主要有两种描述方法:字模点阵码和轮廓描述。
3)字模点阵描述是将字库中各个汉字或其他字符的字形(即字模)用一个其元素由0或1组成的方阵来表示。汉字或字符中有黑点的地方是1,空白处用0表示。
4)汉字的轮廓描述是吧汉字笔画的轮廓用一组直线和曲线来勾画,记下直线和曲线的数学描述公式。(有Adobe Typel和TureType两种国际标准)此方法精度高,字形大小可以任意变化。
2.6数据的宽度和存储
2.6.1数据存储的宽度和单位
·数据的宽度通常以字节的(Byte)为基本单位表示
·数据长度单位(如MB,GB,TB等)在表示数据容量和宽度等不同对象时所代表的大小不同
·字用来表示被处理信息的单位,用来度量各种数据类型的宽度。而字长表示进行数据运算、存储和传送的部件的宽度,它反应了计算机处理信息的一种能力。字和字长的长度可以一样,也可以不一样。
·字长通常是指CPU内部用于整数运算的数据通路的宽度,字长等于CPU内部用于整数运算的运算器位数和通用寄存器宽度。
2.6.2数据的存储和排序顺序
·数据的排列
1)大端方式以MSB所在的地址为数据地址,即给定地址存放处的是数据最高有效字方式;
2)小端方式以LSB所在的地址为数据地址,即给定地址存放处的是数据最低有效字方式
2.7数据校验码
2.7.1奇偶校验码(奇偶检测)
·在奇偶校验码中,若两个数据中有奇数位不同,则它们相应的校验位就不同;若有偶数位不同,则虽校验位相同,但至少有两位数据位不同,因而任意两个码字之间至少有两位不同,所以码距d=2;
·只能发现奇数位出错,不能发现偶数位出错,而且也不能确定发生错误的位置,不具纠错能力
2.7.2海明校验码(奇偶检测)
·将有效信息按某种规律分成若干组,每组安排一个校验位,做奇偶测试,就能提供多位检错信息,以指出最大可能是哪位出错,从而将其纠正。实质上,海明校验是一种多重校验
·只要增加少数几个校验位,就能检测出二位同时出错、亦能检测出一位出错并能自动恢复该出错位的正确值的有效手段,后者被称为自动纠错。
2.7.3循环冗余校验码(通过某种数学运算来建立数据和校验之间的约定关系)
·一种具有较强检错、纠错能力的校验码,常用于外存储器的数据校验,主要用于对大批量数据的存储或传输校验;
·可检测出所有奇数位错;可检测出所有双比特的错;可检测出所有小于、等于校验位长度的突发错。
问题
对于效验码还是不太理解,感觉很抽象,不会运用。
希望可以给一些典型例子来加深理解。
标签:字符,校验位,汉字,宽度,出错,数值数据,#####,编码方式,数据 来源: https://www.cnblogs.com/yangranran/p/13707201.html