Unicode等价性
作者:互联网
Unicode等价性(Unicode equivalence)是为和许多现存的标准能够相容,Unicode(统一码)包含了许多特殊字符。在这些字符中,有些在功能上会和其它字符或字符序列等价。因此,Unicode将一些码位序列定义成相等的。Unicode提供了两种等价概念:标准等价和相容等价。前者是后者的一个子集。例如,字符n后接著组合字符~会(标准和相容)等价于Unicode字符ñ。而合字ff则只有相容等价于两个f字符。
Unicode正规化是文字正规化的一种形式,是指将彼此等价的序列转成同一列序。此序列在Unicode标准中称作正规形式。对于每种等价概念,Unicode又定义两种形式,一种是完全合成的,一种是完全分解的。因此,最后会有四种形式,其缩写分别为:NFC、NFD、NFKC、NFKD。对于Unicode的文字处理程式而言,正规化是很重要的。因为它影响了比较、搜寻和排序的意义。
标签:字符,等价,正规化,相容,Unicode,序列 来源: https://www.cnblogs.com/cdaniu/p/15258328.html