2021-04-27
作者:互联网
编码方式—信源编码
信源编码的介绍
信源编码是一种以提高通信有效性为目的而对信源符号进行的变换,或者说为了减少或消除信源冗余度而进行的信源符号变换,具体说,就是针对信源输出符号序列的统计特性来寻找某种方法,把信源输出符号序列变换为最短的码字序列,使后者的各码元所载荷的平均信息量最大,同时又能保证无失真地恢复原来的符号序列.编码结果是对输入信息进行编码,优化信息和压缩信息并且打成符合标准的数据包.信源编码的作用之一是,即通常所说的数据压缩;作用之二是将信源的模拟信号转化成数字信号,以实现模拟信号的数字化传输.
最原始的信源编码就是莫尔斯电码,另外还有ASCII码和电报码都是信源编码.但现代通信应用中常见的信源编码方式有:Huffman编码、算术编码、L-Z编码,这三种都是无损编码,另外还有一些有损的编码方式.信源编码的目标就是使信源减少冗余,更加有效、经济地传输,最常见的应用形式就是压缩. 另外,在数字电视领域,信源编码包括通用的MPEG—2编码和H.264(MPEG—Part10 AVC)编码等.
一种以提高通信有效性为目的而对信源符号进行的变换;为了减少或消除信源剩余度而进行的信源符号变换.为了减少信源输出符号序列中的剩余度、提高符号的平均信息量,对信源输出的符号序列所施行的变换.具体说,就是针对信源输出符号序列的统计特性来寻找某种方法,把信源输出符号序列变换为最短的码字序列,使后者的各码元所载荷的平均信息量最大,同时又能保证无失真地恢复原来的符号序列.
基于层次树的集分割(SPIHT)信源编码方法是基于EZW而改进的算法,它是有效利用了图像小波分解后的多分辨率特性,根据重要性生成比特流的一个渐进式编码.这种编码方法,编码器能够在任意位置终止编码,因此能够精确实现一定目标速率或目标失真度。同样,对于给定的比特流,解码器可以在任意位置停止解码,而仍然能够恢复由截断的比特流编码的图像.而实现这一优越性能并不需要事先的训练和预存表或码本,也不需要任何关于图像源的先验知识.
既然信源编码的基本目的是提高码字序列中码元的平均信息量,那么,一切旨在减少剩余度而对信源输出符号序列所施行的变换或处理,都可以在这种意义下归入信源编码的范畴,例如过滤、预测、域变换和数据压缩等.当然,这些都是广义的信源编码.
一般来说,减少信源输出符号序列中的剩余度、提高符号平均信息量的基本途径有两个:①使序列中的各个符号尽可能地互相独立;②使序列中各个符号的出现概率尽可能地相等.前者称为解除相关性,后者称为概率均匀化.
第三代移动通信中的信源编码包括语音压缩编码、各类图像压缩编码及多媒体数据压缩编码.
信源编码定理:
不同类型的信源,是否存在有每种信源的最佳的信源编码,这通常是用信源编码定理来表示.最简单、最有实用指导意义的信源编码定理是离散、无记忆型信源的二进制变长编码的编码定理.它证明,一定存在一种无失真编码,当把N个符号进行编码时,平均每个符号所需二进码的码长满足.
其中H(U)是信源的符号熵(比特),这就是说,最佳的信源编码应是与信源信息熵H(U)统计匹配的编码,代码长度可接近符号熵.这一结论不仅表明最佳编码存在,而且还给出具体构造码的方法,即按概率特性编成不等长度码.对不同类型信源,如离散或连续、无或有记忆、平稳或非平稳、无或限定失真等,可以构成不同的组合信源,它们都存在各自的信源编码定理.但它们中绝大部分仅是属于理论上的存在性定理,这给具体寻找和实现不同类型信源的信源编码,带来了相当的难度.
信源编码的分类:
信源编码根据信源的性质进行分类,则有信源统计特性已知或未知、无失真或限定失真、无记忆或有记忆信源的编码;按编码方法进行分类可分为分组码或非分组码、等长码或变长码等.然而最常见的是讨论统计特性已知条件下,离散、平稳、无失真信源的编码,消除这类信源剩余度的主要方法有统计匹配编码和解除相关性编码.比如仙农码、费诺码、赫夫曼码,它们属于不等长度分组码,算术编码属于非分组码;预测编码和变换编码是以解除相关性为主的编码.对限定失真的信源编码则是以信息率失真R(D)函数为基础,最典型的是矢量量化编码.对统计特性未知的信源编码称为通用编码.
信源编码的应用:
以简单的数据压缩为例即可说明信源编码的应用.若有一离散、无失真、无记忆信源,它含有五种符号U0~U4及其对应概率Pi,对它进行两种编码:等长码和最佳赫夫曼码.
其中,等长码的平均码长:=3,即三位码.若采用赫夫曼编码,平均码长,即不足两位码.这就是说,数据压缩了以上.
1.在现代无线通信中的应用:信源编码是以提高通信有效性为目的的编码.通常通过压缩信源的冗余度来实现.采用的一般方法是压缩每个信源符号的平均比特数或信源的码率.
2.在超宽带中的应用:与信道编码联合,使重要信息得到更好的保护,使解码质量提高.例如不等差错保护,相对于同差错保护而言,不等差错保护根据码流的不同部分对图像重建质量的重要性不同,而采用不同的信道保护机制,是信源信道联合编码的一个重要应用,其信源编码主要采用嵌入式编码.
信源编码的专业表述:
既然信源编码的基本目的是提高码字序列中码元的平均信息量,那么,一切旨在减少剩余度而对信源输出符号序列所施行的变换或处理,都可以在这种意义下归入信源编码的范畴,例如过滤、预测、域变换和数据压缩等.当然,这些都是广义的信源编码.
一般来说,减少信源输出符号序列中的剩余度、提高符号平均信息量的基本途径有两个:1.使序列中的各个符号尽可能地互相独立;2.使序列中各个符号的出现概率尽可能地相等.前者称为解除相关性,后者称为概率均匀化.
信源编码的一般问题可以表述如下:若某信源的输出为长度等于M的符号序列集合式中符号A为信源符号表,它包含着K个不同的符号,A={ɑk|k=1,…,K},这个信源至多可以输出KM个不同的符号序列.记‖U‖=KM.所谓对这个信源的输出进行编码,就是用一个新的符号表B的符号序列集合V来表示信源输出的符号序列集合U.若V的各个序列的长度等于 N,即 式中新的符号表B共含L个符号,B={bl|l=1,…,L}.它总共可以编出LN个不同的码字.类似地,记‖V‖=LN.为了使信源的每个输出符号序列都能分配到一个独特的码字与之对应,至少应满足关系 ‖V‖=LN≥‖U‖=KM或者 N/M≥logK/logL .
假若编码符号表B的符号数L与信源符号表A的符号数K相等,则编码后的码字序列的长度N必须大于或等于信源输出符号序列的长度M;反之,若有N=M,则必须有L≥K.只有满足这些条件,才能保证无差错地还原出原来的信源输出符号序列(称为码字的唯一可译性).可是,在这些条件下,码字序列的每个码元所载荷的平均信息量不但不能高于,反而会低于信源输出序列的每个符号所载荷的平均信息量.这与编码的基本目标是直接相矛盾的.下面的几个编码定理,提供了解决这个矛盾的方法.它们既能改善信息载荷效率,又能保证码字唯一可译.
离散无记忆信源的定长编码定理
对于任意给定的ε>0,只要满足条件 N/M≥(H(U)+ε)/logL
那么,当M足够大时,上述编码几乎没有失真;反之,若这个条件不满足,就不可能实现无失真的编码.式中H(U)是信源输出序列的符号熵.通常,信源的符号熵H(U)<logK,因此,上述条件还可以表示为【H(U)+ε】/logL≤N/M≤logK/logL .
特别,若有K=L,那么,只要H(U)<logK,就可能有N<M,从而提高信息载荷的效率.由上面这个条件可以看出,H(U)离logK越远,通过编码所能获得的效率改善就越显著.实质上,定长编码方法提高信息载荷能力的关键是利用了渐进等分性,通过选择足够大的M,把本来各个符号概率不等[因而H(U)<logK]的信源输出符号序列变换为概率均匀的典型序列,而码字的唯一可译性则由码字的定长性来解决.
离散无记忆信源的变长编码定理
变长编码是指V的各个码字的长度不相等.只要V中各个码字的长度 Ni(i=1,…,‖V‖)满足克拉夫特不等式这‖V‖个码字就能唯一地正确划分和译码.离散无记忆信源的变长编码定理指出:若离散无记忆信源的输出符号序列为,式中 A={ɑk|k=1,…,K},符号熵为H(U),对U进行唯一可译的变长编码,编码字母表B的符号数为L,即B={bl|l=1,…,L},那么必定存在一种编码方法,使编出的码字Vi=(vi1,…,viNi),(i=1,…,‖V‖),具有平均长度嚻:MH(U)/logL≤嚻<MH(U)/logL+1 .
若L=K,则当H(U)<logK=logL时,必有嚻<M;H(U)离logK越远,则嚻越小于M.
具体实现唯一可译变长编码的方法很多,但比较经典的方法还是仙农编码法、费诺编码法和霍夫曼编码法.其他方法都是这些经典方法的变形和发展.所有这些经典编码方法,都是通过以短码来表示常出现的符号这个原则来实现概率的均匀化,从而得到高的信息载荷效率;同时,通过遵守克拉夫特不等式关系来实现码字的唯一可译.
霍夫曼编码方法的具体过程是:首先把信源的各个输出符号序列按概率递降的顺序排列起来,求其中概率最小的两个序列的概率之和,并把这个概率之和看作是一个符号序列的概率,再与其他序列依概率递降顺序排列(参与求概率之和的这两个序列不再出现在新的排列之中),然后,对参与概率求和的两个符号序列分别赋予二进制数字0和1.继续这样的操作,直到剩下一个以1为概率的符号序列.最后,按照与编码过程相反的顺序读出各个符号序列所对应的二进制数字组,就可分别得到各该符号序列的码字.
例如,某个离散无记忆信源的输出符号序列及其对应的概率分布为对这些输出符号序列进行霍夫曼编码的具体步骤和结果如表.由表中可
以看出,在码字序列中码元0和1的概率分别为10/21和11/21,二者近乎相等,实现了概率的均匀化.同时,由于码字序列长度满足克拉夫特不等式 2×2-2+3×2-3+2×2-4=1 .
因而码字是唯一可译的,不会在长的码字序列中出现划错码字的情况.
以上几个编码定理,在有记忆信源或连续信源的情形也有相应的类似结果.在实际工程应用中,往往并不追求无差错的信源编码和译码,而是事先规定一个译码差错率的容许值,只要实际的译码差错率不超过这个容许值即认为满意(见信息率-失真理论和多用户信源编码).
信源编码的分析
信源编码和信道编码的区别:
信源编码的作用之一是设法减少码元数目和降低码元速率,即通常所说的数据压缩.码元速率将直接影响传输所占的带宽,而传输带宽又直接反映了通信的有效性.作用之二是,当信息源给出的是模拟语音信号时,信源编码器将其转换成数字信号,以实现模拟信号的数字化传输.模拟信号数字化传输的两种方式:脉冲编码调制(PCM)和增量调制(ΔM),信源译码是信源编码的逆过程.1.脉冲编码调制(PCM)简称脉码调制:一种用一组二进制数字代码来代替连续信号的抽样值,从而实现通信的方式.由于这种通信方式抗干扰能力强,它在光纤通信、数字微波通信、卫星通信中均获得了极为广泛的应用.增量调制(ΔM):将差值编码传输,同样可传输模拟信号所含的信息.此差值又称“增量”,其值可正可负.这种用差值编码进行通信的方式,就称为“增量调制”,缩写为DM或ΔM,主要用于军方通信中.信源编码为了减少信源输出符号序列中的剩余度、提高符号的平均信息量,对信源输出的符号序列所施行的变换.具体说,就是针对信源输出符号序列的统计特性来寻找某种方法,把信源输出符号序列变换为最短的码字序列,使后者的各码元所载荷的平均信息量最大,同时又能保证无失真地恢复原来的符号序列.信道编码的目的:信道编码是为了保证信息传输的可靠性、提高传输质量而设计的一种编码.它是在信息码中增加一定数量的多余码元,使码字具有一定的抗干扰能力.信道编码的实质:信道编码的实质就是在信息码中增加一定数量的多余码元(称为监督码元),使它们满足一定的约束关系,这样由信息码元和监督码元共同组成一个由信道传输的码字.信源编码很好理解,比如你要发送一个图形,必须把这个图像转成0101的编码,这就是信源编码.
信道编码数字信号在信道传输时,由于噪声、衰落以及人为干扰等,将会引起差错.为了减少差错,信道编码器对传输的信息码元按一定的规则加入保护成分(监督元),组成所谓“抗干扰编码”.接收端的信道译码器按一定规则进行解码,从解码过程中发现错误或纠正错误,从而提高通信系统抗干扰能力,实现可靠通信.信道编码是针对无线信道的干扰太多,把你要传送的数据加上些信息,来纠正信道的干扰.信道编码数字信号在信道传输时,由于噪声、衰落以及人为干扰等,将会引起差错.为了减少差错,信道编码器对传输的信息码元按一定的规则加入保护成分(监督元),组成所谓“抗干扰编码”.接收端的信道译码器按一定规则进行解码,从解码过程中发现错误或纠正错误,从而提高通信系统抗干扰能力,实现可靠通信.
信源编码信号:例如语音信号(频率范围300-3400Hz)、图象信号(频率范围0-6MHz)……基带信号(基带:信号的频率从零频附近开始).在发送端把连续消息变换成原始电信号,这种变换由信源来完成.
信道编码信号:例如二进制信号、2PSK信号……已调信号(也叫带通信号、频带信号).这种信号有两个基本特征:一是携带信息;二是适应在信道中传输,把基带信号变换成适合在信道中传输的信号完成这样的变换是调制器.
信源编码是对输入信息进行编码,优化信息和压缩信息并且打成符合标准的数据包.信道编码是在数据中加入验证码,并且把加入验证码的数据进行调制.两者的作用完全不一样的.信源编码是指信号来源的编码,主要是指从那个接口进来的.信道编码是说的信号通道的编码,一般是指机内的电路.总的来说:信源编码是对视频、音频,数据进行的编码,即对信息进行编码以便处理,而信道编码是指在信息传输的过程中对信息进行的处理.
标签:编码,码元,27,04,符号,信源,2021,码字,序列 来源: https://blog.csdn.net/qq_44354408/article/details/116209772