对于《数字图像处理》前三章浅显摘抄及其理解
作者:互联网
第一章 绪论
- 1.4 数字图像处理的基本步骤
- 数字图像处理分为两个类别:输入和输出都是图像;输入是图像但是输出是图像的属性。
- 第一步 是图像获取(还包括简单图像改变 图像的预处理),即图像的输入。
- 第二步 是对图像进行处理,处理的方式有多种 但都是为了方便,为了满足人们的需求。
- 有图像增强,图像增强是在特定应用中的特殊处理方式让其能够更加容易的被处理;
- 有图像复原,比较偏向客观,以图像退化或概率模型为基础,但什么是好的增强也是偏向人的主观;
- 彩色图像处理,主要针对图像中的彩色;
- 小波处理,用不同的分辨率来描述一幅图像,图像被细分为小的区域;
- 压缩,减小图像存储量或降低传输带宽的处理;
- 形态学处理,提取图像的分量,分量能够描述图像的形状;
- 分割,将图像分割为图像的组成部分和目标。
- 表示与描述,针对的对象是未加工的像素数据,这些数据是区域的边界或者区域的一部分。这通常出现在分割之后,表示是将图像区域进行表示,根据输出的需要分成边界或者整个区域。即将数据区域特征更加突出。描述又称特征选择,提取特征,得到所需求的定向信息,或区分出其他数据的特征量的方法。
- 识别,基于目标的描述给该目标赋予标志。
- 第三步 是图像的输出,但是图像的输出并非是在所有图像处理之后的,我们可以在任意一步图像处理之后查看结果。
- 图像处理系统的构成
- 计算机是最主要的,承载着所有图像处理系统,包括其硬件,软件,显示器,存储器,硬拷贝。
- 图像感知(图像的获取)第一个部件是物理设备,主要的获取图像的来源,并且要对获取目标敏感。第二个部件是数字化器,是能够将物理感知装置的输出转化为数字数据。
- 简单的图像处理,这一步由硬件进行操作。图像处理硬件包括数字化器以及其他执行原始操作的硬件,该部分主要对数据数字化并进行一些简单操作,但要求速度快,拥有快速吞吐数据的能力。
- 图像处理软件的作用是执行着特定任务,即我们输出的数据的前置步骤。并且优秀的软件允许用户编写程序,来满足并执行客户的特定需求。
- 存储器有三个类别,短期存储;在线存储;档案存储。短期存储一种是利用计算机内存;另一种是用专用的存储板,被称为帧储存,可以单帧或者多帧的快速访问,且允许瞬时对图像进行改动。在线储存一般以硬盘或者光介质存储。档案存储,要求以大容量存储,且无需频繁访问,一般放在磁带或者光盘中。
- 图像显示器主要是彩色电视显示器。监视器由图像和图形显示卡的输出驱动,是计算机的一部分。
- 硬拷贝,包括激光打印机,胶片相机,热敏装置,喷墨装置和数字单元。这些硬拷贝设备都是为了离开计算机后,还能够显示出图像的样子,是一种图像呈现的介质。
- 网络是计算机运行的必备条件。
- 第二章 数字图像基础
- 2.1&2.2视觉感知要素
- 前两节介绍了人眼的结构以及光的属性,人们对光的划分。
- 2.3图像感知和获取
- 第三节主要关注的是图像感知以及生成的主要方式。
- 2.3.1首先是图像感知,第一种方式是用单个传感器获取图像,比如说光二极管。但为了产生二维图像,必须要在传感器和成像区域之间有X,Y方向上的相对位移。书上给出的例子是,成像区域在一个鼓上,鼓能够进行传动,而传感器可以在鼓的半径方向上移动,这样就能够得到高分辨率的图像。
- 2.3.2第二种方法是使用条带传感器获取图像,该种方法多是由内嵌传感器形式组成的传感器带。传感器群能够在一个方向上提供成像单元,垂直于传感器带的运动在另一方向上成像。还有一种排列方式是以圆环形方式安装的传感器,这样可以得到三维物体的剖面(二维平面)。比如利用X光提供照射,射线源对面的传感器收集穿过的X光能量,这样就能产生图像。
- 2.3.3第三种方法是传感器阵列获取图像,该方式就是将传感器整齐的排列形成稳定的方阵,并且传感器是CCD传感器,该类传感器杂讯少,感光性好,分辨率高。所以这种方法是不需要传感器的移动,只需要我们对准目标就行。
- 但是图像重建并非单单靠传感器就能够完成,我们还要依靠重建算法,将我们获取的外界信号转化为电信号,然后输出电压或者电流的波形。
- 2.4图像的取样和量化
- 前面我们已经了解了我们是如何通过外界的能量转化为电路中的信号,而这些信号的幅值以及空间特性都与感知的物理现象有关。接下来我们要了解的是如何用收集的电信号转化为数字信号,而转化的方式包括两种处理方式:采样和量化。
- 2.4.1取样和量化的基本概念
- 我们对于一幅连续的图像,我们在得知其感知后的信号图像,我们对信号图像的坐标值还有幅值都进行数字化,对坐标值叫做采样,幅值叫做量化。
- 为了对采集的图像进行取样,我们等间距采样,每个坐标值正上方的信号图像作为采样样本,这样离散的样本就构成了取样函数。但是样本的幅值是连续的,所以我们还要对幅值转化成离散量,对幅值进行分块,每一部分给一个特定的值。做完这些后,从图像的顶部开始执行该过程,会产生另一个二维图像。但不同的是,该图像是由更加大块的像素块组成,而量化的精细程度依赖于取样信号的噪声,如果足够精细,能够保证即使在放大许多倍的情况下还能与原图像一致。
- 取样的方式取决于我们生成图像的传感器配置。如果在一幅两个坐标上和幅值上都能够连续的图像,我们采用之前所说的单个传感器与机械运动结合,那么空间采样我们可以依靠机械运动做到精细,所以对于该种方法的限制只有其他因素导致,如系统的光学元件的质量。
- 在利用带状传感器来获取图像时,我们一个方向上的成像单元并不能运动,所以该种方法有着量化上限,并不能做到足够的精细。
- 在使用传感阵列时,阵列是无法移动的,所以采样以及量化的方式都已经被决定,所以精细度是被确定的。数字图像的质量取决于采样和量化的样本数和灰度级,但也依赖于我们对于图像的感知方式。
- 2.4.4 图像内插
- 图像的内插,是图像重采样法中的一种。就是将离散的图像样本,我们补全其周围的数据,这种补全是一种估计,将其补成一个连续函数。
- 其中最近邻内插法,是将图像样本的周围的位置的灰度由我们已知的最近的图像样本的灰度赋值,这种方法极其简单,但是有着不可弥补的缺陷,在一些不平滑的直角边缘,会产生严重的失真。另一种更实用的方法是双线性内插法,我们对于被计算的位置的灰度是由最近的四个位置的灰度表示出的。另一种更加复杂的方法是双三次内插,包括了最近的十六个邻点。
- 2.6数字图像处理中所用数学工具的介绍
- 矩阵可以表示图像的构成,所以图像之间的操作可以用矩阵理论来执行。
- 2.6.2线性操作与非线性操作
- 即多个矩阵之间的操作可以像数字一样直接相加减,就像matlab中的“.+”“.×”等。
- 非线性操作,就是在矩阵中求最大值,而最大值的相加减并非是线性的相加减。
- 后面的内容大多数介绍了多种方法来处理图像,这些方法都离不开数学,都是数学在计算机上的应用。
- 第三章 灰度变换与空间滤波
- 3.1.1灰度变换和空间滤波基础
- 该节讨论的图像处理的方式全都是在空间域下进行,即简单包含图像的空间,没有进行任何域变换。 g = T f ,f是输入图像,g是输出图像,T是定义在空间域上的一种算法。
- 还是强调了,图像增强并没有固定的方法,而是要针对要求才能进行最优的变换,而且变换都是为了计算机能够更好的解问题而诞生的。
- 3.2基本的灰度变换函数
- 在灰度变换中,图像增强有着最常用的三类基本函数:线性函数(反转和恒等函数),对数函数(对数和反对数函数),幂律函数(n次幂和n次根变换)。最简单的就是恒等函数,其输出等于输入。
- 3.2.1图像反转
- 这种方法可以反转一幅图像的灰度,能够将黑转化为白。这种方法适用于增强一幅图像在暗区域中的灰色和白色的区域,尤其黑色的区域占据主导地位时。能够将黑色当中的灰色和白色更加清楚的显现出来。
- 3.2.2对数变换
- 这种变换能够对图像灰度级的扩展或压缩。其较为突出的特点是能够压缩像素值变化较大的图像的动态范围。在计算机中,计算机能够对一幅像素值变化较大的图像很好的显示出来,但是灰度细节会被省略。在对数变换下的图像中,最亮的像素将支配变换后的图像,那些低值的像素将会被忽略,但是图像的细节会大大的提升。
- 3.2.3幂律(伽马)变换
- 原图像在监视器上的显示往往不能真实的反映原图像的灰度,所以我们要对图像进行预处理,对其进行伽马校正,这样输出的图像能够最接近原图像。现在越来越追求在计算机显示器上精确的显示图像,改变伽马值不仅改变的是亮度还会彩色图像的R,G,B的比率,所以伽马校正越来越重要。
- 3.2.4分段线性变换函数
- 最简单的分段线性函数之一是对比度拉伸变换,对比度拉伸是用于扩展图像灰度级动态范围的处理,所以可以跨越记录介质和显示装置的灰度范围。
- 灰度级分层
- 突出图像中特定灰度范围通常很重要,大多数都是两种基本方法的变形。一种是将我们所要的灰度值范围全部显示为同一个值,其他的值全部变为另一个值。第二种是增强或减弱我们所需要灰度值范围里的大小,其他值保持不变。
- 比特平面分层
- 在灰度图像中,可以将其分为8个1比特平面,每个平面都含有不同的灰度细节。但是比特越大的平面,包含越多的视觉数据,是我们视觉上最主要的接受信息,但是低阶比特平面贡献了更精细的比特细节。
- 3.3直方图处理
- 直方图是数字图像的离散函数,在归一化之后,直方图的横坐标是灰度值,纵坐标是概率,这些直方图的概率相加应为一。
- 直方图处理作为灰度变换的一种,它能将一幅图像分为4个特征直方图:暗图像,亮图像,低对比度图像和高对比度图像。暗图像中,直方图多聚集在灰度级的低端,亮图像则相反;
- 在低对比度图像中,有着较窄的直方图且集中于灰度级的中部,而高对比度图像,直方图的范围很大且分布不均匀。则如果一幅图像有着高对比度且灰度级的跨度比较大,那么经过直方图处理后,显示出的是一幅灰度细节丰富范围很大的图像。
- 3.3.1直方图均衡
- 直方图均衡是改变图像的灰度的一种方法。主要是将像素集中的灰度值进行展宽,对于像素不集中的灰度值进行归并,从而增大对比度,使图像更清晰。但是这种方法是对图像里面所有的像素都加以处理,可能导致干扰信息被增强,可用信息被削减,而且细节方面会被减少。
- 3.3.2直方图匹配
- 这种方法是希望将某幅影像的直方图匹配到另一幅影像上,使两幅图的色调保持一致。所以被表示成直方图的影像只剩下了它的色调,不保留任何位置信息。
- 3.3.3局部直方图匹配
- 在3.3.1中我们介绍了直方图均衡,但是直方图均衡这个方法是针对该影像的所有像素的直方图,不满足我们如果对部分区域进行均衡的想法,所以提出了局部的均衡。
- 我们定义一个领域,将领域的中心从一个像素移到另一个像素。并计算该点的领域的直方图,那么得到的不是直方图均衡就是规定化函数,最终函数可以映射为灰度。
- 3.4空间滤波基础
- 3.4.1空间滤波机理
- 空间滤波器是将一个小的邻域(较小的矩阵),对该包围成的范围进行一些预处理。滤波可以产生新的像素,新像素的坐标等于邻域中心的坐标,其值是滤波处理的结果。而滤波就相当于表示为一个映射,一个函数,对于邻域内的不同的位置有着不同的值。
- 3.4.2空间相关与卷积
- 这就是相关与卷积最直接的作用。相关是滤波器位移的函数,但是得到的结果是w的一个拷贝,而且还翻转了180°。我们将包含单个1而其余都是0的函数称为离散单位冲激。所以我们得出结论:一个函数与离散单位冲激有关,在该冲激位置产生函数的翻转效果。
- 而卷积是某个函数与某个单位卷积,得到在该冲激处的对这个函数的拷贝。我们从相关得出我们得到的拷贝翻转了180°,所以我们预先旋转滤波器,我们最终得到了这个函数。
- 3.4.4 空间滤波器模板的产生
- 如果要生成一个m×n的线性空间滤波器,那么就要生成mn个模板系统,我们利用线性滤波能做到的操作只是实现乘积求和。模板的产生,一般是在已有的函数下对大小一定的区域的坐标值的赋值与定义在函数值上,来形成一个滤波器模板。
- 3.5平滑空间滤波器
- 平滑滤波器用于模糊处理和降低噪音。例如在目标提取之前去除图像中的一些琐碎细节,以及桥接直线或曲线的缝隙。
- 3.5.1平滑线性滤波器
- 平滑线性滤波器的输出是包含在滤波器模板的邻域内的像素的简单平均值。所以这种滤波器也被叫做均值滤波器。所以这种处理降低了图像灰度的“尖锐”变化。由于比较典型的噪音是由灰度级的急剧变化导致的,所以常见的平滑处理应用就是降低噪音。在图像中,该种方法能将图像的一部分融入背景中,或者其亮度降低了,大的部分变得像“斑点”一样而易于检测。
- 3.5.2统计排列(非线性)滤波器
- 该种滤波器响应的基础以滤波器包围的图像区域中像素的排列为基础,然后利用统计排序的值代替中间像素的值。这种滤波器有中值滤波器,如其名的那样,是将邻域内的灰度中值代替中心像素的值,所以该种滤波器能够强行将那些比较远的灰度的像素聚拢在中值附近,这也是取消尖锐度的一种方法。
- 3.6锐化空间滤波器
- 锐化的处理与我们之前所说的图像模糊相反,图像模糊利用像素邻域平均法来实现,而锐化的方法由空间微分来实现。所以能够增强图像灰度变化快的地方类似边缘和突变们,而削弱那些变化不大的地方。
- 3.6.3非锐化掩饰和高提升滤波
- 非锐化掩饰分为三步:1.模糊原图像2.从原图像减去模糊图像(产生的图像为模板)
- 3. 将模板加到原图像上去
- 对于该步骤我们得到的模板加上原图像时,会有一个权重系数加在我们的模板上,当这个系数为1时,我们称作非锐化掩饰,当这个系数大于1时,该处理为高提升滤波,而系数小于1时,则不强调非锐化处理的效果。
- 非锐化处理,主要是将那些突变点的灰度值拉的更大,即在小范围内就能有比较大的灰度值的改变。
- 3.7混合空间增强法
- 通常,为了达到我们的需求,我们使用不仅仅一种的处理方法,多种互补的图像增强技术的结合才能实现。所以本节介绍是将多种方法结合的应用。
- 对于不同的要求,采用的方法不同甚至方法的先后顺序也有影响。例如,人的X光照片,我们先采用拉普拉斯法突出图像的细节,然后梯度法突出其边缘。平滑过的梯度图像将用于掩饰拉普拉斯图像,最后利用灰度变换来增大图像的灰度动态范围。
- 3.8利用模糊技术进行灰度变换和空间滤波
- 3.8.2模糊集合论原理
- 利用一个最简单的集合——二值布尔逻辑,不是1就是0,模糊论就是将0到1的过程连接起来,将两者对立但又能够同时存在。则我们能够得到一个隶属度函数,根据集合的关系能够找到三种关系,都是该集合成员,集合的部分成员,不是该集合成员。
- 3.8.3模糊集合应用
- 我们定义一些模糊关系,然后寻找一种输入和由我们的模糊关系描述的知识基础来创建模糊关系系统的输出方法,称为推断或推理。
- 因为我们输入是模糊关系,那么输出也是如此,所以我们必须针对输出定义隶属度函数。
- 针对IF下的OR语句,我们只需提取出多个变量中最大的隶属值,然后比对我们规则的函数,最终来输出我们的结果。而IF下的AND语句,我们要得到的是所有语句下的最小的隶属值,如果每个语句都不满足,那么就可以执行我们的ELSE语句,则当其他规则的响应很弱时,ELSE的规则才会有较强的响应,就像所有规则的反面一样。
- 3.8.4使用模糊集合进行灰度变换
- 模糊图像处理的计算量很大,全部像素的模糊处理,所有规则的前提,推断和去模糊,都必须要有。所以我们给定一个计算式子,能够让计算机套用来得出最后的结果,这样能够大大节省计算的时间。
- 3.8.5使用模糊集合进行空间滤波
- 举一个基于模糊集合概念的边缘提取算法的例子:如果一个像素属于平滑区,我们定义为“白色”,否则为“黑色”。为了能够表示出“平滑区”这一概念,我们考虑邻域中心处像素和邻域像素间的灰度差来定义。
标签:滤波器,前三章,数字图像处理,摘抄,像素,直方图,灰度,图像,我们 来源: https://blog.csdn.net/qq_57813398/article/details/117001804