05、江苏专转本(专业课笔记)第五章、数字媒体与应用
作者:互联网
文章目录
一、文本与文本处理
信息在计算机中的形态有多种:文字、数值、语言、音乐、图像,都可以使用二进制来表示,其中文字处理是涉及面最广的一种计算机应用。
文本:文字信息在计算机中的别称,其实计算机中最常用的数字媒体。
文本处理过程:
1.1、字符编码
认识字符、字符集与编码表
字符
:文字的基本元素是字母与符号,包含字母、数字、标点、符号等。
字符集
:就是字符的集合,其中不同的字符集包含的字符数目与内容不同,如中文字符集、西文字符集、日文字符集。
编码表
:即字符的编码,每个字符使用二进制来表示,称为该字符的编码或代码,并且不同的字符其编码各不相同。
认识ASCII码(西文字符的编码)
西文由拉丁字母、数字、标点符号以及一些特殊符号组成。
ASCII码
(美国标准信息交换码):其中包含96个可打印字符与32个控制字符。在计算机中最小单位为字节,对于其编码采用7个二进位进行编码。多出来的进制位使用0来表示。
汉字编码
特点:数量大、字形复杂、同音字多、异体字多。
常用的汉字编码字符集:
- 大陆使用(国内):国家标准
GB2312-1980
、汉字扩充规范GBK
(1995年)、国家标准GB18030-2005
(现今使用)- 上面—后的是推出年份,最后一个GB18030-2005是向下兼容所有版本的。
- 港澳台使用:
BIG 5
(大五码) - UCS/Unicode(世界统一):
UTF-8
、UTF-16
注意点:上面三种编码字符集各不兼容,接下来说明一下各自编码的特点信息:
四个编码详细介绍
(1)、GB2312
汉字编码:
- 三个部分组成:①字母、数字和各种符号②一级汉字(3755个)③二级汉字(3008个)
- 每个汉字使用2个字节(16位)表示,第1字节与第2字节的最高位均为1。
- 均使用机内码表示,例如"南"字机内码为11000100 11001111(计算机中存储),为了方便人们记忆可使用16进制表示为
C4CF
。
说明:使用GB2312标准来表示汉字还远远不够,其缺少繁体字无法满足人名、地名古籍整理、古典文献研究等应用需要。推出GBK-1995
。
- 其余ASCII码不兼容(ASCII码为1个字节表示)
(2)、GBK-1995
:基于GB2312扩充了不少汉字
- 在原本基础上扩充了1万多个汉字(包含繁体字以及符号)。
- 共有21003个汉字和883个图形符号。
- 保持对
GB2312
的向下兼容,并且同样使用双字节表示,第1字节最高位必须为"1"。
(3)、UCS/Unicode
多文种大字符集
背景描述:为了实现全球数以千计的不同语言文字的统一编码。
编码方案:
- 先实现部分字符的编码(11万个字符)。
- 尽量与已有编码标准兼容。
- 包含由中日韩越统一整理的7万汉字。
- 允许有若干个不同的编码方案。
编码格式:UTF-8以及UTF-16(网络中常用该编码)。
注意:并不兼容GB2312、GBK。
(4)、GB108030
汉字编码(现广泛使用)
背景:无论是Unicode的UTF-8还是UTF-16,其中虽然覆盖了使用多年的GB2312以及GBK的中文字符,但是编码并不相同。
目的:为了与UCS/Unicode编码接轨,并保护我国大量汉字信息资源,便发布了GB108030
汉字编码。
现已经在我国强制贯彻实施。
几种汉字的对比
1.2、文本准备
文字符号输入计算机的方法:
- 人工输入
键盘输入
:数字编码、字音编码、字形编码(如五笔)、形音编码。- 优点:效率高,重码少(对于五笔),容量大。
联机手写输入
:如手写板。语音输入
- 自动识别输入
光学字符识别
:OCR(例如从屏幕中识别文字),顺序:纸介质文本->扫描仪->(文本映像)->OCR->数字文本
- 条形码、磁卡、IC卡、RFID识别(能够进行扫描识别)。
1.3、文本编辑、排版与处理
可通过使用如Word
、WPS
来对文本进行编辑、排版。
1.4、文本分类
①简单文本(纯文本):如.txt后缀的文本文件,其中就是一串字符代码所组成,几乎不包含任何其他的格式信息和结构信息。
②复杂文本:有字体字号等属性变化,可设置段落和页面排版格式的文本,并且包含需要"标记"来描述字符的属性和格式设置。如加粗、添加描边、居中等。
③超文本(www网页):按照内容的关联性相互进行链接,即点击网页上的文字链接能够跳转其他网页。
二、图像与图形
2.1、数字图像获取
图像获取:从现实世界中获得数字图像的过程。
- 设备:扫描仪、数码相机、摄像头、摄像机等。
图像的获取过程如下:扫描->分色(RGB)->取样->量化
2.2、图像的表示与压缩编码
图像的表示与主要参数
认识不同的图像组成
数字取样图像由M列xN行个取样点组成。
取样点
:即组成数字取样图像的基本单位,也就是像素
。
图像分类:
- 彩色图像:其像素通常由
3个彩色分量
组成。-
- 每个像素由三个分量,分别表示三个基色的亮度,假设三个分量分别用n,m,k个二进制位表示,则可表示2n+m+k种不同颜色。
-
- 灰度图像与黑白图像:其像素只包含
1个亮度分量
。-
- 只用1个二进制位表示,0表示黑,1表示白。
-
- 一个像素只有1个分量,一般用8-12个二进制位表示,取值范围为2n个不同的亮度。
-
数字取样图像的主要参数
图像大小(图像分辨率):水平分辨率x垂直分辨率
,用来表示组成该图像的行列数目,即图像所包含的像素数目。对图像清晰度以及屏幕上显示出来的大小有影响。
颜色空间类型:针对于彩色图像
- RGB(红绿蓝模型)—显示器。
- CMYK(青、品红、黄、黑)—彩色打印机。
- HSB(色彩、饱和度、亮度模型)—用户界面使用。
- YUV(亮度、色度模型)—彩色电视信号传输使用。
像素深度:即像素的所有颜色分量的二进制位。
数据压缩
为什么要压缩?①节省存储器存储的容量大小;②提高图像的传输速度,减少通信费用。
为什么要进行压缩呢?①数字图像中可能有大量的数据冗余。②人眼视觉有局限性,允许图像有一些失真。
压缩的两种类型?
无损压缩
:用压缩后的数据还原出来的图像没有任何误差。有损压缩
:用压缩后的数据还原出来的图像有一定的误差。
2.3、数字图像处理与应用
数字图像公式(重点)
在显示比例相同时,显示在屏幕上的图像尺寸
与图像分辨率
成正比。
数字图像数据量的计算公式(字节为单位):
数据量=水平分辨率x垂直分辨率x像素深度/8
- 例如上面1.5MB是怎么算到的呢?1024x768x16/8/1024/1024=1.5MB
- 1024x768就是图像大小,位数为16位,注意单位是字节所以其中/1024就是为KB,再除以1024就是MB。
数字图像的常用文件格式
常见的文件格式如下:
说明:不同的图像文件格式采用了不同的数据压缩技术和数据组织方法
,适合不同的应用!
介绍各类格式
BMP
:其图像格式是windows操作系统下使用的一种标准图像格式。支持单色、16色、256色、真彩色图像。
GIF
图像:颜色数据不超过256色,适合用作插图、剪贴画等场合,文件小,适合网络传输。
- 功能如下:
- 具有累进显示功能,适合网络浏览器观看。
- 支持透明背景(JPEG不支持)。
- 支持动画。
- 缺点:不适合真彩色图片,就是颜色度不高与其他格式相比画质更差。
JPEG
图像:静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名为.jpg
,适合各种连续色调的彩色或灰度图像,在计算机和数据相机中已得到广泛应用。
- 扩展:
JPEG
最新标准是JPEG2000
(扩展名为.jp2),采用更先进的技术,可取得更好的效果,在医学图像处理中广泛使用。
图像处理与应用
目的:提高视觉效果、恢复失真畸变图像。图像分析包括图像分类、识别和理解等。图像数据变化、编码和数据压缩。
效果:去噪、增强、复原、分割、压缩、存储。
- 图像降噪、图像恢复等。
应用:图像分割识别、人脸检测识别
常用的图像编辑软件:如Word,PowerPoint(具有最基本的图像编辑功能)、windows附件中"画图"软件、Adobe Photoshop。
2.4、计算机图形
什么是计算机图形?通过计算机和软件对景物的结构、形状与外貌进行描述(“建模”),接着根据该描述和选定的观察位置及光线状况、生成该景物的图形。
- 计算机图形也称为计算机合成图像。简而言之图形就是经过计算机软件改造或建模的图形。
绘制:即图像合成,根据景物模型,观察位置及光线,生成该景物可视图像的过程。
如何让绘制的条件更好,需要更好的硬件支持:显卡(图形卡)
区分图形与图像(重点):
图象
:通过数字化设备获取的图,如数码相机等,它们称为取样图像、点阵图像或位图图像。图形
:通过计算机建模并绘制而成的"图"称为矢量图形。
三、数字声音及应用
3.1、波形声音介绍
声音:其是由震动产生,通过空气进行传播。
声音由什么产生?声音是一种波,它由许多不同频率的谐波
组成。
声音的带宽指的是什么?谐波
的频率范围称为声音的带宽。
计算机处理的声音类型:一般人耳可听到的声音为20Hz-20kHz
- 话音或语音:专指人的说话声音,带宽仅为300-3400Hz。
- 全频带声音(如音乐声、风雨声):带宽可达20Hz-20kHz。
3.2、数字波形声音的获取与释放(输入、输出)
数字波形声音的获取(输入)
步骤:信号(模拟声音)->取样
->量化
->编码
->数字声音
- 取样频率越密,取样越长。
主要就是经历其中的三步骤转化为数字到电脑中,其中量化操作包含模数转化的过程。
获取数字波形的设备:声卡。其整个获取步骤如下:
- 可以看到麦克风起到了将声波转换为电信号的操作,声卡做了上面的主要三步骤。
声音的脱机获取设备:数码录音笔。
声音的重建与播放(输出)
步骤:数字声音->解码
->数模转换
->差值
->重建后的模拟声音
- 差值是对数模转换后的中间插入几个数值,进而补充为连续数字。
声音重建:指的就是把声音从数字形式转换成模拟信号形式,由声卡完成。
声音播放:将模拟声音信号经过处理进行放大效果,由音箱完成。
- 普通音箱接收的是重建的模拟声音信号。数字音箱是直接接收的数字声音信号,失真更小。
- 数字音箱的话更好!!!
3.3、声卡的功能与逻辑组成
声卡
的主要功能如下:
- 波形声音的获取与编码。
- 波形声音的重建与播放。
- MIDI消息的输入。
- MIDI音乐的合成。
MIDI
:像乐谱一样,可根据对应的编码来进行播放音乐。
3.4、波形声音表示与应用
介绍数字波形声音
数字波形声音
:使用的二进制位表示的一种串行比特流,其中的数据按照时间顺序进行组织,文件扩展名为.wav。
主要参数如下:
- 取样频率:语音的取样频率一般为8k~16kHz。全频带声音(如音乐)取样频率高,44.1k-48kHz。
- 量化单位:通常为8位、12位或16位。位数越大越清晰。
- 声道数目:单声道为1,双声道为2。越大立体感越强。
- 码率(比特率):每秒钟的数据量。传输的数据量越大。
数字波形声音码
概念介绍及公式(含例题)
两个公式:
- 未压缩时数字波形声音的码率计算公式:
码率=取样频率x量化位数x声道数
- 压缩编码后的数字波形声音码率公式:
压缩后的码率=未压缩时的码率/压缩比
,这个未压缩码率指的是上面公式的码率。
两种声音类型介绍:数字语音与CD立体声
-
- 数字语音:
64kb/s=8kHz*8bits*1
,若是让你求KB,那么就需要64/8=8kB/s - CD立体声:
1411.2kb/s = 44.4kHz*16bits*2
- 数字语音:
例题:CD唱片的立体声音压缩为MP3后,若压缩比为12,那么MP3音乐的码率是?
- 1411.2/12≈118kb/s左右。
- 分析:CD立体声的未压缩码率为1411.2kb/s,接着使用压缩编码的公式除以12即可。
数字波形声音数据压缩描述
- 数据压缩的必要性:为了降低存储成本和提供网络上的传输速率。例如无损音效wav原本50MB经过压缩为mp3变为3MB,即可大大较少传输大小,减少传输的流量。
- 数据压缩的可能性(可能出现的情况):声音中包含着大量的冗余信息,人耳灵敏度有限,对于一些失真不宜察觉。
- 相关压缩的方法:①全频带声音压缩:国际标准MPEG(MP3压缩),工业标准Dolb。②数字语音压缩:固定电话中使用ADPCM编码进行压缩。③手机使用高效率的混合编码技术。
波形声音文件类型及应用
重点是其中的无损压缩:.ape
、.flac
。
波形声音编辑工具
介绍:最左边的一般就是音乐刚开始播放时的状态,一般都是淡入淡出的。
主要功能描述:
- 编辑声音,如声音剪辑、复制、调节音量。
- 声音的效果处理:如混响、回声、淡入、淡出等。
- 录音。
- 声音的格式转换。
- 播放声音。
3.5、认识流媒体
流媒体
:就是一种允许在网络上让用户一边下载一边收看音视频的媒体分发技术。一般的话视频使用该技术,对于文本图片不使用该技术,本身占据容量不大所以没必要。
介绍在因特网上收看音视频节目的2种方式:
- 下载存储方式:先将视频下载存储到计算机中,下载完毕后再播放。
- 缺点:需要等待大量的时间,并且占据较大的磁盘空间。
- 流式传输方式(主流):就是本部分介绍的技术,是一种允许在网络上让用户一边下载一遍收看音视频媒体的媒体分发技术。
主流的3个公司流媒体技术:
- Real Networks公司的Real Media。
- 微软公司的windows Media Services。
- 苹果公司的Quick Time。
3.6、计算机合成音乐(MIDI)
计算机合成音乐
:就是计算机模拟人说话或演奏声音。
计算机合成声音包含两种类型:MIDI就是其中一类。
- 计算机合成话音(语音):模拟人将一段事先准备好的文字朗读出来,也就是
文字->语音
(称为TTS
,text to speech)。- 应用场景:有声查询、语言学习、语音秘书、自动报警、残疾人服务等。
- 计算机合成音乐(MIDI):能够让计算机模拟乐器发声并按照乐谱演奏音乐。
- 应用场景:计算机作曲、配器等。
MIDI
三要素:“乐器”、“乐谱”、“演奏员”
MIDI文件
相当于乐谱;媒体播放器
相当于演奏员,只不过在计算机中它需要去发送指令到声卡的音乐合成器
中,音乐合成器会将指令进行合成模拟乐器发声。
MIDI
的优缺点:
- 优点:数据量极小(比CD立体声少3个数量级,比MP3少3个数量级);容易制作和编辑修改;可以与波形声音同时播放。
数量级
指的是活动记录的条数。
- 缺点:只能合成音乐,不能合成歌曲和语音;音质与硬件设备相关。
四、数字视频及应用
4.1、数字视频基础
视频
:简而言之由多张图片组成的、随时间变化其内容的一组图像(24、25、30帧/s),一帧也就是一张图片,每秒呈现的图片有多张让我们的人眼反应不过来就形成了的视频,又叫运动图像或运动图像。
- 常见视频信号:电视、电影、动画。
特点:①内容随时间而变化。②伴随有与画面动作同步的声音(伴音)。③人类接受的信息70%来自于视觉,其中活动图像最丰富、直观、生动。④视频信息的处理是多媒体技术的核心。
视频信号的本质实际上也是由数字组成的,与图像、声音数字化相仿,但更加复杂一些。
数字视频获取的设备:视频采集卡
、数字摄像头
(通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机)。
数字摄像头
:分辨率较低(352x288~640x480),速度一般在30fps(每秒30帧左右),镜头的视觉可达45度-60度。支持USB接口或IEEE1394接口。成像采用CMOS或CCD。数码摄像机
:高级一些,提供480以上的分辨率,清晰度相较于数字摄像头更高,能够自动对焦、自动曝光。包含压缩功能,使用MPEG-2进行压缩编码,然后记录在存储卡或硬盘上。支持USB接口或IEEE1394接口。
4.2、数字视频的压缩编码
为什么要进行压缩编码?①对于数字视频的数据量十分大,1分钟的数字电视图像未压缩可超过1GB,对于存储、传输和处理都有很大的问题。②视频中有许多重复部分,产生冗余情况,相邻画面的内容由高度的连贯性(相似性),由于人眼视觉灵敏度有限,允许画面失真看不出来。
数字编码以及国际标准
数字视频的三大类编码:
数字编码的国际标准:
4.3、数字视频的编辑
播放器
对于一些视频播放器实际上就是一种解码器,通常还可以解码多种类型信息(如图像、视频、图片…)以及多种不同格式的音像文件格式。
4.4、合成视频—计算机动画
认识计算机动画及相关场景
计算机动画
:使用计算机生成一系列内容连续的画面供实时演播的一种技术,其是一种计算机合成的数字视频,而不是用摄像机拍摄的"自然视频"。
应用场景:20世纪九十年代开始,计算机动画技术用于电影特效,如《侏罗纪公园》、《玩具总动员》、《泰坦尼克号》。
制作动画软件:Power animator、3DGO、MAYA(玛雅)、3ds max、Animator Studio。关键词有动画(animator、3D、玛雅)。
互联网动画
①GIF
动画:颜色位数小于256位,清晰度并不高,一般在互联网上使用较多,占用内存小。
②Flash
:出自于Adobe(Macromedia)公司的动画,其有几个特点如下:
- 支持矢量图形,位图图像,文件较小。
- 画面可调,支持用户交互。
- 可生成执行文件.exe、以及能够用于Flash播放器播放的文件(.swf)。
- 可以做成单独的动画或者是嵌入网页中的动画视频。
- 能够采用流式传输方式,可以边下载边进行播放。
4.5、数字视频的应用
认识VCD、DVD
VideoCD
(简称VCD):按MPEG-1标准将60分钟的音频、视频记录在一张CD光盘上,图像质量为352x240,即家用录放相机的水平,可播放立体声。一般占据650MB、700MB。
DVD-video
(简称DVD影碟):按照MPEG-2标准将音视频记录在DVD光盘上,图像质量为750x576(比VCD好),可播放5.1声道的环绕立体声,单面单层DVD(容量为4.7GB),一般可以记录120分钟以上的视频节目。
数字电视
数字电视
:简而言之就是整个过程(电视节目制作、处理、传输、接收播放)使用的是二进制编码,01方式,全过程数字化,
数字电视也有优劣,有以下几个分类:
- 高端:全高清晰度电视(HDTV),分辨率为1920x1024。
- 中端:常规模拟电视的数字化(DTV),720x480。
- 低端:包括互联网上的IPTV等。
数字电视的优点:
- 频道利用率高:就是频道更多,相较于以前的模拟电视节目增加了好几倍。
- 抗干扰能力变强了:因为现在整体使用的是数字传播,不会像以前一样模拟转数字,有着转换过程。
- 图像清晰度高:具有CD级音质效果,可支持5.1环绕立体声家庭影院。
- 开展基于电视的交互式数据业务:简单来说就是你可以基于电视上进行购物、看电视、玩游戏等等。
点播电视(VOD)
VOD
(点播电视):也就是用户可以自由选择观看节目,与以前只有固定实时的电视台不同,增添了更多的功能,从主动变为被动。
- 从以前通过天线收看几个节目->使用机顶盒来收看不同频道的多个节目->数字电视(更多节目频道)->点播电视(功能更加强大,通过宽带广域网接收到电视节目,提供了更多的其他业务)
标签:编码,数字,波形,声音,05,专转本,专业课,图像,计算机 来源: https://blog.csdn.net/cl939974883/article/details/122262263