其他分享
首页 > 其他分享> > 05、江苏专转本(专业课笔记)第五章、数字媒体与应用

05、江苏专转本(专业课笔记)第五章、数字媒体与应用

作者:互联网

文章目录

一、文本与文本处理

信息在计算机中的形态有多种:文字、数值、语言、音乐、图像,都可以使用二进制来表示,其中文字处理是涉及面最广的一种计算机应用。

文本:文字信息在计算机中的别称,其实计算机中最常用的数字媒体。

文本处理过程:

image-20210331211114127


1.1、字符编码

认识字符、字符集与编码表

字符:文字的基本元素是字母与符号,包含字母、数字、标点、符号等。

字符集:就是字符的集合,其中不同的字符集包含的字符数目与内容不同,如中文字符集、西文字符集、日文字符集。

编码表:即字符的编码,每个字符使用二进制来表示,称为该字符的编码或代码,并且不同的字符其编码各不相同。


认识ASCII码(西文字符的编码)

西文由拉丁字母、数字、标点符号以及一些特殊符号组成。

ASCII码(美国标准信息交换码):其中包含96个可打印字符与32个控制字符。在计算机中最小单位为字节,对于其编码采用7个二进位进行编码。多出来的进制位使用0来表示。

汉字编码

特点:数量大、字形复杂、同音字多、异体字多。

常用的汉字编码字符集:

注意点:上面三种编码字符集各不兼容,接下来说明一下各自编码的特点信息:

四个编码详细介绍

(1)、GB2312汉字编码:

  1. 三个部分组成:①字母、数字和各种符号②一级汉字(3755个)③二级汉字(3008个)
  2. 每个汉字使用2个字节(16位)表示,第1字节与第2字节的最高位均为1。
    • image-20210403224301223
  3. 均使用机内码表示,例如"南"字机内码为11000100 11001111(计算机中存储),为了方便人们记忆可使用16进制表示为C4CF

说明:使用GB2312标准来表示汉字还远远不够,其缺少繁体字无法满足人名、地名古籍整理、古典文献研究等应用需要。推出GBK-1995

(2)、GBK-1995:基于GB2312扩充了不少汉字

  1. 在原本基础上扩充了1万多个汉字(包含繁体字以及符号)。
  2. 共有21003个汉字和883个图形符号。
  3. 保持对GB2312的向下兼容,并且同样使用双字节表示,第1字节最高位必须为"1"。
    • image-20210403224908523

(3)、UCS/Unicode多文种大字符集

背景描述:为了实现全球数以千计的不同语言文字的统一编码。

编码方案

  1. 先实现部分字符的编码(11万个字符)。
  2. 尽量与已有编码标准兼容。
  3. 包含由中日韩越统一整理的7万汉字。
  4. 允许有若干个不同的编码方案。

编码格式:UTF-8以及UTF-16(网络中常用该编码)。

注意:并不兼容GB2312、GBK。

(4)、GB108030汉字编码(现广泛使用)

背景:无论是Unicode的UTF-8还是UTF-16,其中虽然覆盖了使用多年的GB2312以及GBK的中文字符,但是编码并不相同。

目的:为了与UCS/Unicode编码接轨,并保护我国大量汉字信息资源,便发布了GB108030汉字编码。

现已经在我国强制贯彻实施。


几种汉字的对比

image-20210403225850159


1.2、文本准备

文字符号输入计算机的方法:


1.3、文本编辑、排版与处理

可通过使用如WordWPS来对文本进行编辑、排版。


1.4、文本分类

简单文本(纯文本):如.txt后缀的文本文件,其中就是一串字符代码所组成,几乎不包含任何其他的格式信息和结构信息。

复杂文本:有字体字号等属性变化,可设置段落和页面排版格式的文本,并且包含需要"标记"来描述字符的属性和格式设置。如加粗、添加描边、居中等。

超文本(www网页):按照内容的关联性相互进行链接,即点击网页上的文字链接能够跳转其他网页。


二、图像与图形

2.1、数字图像获取

图像获取:从现实世界中获得数字图像的过程。

图像的获取过程如下扫描->分色(RGB)->取样->量化

image-20210408093546834



2.2、图像的表示与压缩编码

图像的表示与主要参数

认识不同的图像组成

数字取样图像由M列xN行个取样点组成。

图像分类


数字取样图像的主要参数

图像大小(图像分辨率)水平分辨率x垂直分辨率,用来表示组成该图像的行列数目,即图像所包含的像素数目。对图像清晰度以及屏幕上显示出来的大小有影响。

颜色空间类型:针对于彩色图像

  1. RGB(红绿蓝模型)—显示器。
  2. CMYK(青、品红、黄、黑)—彩色打印机。
  3. HSB(色彩、饱和度、亮度模型)—用户界面使用。
  4. YUV(亮度、色度模型)—彩色电视信号传输使用。

像素深度:即像素的所有颜色分量的二进制位。

image-20210408095027108



数据压缩

为什么要压缩?①节省存储器存储的容量大小;②提高图像的传输速度,减少通信费用。

为什么要进行压缩呢?①数字图像中可能有大量的数据冗余。②人眼视觉有局限性,允许图像有一些失真。

压缩的两种类型

  1. 无损压缩:用压缩后的数据还原出来的图像没有任何误差。
  2. 有损压缩:用压缩后的数据还原出来的图像有一定的误差。


2.3、数字图像处理与应用

数字图像公式(重点)

在显示比例相同时,显示在屏幕上的图像尺寸图像分辨率成正比。

数字图像数据量的计算公式(字节为单位):

image-20210409212201217



数字图像的常用文件格式

常见的文件格式如下

image-20210409213040914

说明:不同的图像文件格式采用了不同的数据压缩技术和数据组织方法,适合不同的应用!

介绍各类格式

BMP:其图像格式是windows操作系统下使用的一种标准图像格式。支持单色、16色、256色、真彩色图像。

GIF图像:颜色数据不超过256色,适合用作插图、剪贴画等场合,文件小,适合网络传输。

JPEG图像:静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名为.jpg,适合各种连续色调的彩色或灰度图像,在计算机和数据相机中已得到广泛应用。



图像处理与应用

目的:提高视觉效果、恢复失真畸变图像。图像分析包括图像分类、识别和理解等。图像数据变化、编码和数据压缩。

效果:去噪、增强、复原、分割、压缩、存储。

应用:图像分割识别、人脸检测识别

image-20210413221856115

常用的图像编辑软件:如Word,PowerPoint(具有最基本的图像编辑功能)、windows附件中"画图"软件、Adobe Photoshop。


2.4、计算机图形

什么是计算机图形?通过计算机和软件对景物的结构、形状与外貌进行描述(“建模”),接着根据该描述和选定的观察位置及光线状况、生成该景物的图形。

绘制:即图像合成,根据景物模型,观察位置及光线,生成该景物可视图像的过程。

如何让绘制的条件更好,需要更好的硬件支持:显卡(图形卡)

区分图形与图像(重点)


三、数字声音及应用

3.1、波形声音介绍

声音:其是由震动产生,通过空气进行传播。

声音由什么产生?声音是一种波,它由许多不同频率的谐波组成。

声音的带宽指的是什么谐波的频率范围称为声音的带宽。

计算机处理的声音类型:一般人耳可听到的声音为20Hz-20kHz



3.2、数字波形声音的获取与释放(输入、输出)

数字波形声音的获取(输入)

步骤:信号(模拟声音)->取样->量化->编码->数字声音

主要就是经历其中的三步骤转化为数字到电脑中,其中量化操作包含模数转化的过程。

获取数字波形的设备:声卡。其整个获取步骤如下:

声音的脱机获取设备:数码录音笔


声音的重建与播放(输出)

步骤:数字声音->解码->数模转换->差值->重建后的模拟声音

声音重建:指的就是把声音从数字形式转换成模拟信号形式,由声卡完成。

声音播放:将模拟声音信号经过处理进行放大效果,由音箱完成。



3.3、声卡的功能与逻辑组成

声卡的主要功能如下:

  1. 波形声音的获取与编码。
  2. 波形声音的重建与播放。
  3. MIDI消息的输入。
  4. MIDI音乐的合成。

MIDI:像乐谱一样,可根据对应的编码来进行播放音乐。



3.4、波形声音表示与应用

介绍数字波形声音

数字波形声音:使用的二进制位表示的一种串行比特流,其中的数据按照时间顺序进行组织,文件扩展名为.wav。

主要参数如下



数字波形声音码

概念介绍及公式(含例题)

两个公式

两种声音类型介绍:数字语音与CD立体声

例题:CD唱片的立体声音压缩为MP3后,若压缩比为12,那么MP3音乐的码率是?


数字波形声音数据压缩描述

  1. 数据压缩的必要性:为了降低存储成本和提供网络上的传输速率。例如无损音效wav原本50MB经过压缩为mp3变为3MB,即可大大较少传输大小,减少传输的流量。
  2. 数据压缩的可能性(可能出现的情况):声音中包含着大量的冗余信息,人耳灵敏度有限,对于一些失真不宜察觉。
  3. 相关压缩的方法:①全频带声音压缩:国际标准MPEG(MP3压缩),工业标准Dolb。②数字语音压缩:固定电话中使用ADPCM编码进行压缩。③手机使用高效率的混合编码技术。


波形声音文件类型及应用

image-20210419224200776

重点是其中的无损压缩:.ape.flac



波形声音编辑工具

介绍:最左边的一般就是音乐刚开始播放时的状态,一般都是淡入淡出的。

image-20210419225114771

主要功能描述

  1. 编辑声音,如声音剪辑、复制、调节音量。
  2. 声音的效果处理:如混响、回声、淡入、淡出等。
  3. 录音。
  4. 声音的格式转换。
  5. 播放声音。


3.5、认识流媒体

流媒体:就是一种允许在网络上让用户一边下载一边收看音视频的媒体分发技术。一般的话视频使用该技术,对于文本图片不使用该技术,本身占据容量不大所以没必要。

介绍在因特网上收看音视频节目的2种方式

  1. 下载存储方式:先将视频下载存储到计算机中,下载完毕后再播放。
    • 缺点:需要等待大量的时间,并且占据较大的磁盘空间。
  2. 流式传输方式(主流):就是本部分介绍的技术,是一种允许在网络上让用户一边下载一遍收看音视频媒体的媒体分发技术。

主流的3个公司流媒体技术

  1. Real Networks公司的Real Media。
  2. 微软公司的windows Media Services。
  3. 苹果公司的Quick Time。


3.6、计算机合成音乐(MIDI)

计算机合成音乐:就是计算机模拟人说话或演奏声音。

计算机合成声音包含两种类型:MIDI就是其中一类。

  1. 计算机合成话音(语音):模拟人将一段事先准备好的文字朗读出来,也就是文字->语音(称为TTS,text to speech)。
    • 应用场景:有声查询、语言学习、语音秘书、自动报警、残疾人服务等。
  2. 计算机合成音乐(MIDI):能够让计算机模拟乐器发声并按照乐谱演奏音乐。
    • 应用场景:计算机作曲、配器等。

MIDI三要素:“乐器”、“乐谱”、“演奏员”

image-20210419230106280

MIDI的优缺点:



四、数字视频及应用

4.1、数字视频基础

视频:简而言之由多张图片组成的、随时间变化其内容的一组图像(24、25、30帧/s),一帧也就是一张图片,每秒呈现的图片有多张让我们的人眼反应不过来就形成了的视频,又叫运动图像或运动图像。

特点:①内容随时间而变化。②伴随有与画面动作同步的声音(伴音)。③人类接受的信息70%来自于视觉,其中活动图像最丰富、直观、生动。④视频信息的处理是多媒体技术的核心。

视频信号的本质实际上也是由数字组成的,与图像、声音数字化相仿,但更加复杂一些。

数字视频获取的设备视频采集卡数字摄像头(通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机)。


4.2、数字视频的压缩编码

为什么要进行压缩编码?①对于数字视频的数据量十分大,1分钟的数字电视图像未压缩可超过1GB,对于存储、传输和处理都有很大的问题。②视频中有许多重复部分,产生冗余情况,相邻画面的内容由高度的连贯性(相似性),由于人眼视觉灵敏度有限,允许画面失真看不出来。

数字编码以及国际标准

数字视频的三大类编码

image-20210421224701352

数字编码的国际标准

image-20210421224753616


4.3、数字视频的编辑

播放器

对于一些视频播放器实际上就是一种解码器,通常还可以解码多种类型信息(如图像、视频、图片…)以及多种不同格式的音像文件格式。

image-20210421225122697



4.4、合成视频—计算机动画

认识计算机动画及相关场景

计算机动画:使用计算机生成一系列内容连续的画面供实时演播的一种技术,其是一种计算机合成的数字视频,而不是用摄像机拍摄的"自然视频"。

应用场景:20世纪九十年代开始,计算机动画技术用于电影特效,如《侏罗纪公园》、《玩具总动员》、《泰坦尼克号》。

制作动画软件:Power animator、3DGO、MAYA(玛雅)、3ds max、Animator Studio。关键词有动画(animator、3D、玛雅)。


互联网动画

GIF动画:颜色位数小于256位,清晰度并不高,一般在互联网上使用较多,占用内存小。

Flash:出自于Adobe(Macromedia)公司的动画,其有几个特点如下:

  1. 支持矢量图形,位图图像,文件较小。
  2. 画面可调,支持用户交互。
  3. 可生成执行文件.exe、以及能够用于Flash播放器播放的文件(.swf)。
  4. 可以做成单独的动画或者是嵌入网页中的动画视频。
  5. 能够采用流式传输方式,可以边下载边进行播放。


4.5、数字视频的应用

认识VCD、DVD

VideoCD(简称VCD):按MPEG-1标准将60分钟的音频、视频记录在一张CD光盘上,图像质量为352x240,即家用录放相机的水平,可播放立体声。一般占据650MB、700MB。

DVD-video(简称DVD影碟):按照MPEG-2标准将音视频记录在DVD光盘上,图像质量为750x576(比VCD好),可播放5.1声道的环绕立体声,单面单层DVD(容量为4.7GB),一般可以记录120分钟以上的视频节目。


数字电视

数字电视:简而言之就是整个过程(电视节目制作、处理、传输、接收播放)使用的是二进制编码,01方式,全过程数字化,

数字电视也有优劣,有以下几个分类:

  1. 高端:全高清晰度电视(HDTV),分辨率为1920x1024。
  2. 中端:常规模拟电视的数字化(DTV),720x480。
  3. 低端:包括互联网上的IPTV等。

数字电视的优点

  1. 频道利用率高:就是频道更多,相较于以前的模拟电视节目增加了好几倍。
  2. 抗干扰能力变强了:因为现在整体使用的是数字传播,不会像以前一样模拟转数字,有着转换过程。
  3. 图像清晰度高:具有CD级音质效果,可支持5.1环绕立体声家庭影院。
  4. 开展基于电视的交互式数据业务:简单来说就是你可以基于电视上进行购物、看电视、玩游戏等等。

点播电视(VOD)

VOD(点播电视):也就是用户可以自由选择观看节目,与以前只有固定实时的电视台不同,增添了更多的功能,从主动变为被动。

image-20210424230038244


标签:编码,数字,波形,声音,05,专转本,专业课,图像,计算机
来源: https://blog.csdn.net/cl939974883/article/details/122262263