网站推广.NET

网站推广.NET

数字化视频的优点有哪些(视频数字化的好处和特点)

来源:互联网

在音视频领域,人们始终追求无限还原现场效果,因此音频越逼真越好,视频越清晰越好。之所以我们需要将音视频信号由模拟转为数字,目的是在录制、存储、编辑、复制、回放等环节的不失真,尽量保持原有细节,不因以上操作,导致音画的质量下降。

为此,视频系统分辨率越来越高,高清1080P不过瘾,出现了4K、6K、8K……,帧速率也有30帧/每秒到60、120……;音频也越来越追求多声道(单声道、双声道、2.1、5.1、7.1……)、无损压缩等等。

音频信号由模拟转为数字,涉及到如下几个概念:

  1. 采样:在一定的时间间隔下,对模拟信号变化进行测量。
  2. 量化:采样获得的测量结果,按照一定的标准用数值描述出来。
  3. 采样率:每秒钟采样多少次,单位是千赫兹(kHz)。值越高,越接近原模拟信号,细节越丰富,数据量越大,文件体积越大。
  4. 量化深度:描述信号变化所用的2进制数的位数,单位是bit(位)。值越高,细节越丰富……(同采样率)
  5. 编码:所得到的数据,安装何种格式存储。

CD 随身听

以普通CD音质(双声道、44.1KHz、16bit)MP3压缩为例,简述一下音频模数转化基本过程:接到持续变化的模拟信号后,对每个声道每秒进行44.1千次的采样,采样的结果用16位二进制数量化表示,最后按照MP3的编码格式存储到磁盘上。

CD 转码

除了用采样率、量化位来描述音频质量外,还可以用“码率”来表示,单位是bps,就是每秒(ps)传输多少二进制数的位(b)。计算公式如下:

“码率”=采样率×量化深度×通道数

如:CD音质的码率=采样率(44.1kHz)×量化深度(16bit)×通道数(2)=1411.2kbps

因此,“码率”越大,音质越高。

说到编码,我们简单说一下常见格式:

  • WAVE:微软公司开发的一种“无损”音频格式,文件扩展名是“WAV”。
  • CD:无损格式,与WAVE类似,只是标准确定为:双声道、44.1KHz、16bit,按照音轨的形式烧录在光盘上。
  • MP3:MPEG标准的音频“有损”压缩编码,非常常见。在采样率、量化深度、声道数一致情况下,生产的文件可以是WAV的1/10大小。音质稍低于无损格式,扩展名是“MP3”。
  • APE:“无损”压缩编码,扩展名是“APE”。压缩率约为55%,音质与对应WAV或CD一样,是目前常见的无损音频格式。
  • 其它:wma、mp2、fla、rma等等,不再一一列举。

这里需要解释一下“有损”和“无损”压缩。“无损”不压缩,模数转换后的数据直接保存;“有损”是按照一定的算法,将一些数据(超出人耳朵听力范围、非常微小的变化细节、单双声道一致只保留单声道……)删除,进而完成的编码。因此,最接近原始信号的是“无损”格式,为了减少保存、传输等环节的数据量,多使用音质与文件提交相对平衡的“有损”格式。

模拟视频是由帧组成,帧是由场组成,场是由行(扫描线)组成,而且还得解决彩色问题、伴音问题。

模数转化

模拟视频时代,视频的来源就是电影摄像机、电视摄像机。模拟电影剪辑、存储、传播均需要使用胶片作为截止,随着时间推移自然就会老化甚至出现尘土、划痕,导致视频质量严重下降,因此现在电影院都是数字化设备了。电视摄像机也是如此,它采用的介质是磁带,除了自然老化,磁带能记录的视频清晰度也有限制。因此只有数字化才能提高画质,减少中间环境导致的画质降低。

摄像机

摄像机将视频保存在磁带上,电影也需要翻拍,将录像机与电脑采集卡相连接,使用电脑软件开始视频采集,最终保存到电脑内形成文件,就完成了视频的数字化,后期的编辑、存储、复制、传播就全部实现了数字化。

录像带

采集卡

以PAL制式信号为例,视频信号由每秒25帧组成,每帧分为奇偶两场,每场312.5行组成。采集卡接收到的视频信号,就是这个结构,但与音频不一样的地方是,音频是连续,没有帧、场、线这样的机构,只需按照采样频率采集即可,最多是多处理一下额外的声道。

电视机

视频处理除了要对伴音信号采样外,还需要对亮度信号、色度信号分开采样。因为只有这样,才能兼容以前的黑白信号(黑白信号就是亮度变化的信号),并且提高图像的清晰度。

色度信号采取色差方式,也就是R(Red红)G(Green绿)B(Blue蓝)颜色与亮度的差,表示为Y(亮度)U(红色差)V(蓝色差)颜色编码。

三原色RGB

对YUV的采样频率分别为:13.5MHz、6.75MHz、6.75MHz,这就是符合信号采样标准的4:2:2,这是CCIR601(模拟电视广播级标准)的高档标准,低档标准是2:1:1。当然还有别的标准,这个地方请大家记住,将来我们谈到别的视频编码,比如视频监控系统时还会提到。

YUV

量化位采用8bit,行有效采样点数为720(水平取样),有效采样行数为576(PAL制)和480(N制),这样组中分辨率就是720×576(PAL)、720×480(N)。

按照这个原理,我们可以计算一下传输的码率:

码率R=13.5MHz×8bit+(6.75MHz×8bit)×2=216Mbit/s

按照字节计算就是13.5MHz+6.75MHz×2=27MB/s

大家可以看到,如果用100Mbps的网络是无法传递这么大信号的,如果非要传递,得到的结果也是高延迟的卡顿;如果用CD盘(650MB)存储,只能存储24秒;用DVD最高格式D9(双层单面,容量8.4GB)才能存储5分钟。因此我们得出结论,视频数字化后必须压缩!

传输拥堵

因为视频是静态的单帧画面组成,因此谈到压缩,我们先看一下静态画面的压缩,这里必须提到的就是JPEG格式。

JPEG是国际标准化主持(ISO)在1986年提出的图片标准(Joint Photographic Experts Group)。这个标准实现了图像清晰度与存储容量的平衡,它采取的有损压缩算法,可以在视觉允许的清晰度下,大幅度降低图片容量,而且清晰度可调,非常适合存储于传输,因此目前仍旧是互联网使用的主要图片格式,文件扩展名通常为“.jpg”。

单帧的压缩可以参考JPEG,连续图像的视频怎么压缩呢?1998年,ISO成立活动图像专家组(Moving Picture Expert Group),这就是MPEG标准。1991年推出了靠前视频压缩标准MPEG-1;1994年又推出了MPEG-2;目前最新的是MPEG-4(后文详述)。

MPEG组织

MPEG-1采用广播级视频质量折半的标准,将720×576(PAL)、720×480(N)减少为352×288(PAL)、352×240(N)。这样我们可以看出,这个标准低于广播级标准,图像清晰度也就家用录像机VHS水平。这样的清晰度保存在CD上,可以保存72分钟,与音乐CD相近。将视频安装MPG-1标准压缩,保存到CD上,这就是VCD,因此一部电影(90分钟左右)必须两张VCD盘片。

VCD

其实VCD在国外没有流行起来,但在国内发展得如火如荼,主要原因就是造价低廉,盘片与CD一样,不过随着大家对视频质量要求的提高,很快就没落了。

MPGE-2质量等同于广播级标准,720×576(PAL)、720×480(N),因此视频质量有了本质的提高,刻录到专用大容量光盘上,就是DVD了。

DVD机

此外,1998年国内还出现过一个SVCD(Super VCD),它实际上在CD盘片上存储MPEG-2压缩的,图像质量高于VCD,相当于DVD的2/3,优点是使用CD机架构,成本低廉。虽然支持多语言、AC-3、可变码率等先进技术,但仍旧是过渡技术,很快就被DVD淘汰。

视频的压缩除了采用分辨率调整外,还使用可变码率(静态内容低码率,动态内容高码率)、动态内容(只记录与上一帧不同内容)等算法进行了有损压缩,这样就使得数字化后的视频,可以适应当时的IT水平,可以存储、编辑、传播了。

说到MPEG的音频部分,不得不说MP3格式的音频,它是MPEG Audio Layer III的标准,这是音频压缩层次,前两层音质一般,码率较高。MP3压缩算法最复杂,音质优秀,码率较低,因此成为了目前最常用的数字音乐格式。另外MPEG-2的Dolby Digital AC-3,实现了多声道家庭影院效果,后来改名为“杜比数码环绕声”(Dolby Surround Digital)。这些我们另文再聊。

至此,我们终于完成了音视频由模拟到数字的转换,迈进了数字化的门槛,可以领略数字化音视频的无限魅力了!