概念与特性
1.数字音频及其特性
音频(AudioFrequency——简称AF)指正常人耳能听到的,相应于正弦声波的任何频率。正常人耳的音频范围一般约为16 Hz~16 kHz。音频是个专业术语,人类能够听到的所有声音都为音频范围内,它可能包括噪声等。
音频有模拟音频与数字音频之分。模拟音频是指通过声电或电声转换得到的声音信号,早期的卡带式随身听、麦克风加混音设备加音箱组成的现场设备都属于此类。数字音频是指以数字的形式存储的音频,这类音频在需要时可由专门设备将数字信号转码为声音信号,转化为人耳接收的声音。
若计算机有音频卡(声卡),就可以通过它将外部的声音源录制下来(数字化),声音源的声学特性(如音的高低等)都可以按一定的方式被记录下来,并以文件的方式保存在计算机的外部存储器中。反过来,录制好的音频文件都可以通过数字音乐播放软件,结合计算机的声音外放设备(如音箱)播放,从而重新被人耳接收。
数字音频最大的优势在于存储方便、存储成本低、无声音失真,而且非常便于编辑和处理。
①模拟音频 把原始信号以物理方式录制到磁带上,然后加工、剪接、修改制作出母带,最后再用母带大量录制商品磁带、LP等载体。整个过程全部使用模拟信号,每一步都会有信号损失。
② 数字音频 第一步就把原始信号录成数码音频资料,然后用硬件设备或各种软件进行加工处理,这个过程几乎不会有任何损耗。对于机器设备来说这个过程只是处理数字而已,只要操作合理就不会发生丢码的情况,损耗自然很小!最后将处理完成的数字信号传输给数字记录设备如CD等制作出最终的商品。
2.数字视频及其特性
图像连续变化的速度每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面从而产生平滑连续的视觉效果,这样连续的画面叫作视频。
视频(Video)技术泛指将一系列静态影像以电信号方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。视频技术最早是为了电视系统而发展,现在已经发展出各种不同的格式以方便消费者将视频记录下来。视频与电影属于不同的技术,后者是利用照相术将动态的影像捕捉为一系列的静态照片。
视频有传统模拟视频和数字视频之分。传统模拟视频指的是通过模拟信号网络制作和传输,并利用模拟电子设备再现其影像的视频系统。数字视频则是通过数字信号网络进行制作、传输和再现的视频系统。
与模拟视频相比,数字视频的优势主要表现如下:
①信号的数字化精度主要表现在一个信号由模拟量转变为数字量之后;
②集成电路可以应付复杂的数字功能,这使得非常专业的信号处理技术变得简单和经济;
③ 数字信号能够被储存在记忆设备中,这种可存储性带来了信号间制式和标准转换上的便利;
④ 利用视频数据压缩技术,传输数字化视频比传输等量的模拟视频所需的频带宽度要小的多;
⑤ 在质量相当的前提下,数字设备要比模拟设备价格便宜,而且伴随集成电路的价格下降,数字设备将会越来越便宜。
数字音频、视频的制作参数
无论是数字音频还是数字视频,最重要的就是第一步,即对声音源或视频源的录制过程,这一步骤产生的数字信号决定了最终的音频和视频的效果。音频与视频各自的源有不同的特点,因此两者各自有不同的制作规格(或者叫制作参数)。
1.数字音频的制作参数
录制数字音频时主要有两个指标,一个是采样频率,或称采样率;另一个是采样精度,也就是比特率。图所示为声音采样的实际过程:
(1)采样频率
所有的模拟声音信号都有其波形,模拟声音信号数字化的基本过程是:在原有的模拟信号波形上,每隔一段相同的时间进行一次“取样”得到该时间点的声音强度数值,这就是“采样”。把所有“取样”得到的数值按“取样”顺序连贯起来,就可以描述该模拟信号的变化过程。
很明显,单位时间内采样次数越多,得到的数字信号波形就越接近源模拟信号的波形,该单位时间内的采样次数就称为“采样频率”。当前最常用的采样频率是44.1kHz,即每秒采样44100次,这是经过反复实验,在保证音频质量与降低存储占用间取得平衡的最佳采样频率,也是CD唱片所使用的标准采样频率。
(2)比特率
影响声音响度的物理要素是声波的振幅,录制数字音频也必须要能精确区分声音中响度的细微变化,即一定要对波形的振幅有一个精确的描述。
比特率就是数字音频中用于描述声音振幅变化细节的重要参数,其实际含义是数码录音时用多少个二进制位(比特;bit)来表示声音强度的变化细节,一般使用16比特、20比特或24比特制作音乐。
16比特就是指把波形的振幅划分为216(即65536)个等级,根据模拟信号的响度将其划分到某个等级中去,并用该数值代表此时间点上的响度。和采样频率一样,比特率越高越能精确地反映乐曲声音的变化细节。
我们也常说“动态范围”或说“动态”,其单位是dB,指的是一首乐曲最响和最轻的对比能达到多少。动态范围和比特率的关系是:比特率每增加1比特,动态范围就增加6 dB。所以假如我们使用1比特录音,那么我们的动态范围就只有6 dB,这样的音乐是没法听的。比特率为16时,动态范围是96 dB,这可以满足一般的需求了。比特率为20时,动态范围是120 dB,对比最强烈的交响乐都可以应付自如。
2.数字视频制作参数
数字视频可视作动态图像的一种,其制作过程中需要考虑诸如画面更新率、视频分辨率、长宽比例、色彩资料、视频品质等重要参数。
(1)画面更新率
画面更新率(Frame Rate)中文还可译为“帧率”,指的是视频格式每秒钟播放的静态画面数量。典型的画面更新率由早期的每秒6或8张(frames persecond,fps),至现今的每秒120张不等。
(2)视频分辨率
视频画面的大小称为“分辨率”。数字视频以像素为度量单位,而电视等模拟视频则以水平扫描线数量为度量单位。标清电视信号分辨率为720/704/640×480i60(NTSC)或768/720×576i50(PAL/SECAM)。新的高清电视(HDTV)分辨率可达1920×1080p60,即每条水平扫描线有1920个像素,每个画面有1080条扫描线,以每秒钟60张画面的速度播放。
(3)长宽比例
视频画面的长宽尺寸之比称为长宽比(Aspect ratio)。传统的电视萤幕长宽比为4:3(1.33:1)。高清数字电视(HDTV)的长宽比为16:9(1.78:1)。
虽然电脑荧幕上的像素大多为正方形,但是数字视频的像素通常并非如此。例如使用于PAL及NTSC信号的数位保存格式CCIR 601,以及其相对应的非等方宽荧幕格式。因此以720×480像素记录的NTSC规格DV影像可能因为是比较“瘦”的像素格式而在放映时成为长宽比4:3的画面,或反之由于像素格式较“胖”而变成16:9的画面。
(4)色彩
在模拟视频信号中,常使用Yxx来描述色彩,其中Y值为色彩空间(Color Space)或色彩模型(Color model)规定了视频当中色彩的描述方式。例如NTSC制式的电视使用YIQ模型,而PAL制式的电视使用YUV模型,SECAM制式的电视使用YDbDr模型。
在数字视频当中,像素位深度(bits per pixel,bpp)代表了每个像素可还原颜色的能力。
(5)视频品质
视频品质(或译为“画质”,“影像质量”)可以利用客观的峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)来量化,或借由专家的观察来进行主观视频品质的评量。
(6)视频压缩技术
由于视频资料包含了空间的与时间的冗余性,所以使得未压缩的视频流的传送效率非常低,所以人们发展出许多方法来压缩视频流以解决传送效率的问题。需要说明的是,视频压缩技术仅适用数字视频制作。
总体而言,空间冗余性可以借由“只记录单帧画面的一部分与另一部分的差异性”来减低,这种方法被称为帧内压缩(Intraframe Compression),帧内压缩与数字图像压缩密切相关。时间冗余性则可借由“只记录两帧不同画面间的差异性”来减低,这种方法被称为帧间压缩(Interframe Compression),包括运动补偿以及其他技术。目前最常用的视频压缩技术为DVD与卫星直播电视所采用的MPEG-2,以及因特网传输中常用的MPEG-4。
(7)位元传输率
位元传输率仅适用于数字视频制作。位元传输率又可称为“位元速率”或“比特率”或“码率”,是一种表现视频流中所含信息量的方法。码率的度量单位为bit/s(每秒钟传送的位元数量,bps)或者Mbit/s(每秒钟传送的百万位元数量,Mbps)。较高的码率可产生更高的视频品质。例如DVD视频格式的典型码率为5Mbit/s,其画质高于VCD格式的视频(码率为1Mbit/s)。HDTV格式的视频拥有更高的(约20Mbit/s)码率,因此就具有比DVD更高的画质。
可变位元速率(Variable Bit Rate,VBR)是一种追求提升视频品质并同时降低位元传输率的手段。采用VBR编码的视频在大动态或复杂的画面时段会自动以较高的码率来记录影像,而在静止或简单的画面时段则降低码率。这样可以在保证画面品质的前提下尽量减少传输率。但对于传送带宽固定,需要即时传送并且没有暂存手段的视频流来说,固定位元速率(Constant Bit Rate,CBR)比VBR更为适合,视频会议系统即为采用固定码率传输的例子。
音频、视频格式
1.常用数字音频格式
(1)CD格式
在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨文件。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨是近似无损的,因此它的声音基本上是忠于原声的。
一个CD音频文件对应一个*.cda文件,但这只是一个索引信息,并不真正的包含声音信息,所以不能直接复制*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV后再播放。
(2)WAV
是微软公司开发的一种声音文件格式,它符合 RIFF(资源交换文件格式,Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数。WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都支持WAV格式。
(3)MP3
所谓的MP3指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1”、“*.mp2”和“*.mp3”这三种声音文件。需要注意的是,MPEG音频文件的压缩是一种有损压缩。MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。由于其文件尺寸小且音质好,所以直到现在这种格式还在广泛应用。但是MP3音乐没有版权保护技术,使用不当会出现版权纠纷。
MP3格式压缩音乐的采样频率有很多种,既可以用64kbit/s或更低的采样频率减小音乐文件的大小以节省存储空间,也可以用320kbit/s的标准以获得极高的音质。
常用数字视频格式
(1)MPEG/MPG/DAT
MPEG也就是Motion Picture Experts Group 的缩写。这类格式包括了MPEG-1,MPEG-2和MPEG-4在内的多种视频格式。MPEG-1是大部分VCD都使用的压缩格式,刻录软件自动将MPEG-1转为.DAT格式。使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到1~2 GB左右大小。
MPEG-2则是应用在DVD的制作;同时在一些HDTV(高清电视)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2的压缩算法压缩一部120分钟长的电影可以压缩到5~8 GB的大小,MPEG2有着比MPEG-1更高的视频品质。
(2)AVI
AVI是音频视频交错(Audio Video Interleaved)的英文缩写。AVI是由微软公司发表的视频格式。AVI格式调用方便、图像质量好,但缺点是文件体积过于庞大。
(3)MOV
MOV是苹果公司创立的视频格式。QuickTime原本是Apple公司用于Mac计算机上的一种图像视频处理软件。Quick-Time提供了两种标准图像和数字视频格式,既可以支持静态的PIC和JPG图像格式,又可支持动态的基于Intel的Indeo压缩算法的MOV和基于MPEG压缩算法的MPG视频格式。
(4)WMV
WMV(Windows Media Video)是微软推出的一种流媒体格式,它是由“同门”的ASF格式升级延伸来得。在同等视频质量下,WMV格式的文件可以边下载边播放,因此很适合在网上播放和传输。
WMV的主要优点在于可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。但WMV也有其本身的局限性,首先,WMV必须要依赖Windows操作系统平台,这意味着解码部分也要有PC参与,这无疑会增加机顶盒的造价,从而影响了视频广播点播的普及。其次,WMV技术的视频传输延迟要10几秒钟。
(5)RMVB
这是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源,就是说静止和运动场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用。这样在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。
(6)FLV
FLV是随着Flash MX的推出而发展出来的新的视频格式,其全称为Flash Video。由于它生成的视频文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入Flash后,使导出的视频文件体积庞大,不能在网络上很好的使用等缺点。各在线视频网站如新浪播客、56、优酷、土豆、酷6、帝途、YouTube等均采用此视频格式。
音频、视频软件
如果需要制作音频、编辑修改音频、转换音频格式或产生混音特效,就必须使用专门的软件工具才能实现。网络中存在大量的此类工具可供选择,这些工具中有些是专用的,有些是通用的,有些需要有专业的知识,有些则是业余人士就能够驾驭的,视频软件的情况也大致如此。
1.常用音频软件
音频软件的功能主要分为音频播放、音频录制和音频剪辑合成三大类。用户选用的软件也常具有其中一项、两项或全部功能。
音频播放软件就是指各类音乐播放类的应用软件,它们以音频播放功能为主要功能。经常使用的音乐播放软件主要有:Windows Media Player、酷我音乐盒、腾讯QQ音乐、酷我K歌、酷狗音乐盒、千千静听(TTPlayer)等。这些音乐播放软件的差别通常在于界面操作是否方便、音质还原是否逼真、是否有丰富的可用网络资源以及是否支持音频格式转换等几个方面,这些也是用户选择播放软件的基本依据。如图所示为当前比较流行的千千静听音乐播放器软件界面和音频格式转换界面。
音频录制软件是以录制音频为其主要功能的应用软件,分为单轨录音和多轨录音软件两类。常用的单轨录音软件有GoldWave和WaveLab等。
(1)GoldWave
这是一款长久以来很多用户一直钟爱的老牌录音软件,因其环保安装方式,体积小巧的程序容量,都可带给我们意外惊喜。
(2)WaveLab
这是SoundForge的强大竞争对手,靠各大效果器生产厂商开发的VST插件在竞争中占据了有利地位。
多轨录音软件主要有Sonar、Vegas Video、Samplitude 2496和Nuendo,还有人气极佳的Cool Edit。
2.常用视频软件
视频软件的功能主要也分为视频播放、视频录制及视频剪辑三大类,主要不同在于视频中通常包含声音轨道,所以其播放、录制及剪辑的过程通常包含了声音的部分。如图是 Adobe Audition CS5软件界面:
常用的视频播放软件有很多,诸如Windows Media Player、百度影音、暴风影音、韩国的KMPlayer及快播等。这些视频播放软件通常除了播放本地视频外,还在网络视频资源播放等方面各有所长,用户可根据需要进行取舍。
常用的视频剪辑软件主要有会声会影和Adobe PremierePro两款,会声会影是一款民用级的软件产品,而Premiere则是专业级的,需要说明的是,此类软件对计算机硬件要求都较高。
(1)会声会影
是美国友立(Ulead Video Studio)公司的软件产品,是一款功能强大的视频编辑软件,具有图像抓取和编修功能,可以抓取、转换MV、DV、V8、TV和实时记录、抓取画面文件,并提供有超过 100 多种的编制功能与效果,可导出多种常见的视频格式,甚至可以直接制作成DVD,VCD,VCD 光盘。支持各类编码,包括音频和视频编码。Ulead Video Studio最后一版是10,2006年Corel公司收购该公司后又陆续推出了Ⅱ、X2、X3、X4以及最新的X6等版本。图为Corel VideoStudio X6的软件界面。
(2)Adobe Premiere Pro
是目前最流行的非线性编辑软件,是数码视频编辑的强大工具,它作为功能强大的多媒体视频、音频编辑软件,应用范围不胜枚举,制作效果美不胜收,足以协助用户更加高效地工作。