音频
现实世界的音频是模拟量,我们要将这个量转化为数字量的方法是三步:
抽样,量化,编码。
抽样,就是一秒钟要抽取的模拟量的数目,这里就完成了模拟量的时间离散,一秒抽几次 就是sample rate 抽样率 单位是Hz,这里得到的是离散模拟信号,常用的音频抽样率如下:
8KHz;16KHz;32KHz;44.1KHz;48KHz;
量化就是从空间上离散,对上边每个抽样的sample进行量化,将离散模拟信号转化为离散数字信号,比如将一个sample转化为16bit,采样深度 就是 bits per sample。
那么 最后数字信号的码率 = 采样率*采样深度 bits/second = samples/second * bits/sample
比特率就表示一秒钟传输的音频的1 ,0比特数目。一般有率都是表示一秒钟内传输的数据量。
音频的其他参数:声道可以分为2,5.1声道
第三步就是编码,根据有损无损方式,可以分为两类,
audio code:
PCM-A Law;PCM-Mu Law;G.723.1;G.729;MPEG Audio;G.726@40K;G.726@32K;G.726@24K;G.726@16K
下面对各种音频格式做以介绍(一般音频格式都是与它的编码格式有关的):
常用的有wav,pcm这两个是无损压缩方式,wav就是记录了音频的wave的波形,pcm是Pulse code modulation.
1wma(windows media audio)视窗媒体音频。微软的音频压缩技术,音质类似mp3,能以mp3一半的技术完成。通过安装wmp(windows media player)来播放。
2mp3应用最广的有损压缩(MPEG Audio Layer 3),它使用了CBR,VBR,ABR.
CBR(constant bit rate)整个文件的比特率都是一样的。不同复杂程度的音频都用相同的码率,缺点视复杂段落音质差,优点是文件尺寸固定。
VBR(virable bit rate)将一首歌的复杂部分用高比特率编码,简单部分用低比特率编码,使复杂程度与体积之间平衡。优点是整首歌都能达到我们的音质要求,缺点是编码无法估计压缩出来的体积大小。
ABR(average bit rate)以每秒50帧为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以作为VBR和CBR的一种这种选择。
3.ADPCA(adaptive differential pulse code modulation)自适应差分脉冲编码。有损压缩。压缩比很高。当音质一般。
4.AAC(advanced audio coding 高级音频编码)mpeg2一部分,它对立体声,噪音优化,多媒体控制,码流效果音扫描高级特性。支持多种语言和比特率,更高解码效率,acc可以在比mp3文件缩小30%前提下提供更好的音质。
5asf(advanced streaming format 高级流动格式)主要时支持音频网络传输
ps:视频格式常用的size有
80x60;88x72;160x120;176x144;320x240;352x240;352x288;640x480;704x480;704x576;720x576;
posted on 2009-07-18 19:42
Bluesea 阅读(733)
评论(0) 编辑 收藏 引用 所属分类:
DTV