基于DSP的VOIP技术中的语音编码技术的研究_【论文发表】_职称论文_教育论文_发表论文网

摘要：IP网络电话是一项涉及计算机网络、信令协议、数字信号处理等多个领域的综合性技术，价格低廉是IP电话能够进入市场的首要因素，其根本原因是IP电话均采用语音分组技术、语音压缩编码和统计复用，带宽利用率高，完成一次通信所需的成本大幅度降低。IP电话中的语音处理主要需要解决两个问题：一是在保证一定话音质量的前提下尽可能地降低编码比特率，二是在IP网络环境下保证一定的通话质量。前者正是我们要研究的语音编码技术。本论文主要介绍G.723.1、G.729语音编解码算法及其在VOIP应用中的性能分析比较，同时介绍G.729在DSP上的实现。
引言：VOIP是一种以IP电话为主并且推出相应的增值业务的技术。VOIP最大的优势是能广泛地采用Internet 和全球IP互连的环境提供比传统业务更多更好的服务。VOIP可以在IP网络上便宜的传送语音、传真、视频、数据等业务。ITU-T G.729语音编码压缩标准以线性预测和矢量量化算法为基础，根据该标准的算法得到的语音编码能在降低语音码率的同时获得较好的语音质量。G.729是对电话宽带语音信号编码的标准，也是目前应用广泛的VOIP语音数字信号处理标准。
1 VOIP的相关技术
1.1信令技术，包括ITU-T H.323和IETF会话初始化协议SIP(Session Initiation Protocol)两套标准体系，还涉及到进行实时同步连续媒体流传输控制的实时流协议TRSP。
1.2媒体编码技术，包括流行的G.723.1、G.729、G.729A话音压缩编码算法和MPEG-II多媒体压缩技术。
1.3媒体实时传输技术
1.4业务质量保障技术
1.5网络传输技术，主要是TCP和UDP。
此外还有分组重建技术和时延抖动平滑技术、动态路由平衡传输技术、网关互联技术、网络管理技术以及安全认证和计费技术等等。
从上边的叙述中我们可以看出，语音编码是VOIP的关键技术之一。
2 常用的语音压缩编码算法
IP电话经常使用ITU定义的两个标准：G.723.1、G.729。它们采用的都是线性预测分析-合成编码和码本激励矢量量化技术，即混合编码的方法。
2.1 G.723.1协议
G.723协议是一个双速率语音编码建议[1]，其两种速率分别是5.3 kbps和6.3 kbps。此协议是一个数字传输系统概况协议，适用于低速率多媒体服务中语音或音频信号的压缩算法。它作为完整的H.324系列标准的一部分，主要配合低速率图像编码H.263标准。
2.2 G.729协议
G.729协议是一个能在8 kbps上实现高质量语音编码的建议，也是H.323协议中有关音频编码的标准[2]。在IP电话网关中，G.729协议被用来实现实时语音编码处理。G.729协议采用的是CS-ACELP即共轭结构算术码激励线性预测的算法。CS- ACELP以CELP编码模型为基础，它把语音分成帧，每帧10 ms，也就是80个采样点。对于每一帧语音，编码器从中分析出CELP模型参数，其中包括线性预测系数，自适应码本和随机码本的索引值和增益。然后把这些参数传送到解码端，解码器利用这些参数构成激励源和合成滤波器，从而重现原始语音。
两种协议从编码质量、编码速率、编解码复杂度、抗误码性能、编解码时延这几方面比较综合考虑G.729协议略胜一筹。
3 G.729算法在DSP上的实现
3.1 芯片的选择
TMS320C6000器件是TMS320系列产品中的新一代高性能DSP芯片，是1997年TI公司发布的，包括定点系列和浮点系列。其中定点系列是TMS320C62XX，浮点系列TMS320C67XX，两者可以兼容。
3.2 TMS320C6211的特点
3.2.1采用改进型的哈佛结构
改进的哈佛结构允许数据存放在程序存储器中，并被算术运算指令直接使用，增强了芯片的灵活性。另外指令可以存储在高速缓存器（Cache）中，省去了从存储器中读取指令的时间，大大提高了运行速度。
3.2.2采用流水线操作
流水线操作是DSP实现高速度、高效率的关键技术之一。
3.2.3特殊的硬件结构
采用两个硬件乘法器实现乘法运算，只需要一个指令周期,大大提高了信号处理速度。此外，TMS320C6211内部的各种数据寄存器、移位寄存器等硬件结构，确保了DSP算法的快速性。
3.2.4特殊的DSP指令系列和丰富的寻址方式
3.3实验用的DSK板
德克萨斯仪器公司（TI）开发生产的初学者工具DSK是为初学者进行DSP编程练习而提供的一套廉价的实时软件调试工具。它的特点是功能全，价格低，代码编译速度快，使用简单。TMS320C6211 DSK基于C6000系列中低价位的片种TMS320C6211，它不仅能使开发人员熟悉C6000DSP，而且其功能还足够用于网络、通信、图像处理等具体应用的开发，因而具有极高的性价比。
硬件结构如图1所示。核心采用定点运算芯片TMS320C6211，工作于150MHz时钟，峰值性能为1200MIPS，它是DSP业第一片使用了两级内部高速缓存（Cache）的DSP（L1 Cache 8Kbyte／L2 Cache 64Kbyte），内部RAM共72Kbyte。DSK的供电电源为5V的直流电源。
TMS320C6211 DSK是一块通过并口与PC机相连的板卡。板上包括：一个150MHz的C6211 DSP，峰值性能为1200MIPS；双时钟，CPU工作在150MHz，外部存储器接口（EMIF）工作在100MHz；并行接口与PC机标准的并口对接； TI的TLC320AD535 16位数据转换器（Data Converter）；TI的TPS56100电源管理器件（Power Manager Device）提供1．8V和3．3V的直流电；JTAG控制器，用于仿真和调试；用于外部扩展子卡的接口（Expansion Daughter Card Interface）。

图1 TMS320C6211 DSK结构图
实际工作过程如下：
(1)先接上专用电源，用USB线将DSK板和PC机相连
(2)将CCS编译后的程序代码通过USB口下载到DSK上(加载到板上DSP内存)
(3) PC的音频输出和DSK的音频输入通过音频线相连，DSK的音频输出连接耳机
(4)运行程序，并且在PC上播放音频
3.4语音编解码流程

4 结论
由于语音编码器的处理延时是直接影响到电话的语音质量的重要因素，所以实现一个高速的语音编码器成为VOIP技术的关键。本文分析了ITU-T G.729协议的8kbps速率的CS-ACELP语音编解码算法，该算法编码速率很低、算法延迟小、计算复杂度适中，在TMS320C6211 DSK上进行了运行和测试，能较好的实现了G.729语音编解码算法，语音经过编解码后失真很小，可以有效地利用于VOIP系统中。

参考文献
1、杨晓萍，汤家骏．用TMS320C6201实现多路ITU-T G.728语音编解码标准．上海交通大学，2000
2、封浩宇．网络电话VOIP系统设计与实现，2000

优势期刊

基于DSP的VOIP技术中的语音编码技术的研究