朗谷数字音频处理技术在音频及网络通讯领域的应用
时间:05-19
来源:
点击:
前言
2008年12月15日出版的《第一财经周刊》刊登了科尔尼资讯管理公司发布的2008年全球化城市指数的前60个城市,上海、北京、深圳入选其中,而07年有本畅销书《世界是平的》,则把网络通讯技术的变革视为使全球化的力量之一,统一通讯技术发展方向是IP将融合所有协议,AV将融合所有格式,互联互通,开放式代替封闭式,技术越复杂就越要求用户应用上的简单,而数字音频处理技术则是网络通讯中最基础和最核心的技术之一,朗谷数字实验室专注于此项技术的研发。
一、 与朗谷数字音频处理技术关联的基础概念
历史
回音消除已经替代了早期的回音抑制,回音抑制最早始于20世纪50年代,在卫星通讯环境中用来控制由于比较长的信号延时而听到的回音。最早的回音消除理论在二十世纪六十年代在AT&T贝尔实验室中发展起来,但是直到20世纪70年代末,由于受到电子行业的技术能力限制,商用回音消除产品一直没有取得太大的发展。
随着DSP的飞速发展使得回音消除产品变得更小和更具有效费比。在20世纪九十年代,回音消除器不再作为一个独立的设备,第一次被集成于语音网关中(加拿大北电公司DMS-250)。这个整合使得回音消除直接内置于语音网关中,意味着回音消除器可以在通话过程中非常可靠地被开启或者关闭,在语音通讯和数据通信中区分不同的干线组取得所需要的信号。
1、回声与延时的关系
回声和延时是两个不同的概念,延时不会加重或者改变回声的量值。声音有一个遮掩效应,例如我们在山谷里那么清楚的听到回声的原因是因为声音的传递时间长,声音反射回来的时间就长,超过1秒甚至2秒,声音的传递时间长了,声音的遮掩效应会失去,这样人的耳朵就会感觉到听到这个回声,回声是一直存在的,专门的研究机构做过专门的测试,声音的传递小于20毫秒左右的时候,遮掩效果发挥作用,人耳一般听不出来,超过20毫秒以后遮掩效应开始衰减,超过50毫秒,声音的遮掩效应就基本消失了,只要有微弱的回声人耳就能听得到。
2、回声和数字延时及语音压缩技术的关系
数字延时技术就是把线性的信号,语音信号从喇叭或者电话中传出去前,经过数字信号采样处理会延迟一段时间,就使得回音回来延迟的更长,所以我们能够听到。而语言压缩技术是对一段数字信号进行采样后压缩,然后再把这个压缩信号送出去,这一段数字信号一般是30毫秒,40毫秒左右,语音数据经过拿出来做处理,处理之后,再送出去,这样就增加了40毫秒的延时,导致的结果就是有回音回来被听到。例如我们现在的电话网络都采用用数字交换机,而以前都是模拟交换机,送出的都是模拟信号,这个信号是以光速传递的,所以在模拟交换机时代,打本地电话和长途电话感觉不到有回音,只有通过卫星打国际电话的时候听到有回音,因为延迟时间就变长了,那么打本地电话,电信号以光的速度传递,只有几个毫秒,我们就听不见感觉不到回音的存在,而现在的电话网络全都用数字式的,它把电信号变成数字信号,而数字信号的处理,不是采一个数字就送出去,它是采集一段信号,可能是20毫秒40毫秒的信号进来了,把它处理一下,然后送出去,这样的数字处理的效率很高,把信号先压缩以后,再送出去,结果就是效率更高,本来一根线只能送一路电话,现在可能送10个电话,但是提高效率的同时,增加了延时作为结果,这是就导致回音的出现,例如我们打手机有回音,也是这种原因。
二、AEC(Adaptive Echo Control) 朗谷自适应回声消除回音器的原理
1、回声消除原理
回音的产生既复杂也简单,一般喇叭信号出来声音它会传递到麦克风,这个传递过程本身从技术上讲就有一个传递函数,传递本身就已经发生了一些变化,在传递过程中,高频和低频的传递系数是不一样的,通常低频传递的效率更高,高频传递的效率低一点 。麦克风跟喇叭的位置靠的越近,声音传递的时间越短,稍微离的远一点,那么延迟的时间会多一点,即使声音直接传过去,信号就已经有时间延时了,麦克风位置的改变,回音也随之改变,传递的声音随着距离位置的改变,它传递的时间也发生改变,接触到信号也就改变了,但声音除了这个直接信号以外,声音在空间中它是往各个方向传递的,它会碰到墙壁、碰到天花板反射回来,然后反射到麦克风,有的反射到桌面然后到麦克风,各个情况都存在,所以这是一个很复杂的问题,所有的信号最终的结果是叠加在一起的,叠加的结果就是有的信号被增强了,有的信号被减弱了,各种各样的都有,然后墙壁对声音信号的反射也不一样,高频低频都不一样,所以结果是一个复杂的所有叠加的结果,有的早有的晚,有的强有的弱,朗谷做回音消除呢,就是把总的传递函数效果算出来,那么并不是简单的说两个信号一样,这个你算出来的回音信号,跟送出去的参考信号,送到喇叭去的信号并不一样,它已经经过了一些传递改变了,那么可能有些已经延迟了100个毫秒,这是总的结果,回音消除的原理就是信号出去,然后麦克风收的信号肯定是这些信号各种各样的直接间接的传递,反射回来的信号叠加到一起,我们把这些传递函数计算出来,叠加结果计算出来,这样就能得到一个回音信号和麦克风信号,在理想条件下如果计算出来的和麦克风信号一样,就可以把回声消除掉,如果计算出来的有误差,那么就不可能消除干净,这就是回声消除的原理。回声消除技术后面还有很复杂的数学问题。回音消除最难的地方是变量太多,回音模型的改变回音的叠加的结果都要计算出来。另外还有采用回声抑制进行回声处理的方法,即非线性的过度就是两边同时说话的时候,它分辩不出那个是回音信号,所以就cutoff,剪切掉拉,这是处理不当,也可以说是单工,就是因为线性的做的不够好,还有回音,所以它就多切掉一点,回声抑制就是这个道理。也就是回声消除和回音抑制的不同。
2008年12月15日出版的《第一财经周刊》刊登了科尔尼资讯管理公司发布的2008年全球化城市指数的前60个城市,上海、北京、深圳入选其中,而07年有本畅销书《世界是平的》,则把网络通讯技术的变革视为使全球化的力量之一,统一通讯技术发展方向是IP将融合所有协议,AV将融合所有格式,互联互通,开放式代替封闭式,技术越复杂就越要求用户应用上的简单,而数字音频处理技术则是网络通讯中最基础和最核心的技术之一,朗谷数字实验室专注于此项技术的研发。
一、 与朗谷数字音频处理技术关联的基础概念
历史
回音消除已经替代了早期的回音抑制,回音抑制最早始于20世纪50年代,在卫星通讯环境中用来控制由于比较长的信号延时而听到的回音。最早的回音消除理论在二十世纪六十年代在AT&T贝尔实验室中发展起来,但是直到20世纪70年代末,由于受到电子行业的技术能力限制,商用回音消除产品一直没有取得太大的发展。
随着DSP的飞速发展使得回音消除产品变得更小和更具有效费比。在20世纪九十年代,回音消除器不再作为一个独立的设备,第一次被集成于语音网关中(加拿大北电公司DMS-250)。这个整合使得回音消除直接内置于语音网关中,意味着回音消除器可以在通话过程中非常可靠地被开启或者关闭,在语音通讯和数据通信中区分不同的干线组取得所需要的信号。
1、回声与延时的关系
回声和延时是两个不同的概念,延时不会加重或者改变回声的量值。声音有一个遮掩效应,例如我们在山谷里那么清楚的听到回声的原因是因为声音的传递时间长,声音反射回来的时间就长,超过1秒甚至2秒,声音的传递时间长了,声音的遮掩效应会失去,这样人的耳朵就会感觉到听到这个回声,回声是一直存在的,专门的研究机构做过专门的测试,声音的传递小于20毫秒左右的时候,遮掩效果发挥作用,人耳一般听不出来,超过20毫秒以后遮掩效应开始衰减,超过50毫秒,声音的遮掩效应就基本消失了,只要有微弱的回声人耳就能听得到。
2、回声和数字延时及语音压缩技术的关系
数字延时技术就是把线性的信号,语音信号从喇叭或者电话中传出去前,经过数字信号采样处理会延迟一段时间,就使得回音回来延迟的更长,所以我们能够听到。而语言压缩技术是对一段数字信号进行采样后压缩,然后再把这个压缩信号送出去,这一段数字信号一般是30毫秒,40毫秒左右,语音数据经过拿出来做处理,处理之后,再送出去,这样就增加了40毫秒的延时,导致的结果就是有回音回来被听到。例如我们现在的电话网络都采用用数字交换机,而以前都是模拟交换机,送出的都是模拟信号,这个信号是以光速传递的,所以在模拟交换机时代,打本地电话和长途电话感觉不到有回音,只有通过卫星打国际电话的时候听到有回音,因为延迟时间就变长了,那么打本地电话,电信号以光的速度传递,只有几个毫秒,我们就听不见感觉不到回音的存在,而现在的电话网络全都用数字式的,它把电信号变成数字信号,而数字信号的处理,不是采一个数字就送出去,它是采集一段信号,可能是20毫秒40毫秒的信号进来了,把它处理一下,然后送出去,这样的数字处理的效率很高,把信号先压缩以后,再送出去,结果就是效率更高,本来一根线只能送一路电话,现在可能送10个电话,但是提高效率的同时,增加了延时作为结果,这是就导致回音的出现,例如我们打手机有回音,也是这种原因。
二、AEC(Adaptive Echo Control) 朗谷自适应回声消除回音器的原理
1、回声消除原理
回音的产生既复杂也简单,一般喇叭信号出来声音它会传递到麦克风,这个传递过程本身从技术上讲就有一个传递函数,传递本身就已经发生了一些变化,在传递过程中,高频和低频的传递系数是不一样的,通常低频传递的效率更高,高频传递的效率低一点 。麦克风跟喇叭的位置靠的越近,声音传递的时间越短,稍微离的远一点,那么延迟的时间会多一点,即使声音直接传过去,信号就已经有时间延时了,麦克风位置的改变,回音也随之改变,传递的声音随着距离位置的改变,它传递的时间也发生改变,接触到信号也就改变了,但声音除了这个直接信号以外,声音在空间中它是往各个方向传递的,它会碰到墙壁、碰到天花板反射回来,然后反射到麦克风,有的反射到桌面然后到麦克风,各个情况都存在,所以这是一个很复杂的问题,所有的信号最终的结果是叠加在一起的,叠加的结果就是有的信号被增强了,有的信号被减弱了,各种各样的都有,然后墙壁对声音信号的反射也不一样,高频低频都不一样,所以结果是一个复杂的所有叠加的结果,有的早有的晚,有的强有的弱,朗谷做回音消除呢,就是把总的传递函数效果算出来,那么并不是简单的说两个信号一样,这个你算出来的回音信号,跟送出去的参考信号,送到喇叭去的信号并不一样,它已经经过了一些传递改变了,那么可能有些已经延迟了100个毫秒,这是总的结果,回音消除的原理就是信号出去,然后麦克风收的信号肯定是这些信号各种各样的直接间接的传递,反射回来的信号叠加到一起,我们把这些传递函数计算出来,叠加结果计算出来,这样就能得到一个回音信号和麦克风信号,在理想条件下如果计算出来的和麦克风信号一样,就可以把回声消除掉,如果计算出来的有误差,那么就不可能消除干净,这就是回声消除的原理。回声消除技术后面还有很复杂的数学问题。回音消除最难的地方是变量太多,回音模型的改变回音的叠加的结果都要计算出来。另外还有采用回声抑制进行回声处理的方法,即非线性的过度就是两边同时说话的时候,它分辩不出那个是回音信号,所以就cutoff,剪切掉拉,这是处理不当,也可以说是单工,就是因为线性的做的不够好,还有回音,所以它就多切掉一点,回声抑制就是这个道理。也就是回声消除和回音抑制的不同。
- 在采用FPGA设计DSP系统中仿真的重要性 (06-21)
- 基于 DSP Builder的FIR滤波器的设计与实现(06-21)
- 达芬奇数字媒体片上系统的架构和Linux启动过程(06-02)
- FPGA的DSP性能揭秘(06-16)
- 用CPLD实现DSP与PLX9054之间的连接(07-23)
- DSP+FPGA结构在雷达模拟系统中的应用(01-02)