推出消除超200种噪音的黑科技 腾讯会议为什么自己不做大屏硬件?

2021-07-09 17:27:37
来源: 时代在线

去年年初以来,受到新冠疫情的影响,在线会议、在线办公和在线教育等远程沟通迅速在全球范围内流行,腾讯会议、阿里钉钉、Microsoft TeamsZoom等云视频会议软件也出现爆发式增长。

如今,疫情趋于平稳,全国全面复工复产,企业的多人会议也从线上搬回了会议室。在线会议高效的优势逐渐显现之下,线上线下协同开会的混合式会议成为了主流。不过,会议室场景下的在线会议也面临着噪声复杂、远距离拾音困难等难题。

77日,腾讯会议旗下天籁实验室推出天籁语音模组方案,以应对复杂声学场景下的实时语音通信技术挑战,解决企业会议室开会难题。据介绍,该模组可实现12米超长距离拾音,消除超过200种会议噪声,在双讲、回声消除等方面实现了突破性升级。 

对于外界关注的天籁语音模组的商业化,腾讯天籁实验室总经理商世东表示,该方案已授权开放给硬件合作伙伴,并率先应用于腾讯会议Rooms专款机型上。腾讯会议不卖大屏硬件,这是我们的商业模式决定的,我们主要起到一个连接的作用,让用户在各种场景下都有一个清晰流畅智能的通话体验。

会议室复杂场景下的开会难题 

在日常的线下会议中,相信很多人都会有这样一种体验:同一会议室里,随着人与音视频设备的距离变远,声音在传播过程中会逐渐减弱。而且声音经过玻璃和墙面的折射后产生反射声和混响,以及各类噪声都影响着开会质量。 

不仅如此,在远程会议中,很多人经常会遇到延迟而导致的声音卡顿、声音忽快忽慢,甚至与会者同时安静或同时说话等尴尬的情况,极易破坏会议沟通思路,影响会议沟通进度。 

从目前云视频会议行业来看,主要玩家有两类,一类是提供终端设备的硬件厂商,一类是提供服务的SaaS厂商。前者以思科、华为、中兴等硬件厂商为代表,后者则以腾讯会议、阿里钉钉、Zoom、小鱼易连等为代表。如何有效应对企业会议室场景下复杂的声学环境,成为了云视频会议软件和硬件厂商们的新课题。

实际上,功课会议室复杂场景的开会难题并不简单。比如说远场的拾音,这个问题非常复杂。腾讯会议天籁实验室技术研发专家余涛表示,我距离麦克风在1米以内的时候,信噪比通常在10dB30dB。然而远场的话距离是010米,拾音范围是近场的100倍,这里带来的挑战就非常明显。 

据余涛分析,首先是信噪比,声音的传播距离增加一倍,能量会衰减6dB,也就是幅度衰减一半,信噪比的恶劣程度会达到负10、负20的程度,噪声的特性也会发生变化。然后是语音本身的特性,偏离近场语音很多,比如我们面向屏幕说话时,是有语音的直达波被麦克风接收的,但是如果这个人说话的时候是侧着说的,就没有直达波的触达,由此带来的技术的挑战是很大的。

所以光靠一个纯粹的语音或者音频算法,即使在深度学习模组很强大的情况下,能够较好地解决远场的语音还是比较难的。需要从声学层面、从硬件设计层面,跟强大的算法能力相结合,综合地提升远场拾音能力。余涛称。 

腾讯会议为什么不做大屏硬件?

腾讯天籁实验室是腾讯会议旗下顶尖都音频通信和处理研发团队,20209月腾讯全球数字生态大会上,其发布的面向实时音视频应用的新一代实时音频技术品牌腾讯天籁,成为了腾讯会议高速成长背后的技术密码,支撑了腾讯会议上线两个月内日活跃用户超过1000万,并在上线245天里实现用户数破亿。 

如今,天籁实验室再次发布黑科技——天籁语音模组方案,试图进一步攻克会议室复杂场景下的开会难题。据腾讯天籁实验室资深研究员刘成介绍,天籁语音模组是软件硬件一体的嵌入式方案,包括麦克风阵列、天籁算法。该模组可实现12米超长距离拾音,消除包括写笔触屏声、键盘声、翻纸等会议室场景下超200种噪声,在双讲、回声消除等方面都实现了升级。 

不过,外界最为关注的,除了天籁语音模组在降噪和远距离拾音等方面的提升之外,还有它的商业化路径。 

回望过去,中国许多SaaS厂商发展到一定阶段,很容易向硬件厂商转型,例如宝利通、苏州科达等视频会议公司。因为视频会议的一大痛点是SaaS企业难以盈利,企业发展到后期不得不依靠硬件来创收。 

对于天籁语音模组的商业化路径,商世东表示,将以模组的方式对腾讯会议的硬件合作伙伴开放,根据厂商具体的产品制定量产计划。国内大屏厂商在音视频方面的能力参差不齐,而天籁语音模组是一套软硬件算法、深度学习和经典信号处理相结合的处理方案,能够提升他们的音视频能力,这是我们最大的初衷。 

腾讯会议不做硬件,不做大屏,不做会议电话。商世东直言,这是我们的商业模式决定的,腾讯会议主要做一个连接的作用,让用户在各种场景下都有一个清晰流畅智能的通话体验。 

实际上,腾讯会议不做大屏硬件的逻辑就像当年芯片厂商的交钥匙解决方案一样。例如手机厂商生产手机,若自研芯片将需要承担极高的成本和风险,而芯片厂商的交钥匙解决方案,可以为其提供所需WiFi芯片模组、指纹识别芯片模组等,大幅降低其成本。 

天籁语音模组亦是如此,在某种程度上将视频会议的技术标准提高了,但是若将方案以模组的形式开放给视频会议硬件厂商,从行业的角度来讲,则是降低了硬件设备提升会议体验的门槛。(文/吾遥)

本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com

扫码分享