騰訊會議背后又一黑科技浮出水面。7月7日,為了應對復雜聲學場景下的實時語音通信技術挑戰,解決企業會議室開會難題,騰訊會議旗下天籟實驗室推出天籟語音模組方案,由騰訊AI Lab多項技術加持,實現12米超長距離拾音,消除超過200種會議噪聲,在雙講,回聲消除等方面實現突破性升級。
據了解,該方案將應用于騰訊會議Rooms專款機型上,并已率先授權開放給騰訊會議Rooms�?钣布献骰锇�,助力打造會議室場景高清、純凈、流暢的開會體驗。與此同時,不做硬件的騰訊會議,目前還通過開放音視頻認證標準,聯合硬件設備廠商,共同為企業量身打造“軟硬一體”的云視頻會議解決方案。
解決企業會議室復雜場景開會難題,給企業會議室裝上“順風耳”
當下,在線會議成為企業高效辦公的標配,越來越多的企業衍生出線上線下協同開會的混合式會議需求,隨之而來的是會議室場景下面臨的聲學挑戰,一方面,在遠場情景下,講話者會因離麥克風距離遠,導致麥克風采集到的有效信號逐漸減弱,信噪比降低。另一方面則經常因為會議室場地空曠,聲音經過玻璃和墻面的折射后產生反射聲和混響、各類噪聲也會嚴重影響到開會質量。
對于企業來說,如何有效應對企業會議室場景下復雜的聲學環境,成為一個新課題。
騰訊會議基于會議室的特定場景,推出天籟語音模組方案,首次結合房間聲場感知、采集和空間聲場重建技術,開創性地解決了會議室復雜場景下,遠場多人音頻通信、多講話人實時追蹤、多人自動取景等實時音視頻技術難題,幫助企業和用戶實現在遠場復雜物理空間下通信體驗的突破性提升。
例如,同一會議室中,隨著人與音視頻設備的距離變遠,聲音在傳播過程中也會逐漸減弱,因此參加企業培訓、工作匯報等企業會議時,最常見的一個現象就是聽不清甚至聽不到。針對這一點,天籟語音模組方案將多個MEMS麥克風板嵌入到會議大屏中,結合音頻處理器,能夠實現180度廣角、12米超長距離拾音,相當于參會者即使相隔4層樓的距離,也完全可以像面對面交流般清晰、自然,給予參會者更靈活的活動空間,讓其在自由不設限的氛圍中開展討論。
在遠程會議中,很多人經常會遇到延遲而導致的聲音卡頓、聲音忽快忽慢,甚至與會者同時安靜或同時說話等尷尬的情況,極易破壞會議溝通思路,影響會議溝通進度。為了解決這一痛點,天籟語音模組方案突破性地將設備上行時延降低至幾十毫秒,可以讓遠程語音交流如面對面交談般實時。
值得一提的是,針對多人同時說話時聲音明顯失真現象,天籟語音模組方案則能有效實現雙講無剪切、無回聲泄露、無近端語音抑制,有效確保多人討論時,每個人的聲音都聽得見、聽得清、聽得真,提升會議參與感。天籟語音模組還基于深度學習模型,不僅可以將空調聲、風扇聲等平穩噪聲的降噪深度提高至40dB,還對包括寫筆觸屏聲、鍵盤聲、手指敲桌子、放水杯、翻紙等會議室場景下超200種各種突發噪聲進行針對性消除,提升語音信噪比,為用戶打造更加專注高效的會議氛圍。
開放技術能力,打造“軟硬一體”的云視頻會議生態
作為一款云視頻會議產品,騰訊會議自2019年底推出以來,一直致力于滿足用戶在不同場景下的開會需求。去年9月,騰訊會議發布企業版、會議室連接器以及新一代云視頻會議室解決方案“騰訊會議Rooms”, 試圖從根源上解決了企業會議組織難、效率低、管理難等問題。
除了與硬件廠商的合作,騰訊會議還積極通過開放標準API接口以及二次開發,助力企業IT、系統集成商等合作伙伴輕松適配多種會議場景,快速實現與騰訊會議的連接。數據顯示,近萬家企業通過接入騰訊會議API,大幅提升不同場景的會議體驗。
此次推出天籟語音模組方案,是騰訊會議基于企業用戶需求,在企業會議室場景下的再次發力。騰訊天籟實驗室的融合感知編碼、聲學硬件設計、經典語音信號處理和深度學習技術,通過覆蓋不同應用場景,網絡條件和終端設備,為騰訊會議提供底層實時音頻通信技術。
未來,騰訊會議將持續深耕用戶需求、創新技術、打磨產品,為用戶提供更清晰、更流暢、實時互動會議體驗,增強企業的協作溝通,從而不斷提升企業競爭力,為企業的組織升級提供源動力。