EPOS 波束成形麥克風陣列技術-顛覆任何會議室的音質想像
May 30 ,2022




什麼是「全向麥克風」


會議室全向麥克風有兩個主要功能。它必須通過揚聲器傳播遠程語音,在向遠程與會者傳送語音的同時捕捉會議室中的語音。理想情況下,全向麥克風必須清晰地傳送語音。這種全向麥克風使用“回音消除”來防止擴音器發出聲音,在會議室內廣播時通過揚聲器自身的麥克風返回到遠程收聽者。高品質全向麥克風還使用麥克風陣列波束成形技術,以進一步將聲音與環境噪音和混響隔離,從而提高遠程與會者的語音清晰度。

 

 

噪音和混響


在許多會議室場景中,背景噪音和混響可能會對談話的聲音造成干擾,導致語音清晰度降低。



噪音



 

在圖1.0 (a)中波形所示的吵雜環境中,語音會變得更加難以理解。因此,重要的是找到一種方法,確保任何遠程收聽者所接收的語音與噪聲之比都偏重於語音,如圖1.0 (b)中的波形所示。

 



混響


拾取房間內語音的麥克風首先會拾取語音–說話者的聲音會直接傳達到該麥克風。然後,麥克風將拾取混響,即從房間的牆壁、天花板和地板上反射的一連串聲音。

 

圖1.1:麥克風收到的直接和反射訊號

 

 


到達麥克風的直接訊號和反射訊號之間的差異在於時間和強度–反射聲音的到達時間晚於直接聲音(在不同的”時期”),而且到達時的能量(或“振幅”)更低。當麥克風接收相似聲級水平的直接和反射聲音時,其效果是使傳遞到遠程收聽者的訊號“變得模糊”。這會影響語音的清晰度。例如:對於許多會議室,遠程收聽者會感覺到發言者好像是在浴室裡。圖1.2 (a)表示從聲源直接到達麥克風的訊號,圖1.2 (b)表示同樣的訊號,並比較了麥克風與聲源聲音在房間中的混響傳遞情況。

 


 

 

定向麥克風系統

 

方向性概述


為了克服典型會議室中的噪音和混響,理想的全向麥克風對語音方向比對噪音源和混響源方向更敏感。這種麥克風系統可以描述為定向麥克風系統。

 

通常,所有麥克風都設計有特定的“拾音模式”,用於確定麥克風對任何特定方向發出聲音的敏感度。它們在全向模式(對來自任何方向的聲音均靈敏)到雙向(對來自兩個方向的聲音靈敏)之間變化不定,如圖2.0所示。在這些拾音模式中,最簡單且最常見的是全向麥克風。

 


圖2.0:全向式、單向式(心形)和雙指向式(8字形)麥克風拾音模式

 




從全向麥克風生成定向拾音



可通過一系列的全向麥克風進行集中和定向的拾音。這一目標可通過利用到達不同麥克風的聲級和時間差異來實現。諸如此類的定向麥克風系統稱為麥克風陣列波束形成器。為了說明這一理念,圖2.1顯示了一個名為“延遲相加波束成形器”的典型示例。


圖2.1 「延遲相加」波束成形器系統


 


典型的“延遲相加”波束成形器



在圖2.1中,聲音從某個角度到達麥克風陣列。由於其傾斜到達,聲音是在不同時間到達陣列的麥克風。這些時間差異取決於麥克風之間的距離大小。通過為每個麥克風引入特定延遲時間,就能以特定的方式對準訊號,以便為聲音到達的某個方向進行訊號同步。通過稱為“干擾”的過程,這些訊號的後續總和增加了某個方向上麥克風陣列的輸出電平,同時降低了其他方向上的輸出電平。通過調整這些延遲,甚至可以虛擬地”控制”陣列以”聚焦”來自任何特定方向的聲音。如果要準確靈活地運行系統,則必須仔細設計陣列的幾何形狀和對延遲的精確測量。

 





 

EXPAND 80中的高級波束成形



麥克風陣列波束成形在EXPAND 80全向麥克風中,將六個低噪音數字式MEMS麥克風置於優化的特定配置中,以便從任何角度拾取語音。如果沒有訊號處理,EXPAND 80將用作全向麥克風。但是,當所有六個麥克風都在使用中並且應用了高級訊號處理算法時,定向模式會聚焦成一個緊密的波束。

 

自適應波束轉向


這樣的可控聚焦波束可用於優化目標聲音,同時抑制來自其他方向的聲音,可以從任何所需角度拾取語音。該系統能夠分析所有方向的內容並自動選擇相關的方向。圖3.1表明,即使目標語音訊號改變了位置(例如,當兩個不同的人在會議室講話時),EXPAND 80也會自動將聚焦波束轉向目標訊號所期望的方向。

 

 

 

環境噪聲衰減


全向麥克風可均勻地拾取目標語音和不需要的周圍的噪聲源–參見圖3.2 (a)。但在使用高級波束成形時,情況並非如此。相比全向麥克風,EXPAND 80將從波束所指方向到達的語音準確拾取。從其他角度到達的聲音(如噪音和混響)將大大衰減立即降低。

 

 

 

先進的波束成形概念



主動消除混響


正如我們所見到的,混響會導致聲音以附加的延遲和角度到達全向麥克風。這會導致訊號在時間上的模糊,從而降低語音的清晰度。通過使用聚焦在目標訊號方向上的波束,可以持續提高語音與混響聲音的比率。相較目標訊號,以一定角度到達,從房間表面反射的聲音會在傳播時會發生衰減。



 

 

功能性多陣列系統


EXPAND 80旨在為大中型會議室提供高品質的拾音功能。對於更大的會議室,EXPAND 80最多可增加兩個額外的EXPAND 80麥克風單元,所有麥克風單元均通過相同的麥克風陣列技術工作。在連接後,較大的會議空間可被作為單個網絡的最多三個麥克風陣列覆蓋。所有連接的陣列中可用的最合適總波束將最有效地拾取語音。圖4.0中以相反的方式呈現了EXPAND 80和兩個EXPAND 80麥克風單元的配置。

 

 

EPOS可實現更緊密的協作得益於EXPAND 80系列麥克風中的陣列波束成形,聚焦的可調波束可以為遠程收聽者優化會議室內的個別聲音。借助於這種先進的EPOS技術,分散式團隊能夠像親臨現場一樣,以同樣的自信和清晰度開展合作。

 





資料來源:EPOS 提供




什麼是「全向麥克風」


會議室全向麥克風有兩個主要功能。它必須通過揚聲器傳播遠程語音,在向遠程與會者傳送語音的同時捕捉會議室中的語音。理想情況下,全向麥克風必須清晰地傳送語音。這種全向麥克風使用“回音消除”來防止擴音器發出聲音,在會議室內廣播時通過揚聲器自身的麥克風返回到遠程收聽者。高品質全向麥克風還使用麥克風陣列波束成形技術,以進一步將聲音與環境噪音和混響隔離,從而提高遠程與會者的語音清晰度。

 

 

噪音和混響


在許多會議室場景中,背景噪音和混響可能會對談話的聲音造成干擾,導致語音清晰度降低。



噪音



 

在圖1.0 (a)中波形所示的吵雜環境中,語音會變得更加難以理解。因此,重要的是找到一種方法,確保任何遠程收聽者所接收的語音與噪聲之比都偏重於語音,如圖1.0 (b)中的波形所示。

 



混響


拾取房間內語音的麥克風首先會拾取語音–說話者的聲音會直接傳達到該麥克風。然後,麥克風將拾取混響,即從房間的牆壁、天花板和地板上反射的一連串聲音。

 

圖1.1:麥克風收到的直接和反射訊號

 

 


到達麥克風的直接訊號和反射訊號之間的差異在於時間和強度–反射聲音的到達時間晚於直接聲音(在不同的”時期”),而且到達時的能量(或“振幅”)更低。當麥克風接收相似聲級水平的直接和反射聲音時,其效果是使傳遞到遠程收聽者的訊號“變得模糊”。這會影響語音的清晰度。例如:對於許多會議室,遠程收聽者會感覺到發言者好像是在浴室裡。圖1.2 (a)表示從聲源直接到達麥克風的訊號,圖1.2 (b)表示同樣的訊號,並比較了麥克風與聲源聲音在房間中的混響傳遞情況。

 


 

 

定向麥克風系統

 

方向性概述


為了克服典型會議室中的噪音和混響,理想的全向麥克風對語音方向比對噪音源和混響源方向更敏感。這種麥克風系統可以描述為定向麥克風系統。

 

通常,所有麥克風都設計有特定的“拾音模式”,用於確定麥克風對任何特定方向發出聲音的敏感度。它們在全向模式(對來自任何方向的聲音均靈敏)到雙向(對來自兩個方向的聲音靈敏)之間變化不定,如圖2.0所示。在這些拾音模式中,最簡單且最常見的是全向麥克風。

 


圖2.0:全向式、單向式(心形)和雙指向式(8字形)麥克風拾音模式

 




從全向麥克風生成定向拾音



可通過一系列的全向麥克風進行集中和定向的拾音。這一目標可通過利用到達不同麥克風的聲級和時間差異來實現。諸如此類的定向麥克風系統稱為麥克風陣列波束形成器。為了說明這一理念,圖2.1顯示了一個名為“延遲相加波束成形器”的典型示例。


圖2.1 「延遲相加」波束成形器系統


 


典型的“延遲相加”波束成形器



在圖2.1中,聲音從某個角度到達麥克風陣列。由於其傾斜到達,聲音是在不同時間到達陣列的麥克風。這些時間差異取決於麥克風之間的距離大小。通過為每個麥克風引入特定延遲時間,就能以特定的方式對準訊號,以便為聲音到達的某個方向進行訊號同步。通過稱為“干擾”的過程,這些訊號的後續總和增加了某個方向上麥克風陣列的輸出電平,同時降低了其他方向上的輸出電平。通過調整這些延遲,甚至可以虛擬地”控制”陣列以”聚焦”來自任何特定方向的聲音。如果要準確靈活地運行系統,則必須仔細設計陣列的幾何形狀和對延遲的精確測量。

 





 

EXPAND 80中的高級波束成形



麥克風陣列波束成形在EXPAND 80全向麥克風中,將六個低噪音數字式MEMS麥克風置於優化的特定配置中,以便從任何角度拾取語音。如果沒有訊號處理,EXPAND 80將用作全向麥克風。但是,當所有六個麥克風都在使用中並且應用了高級訊號處理算法時,定向模式會聚焦成一個緊密的波束。

 

自適應波束轉向


這樣的可控聚焦波束可用於優化目標聲音,同時抑制來自其他方向的聲音,可以從任何所需角度拾取語音。該系統能夠分析所有方向的內容並自動選擇相關的方向。圖3.1表明,即使目標語音訊號改變了位置(例如,當兩個不同的人在會議室講話時),EXPAND 80也會自動將聚焦波束轉向目標訊號所期望的方向。

 

 

 

環境噪聲衰減


全向麥克風可均勻地拾取目標語音和不需要的周圍的噪聲源–參見圖3.2 (a)。但在使用高級波束成形時,情況並非如此。相比全向麥克風,EXPAND 80將從波束所指方向到達的語音準確拾取。從其他角度到達的聲音(如噪音和混響)將大大衰減立即降低。

 

 

 

先進的波束成形概念



主動消除混響


正如我們所見到的,混響會導致聲音以附加的延遲和角度到達全向麥克風。這會導致訊號在時間上的模糊,從而降低語音的清晰度。通過使用聚焦在目標訊號方向上的波束,可以持續提高語音與混響聲音的比率。相較目標訊號,以一定角度到達,從房間表面反射的聲音會在傳播時會發生衰減。



 

 

功能性多陣列系統


EXPAND 80旨在為大中型會議室提供高品質的拾音功能。對於更大的會議室,EXPAND 80最多可增加兩個額外的EXPAND 80麥克風單元,所有麥克風單元均通過相同的麥克風陣列技術工作。在連接後,較大的會議空間可被作為單個網絡的最多三個麥克風陣列覆蓋。所有連接的陣列中可用的最合適總波束將最有效地拾取語音。圖4.0中以相反的方式呈現了EXPAND 80和兩個EXPAND 80麥克風單元的配置。

 

 

EPOS可實現更緊密的協作得益於EXPAND 80系列麥克風中的陣列波束成形,聚焦的可調波束可以為遠程收聽者優化會議室內的個別聲音。借助於這種先進的EPOS技術,分散式團隊能夠像親臨現場一樣,以同樣的自信和清晰度開展合作。

 





資料來源:EPOS 提供