<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

市場主流的麥克風陣列技術分析

電子設計 ? 來源:互聯網 ? 作者:佚名 ? 2018-01-16 09:38 ? 次閱讀

風吹麥浪,靜夜蟲鳴,人耳能聽到的聲音大約有40多萬種,頻率在20至20000赫茲之間;不僅如此,借助大腦,人類還具有分辨噪音和過濾干擾的能力。那么對于機器呢?

麥克風陣列是什么?

麥克風陣列(Microphone Array),從字面上,指的是麥克風的排列。也就是說由一定數目的聲學傳感器(一般是麥克風)組成,用來對聲場的空間特性進行采樣并處理的系統。

早在20世紀70、80年代,麥克風陣列已經被應用于語音信號處理的研究中,進入90年代以來,基于麥克風陣列的語音信號處理算法逐漸成為一個新的研究熱點。而到了“聲控時代”,這項技術的重要性顯得尤為突出。

麥克風陣列能干什么?

1.語音增強(Speech Enhancement)

語音增強是指當語音信號被各種各樣的噪聲(包括語音)干擾甚至淹沒后,從含噪聲的語音信號中提取出純凈語音的過程。所以DingDong在嘈雜環境下,也能準確識別語音指令。

通過麥克風陣列波束形成進行語音增強示意圖

從20世紀60年代開始,Boll等研究者先后提出了針對使用一個麥克風的語音增強技術,稱為單通道語音增強。因為它使用的麥克風個數最少,并且充分考慮到了語音譜和噪聲譜的特性,使得這些方法在某些場景下也具有較好的噪聲抑制效果,并因其方法簡單、易于實現的特點廣泛應用于現有語音通信系統與消費電子系統中。

但是,在復雜的聲學環境下,噪聲總是來自于四面八方,且其與語音信號在時間和頻譜上常常是相互交疊的,再加上回波和混響的影響,利用單麥克風捕捉相對純凈的語音是非常困難的。而麥克風陣列融合了語音信號的空時信息,可以同時提取聲源并抑制噪聲。

目前基于線性陣列、平面陣列以及空間立體陣列的波束形成和降噪技術,效果均達到業界一流水平。

2013年科大訊飛車載降噪產品和國際競爭對手效果對比

2.聲源定位(Source Localization)

現實中,聲源的位置是不斷變化的,這對于麥克風收音來說,是個障礙。麥克風陣列則可以進行聲源定位,聲源定位技術是指使用麥克風陣列來計算目標說話人的角度和距離,從而實現對目標說話人的跟蹤以及后續的語音定向拾取,是人機交互、音視頻會議等領域非常重要的前處理技術。所以麥克風陣列技術不限制說話人的運動,不需要移動位置以改變其接收方向,具有靈活的波束控制、較高的空間分辨率、高的信號增益與較強的抗干擾能力等特點,因而成為智能語音處理系統中捕捉說話人語音的重要手段。

混響產生原因示意圖

3.去混響(Dereverberation)

一般我們聽音樂時,希望有混響的效果,這是聽覺上的一種享受。合適的混響會使得聲音圓潤動聽、富有感染力?;祉懀≧everberation)現象指的是聲波在室內傳播時,要被墻壁、天花板、地板等障礙物形成反射聲,并和直達聲形成疊加,這種現象稱為混響。

但是,混響現象對于識別就沒有什么好處了。由于混響則會使得不同步的語音相互疊加,帶來了音素的交疊掩蔽效應(Phoneme Overlap Effect),從而嚴重影響語音識別效果。

影響語音識別的部分一般是晚期混響部分,所以去混響的主要工作重點是放在如何去除晚期混響上面,多年來,去混響技術抑制是業界研究的熱點和難點。利用麥克風陣列去混響的主要方法有以下幾種:

(1)基于盲語音增強的方法(Blind signal enhancement approach),即將混響信號作為普通的加性噪聲信號,在這個上面應用語音增強算法。

(2)基于波束形成的方法(Beamforming based approach),通過將多麥克風對收集的信號進行加權相加,在目標信號的方向形成一個拾音波束,同時衰減來自其他方向的反射聲。

(3)基于逆濾波的方法(An inverse filtering approach),通過麥克風陣列估計房間的房間沖擊響應(Room Impulse Response, RIR),設計重構濾波器來補償來消除混響。

現在科大訊飛實現的基于麥克風陣列的去混響技術能很好的對房間的混響情況進行自適應的估計,從而很好的進行純凈信號的還原,顯著的提升了語音聽感和識別效果,在測試對比中,多種混響時間下識別效果接近手機近講水平。

混響語音信號頻譜

經過去混響后的語音信號頻譜

4.聲源信號提?。ǚ蛛x)

家里人說話太多,DingDong聽誰的呢。這個時候就需要DingDong聰明的辨別出哪個聲音才是指令。而麥克風陣列可以實現聲源信號提取,聲源信號的提取就是從多個聲音信號中提取出目標信號,聲源信號分離技術則是將需要將多個混合聲音全部提取出來。

通過麥克風陣列波束形成做語音提取和分離

利用麥克風陣列做信號的提取和分離主要有以下幾種方式:

(1)基于波束形成的方法,即通過向不同方向的聲源分別形成拾音波束,并且抑制其他方向的聲音,來進行語音提取或分離;

(2)基于傳統的盲源信號分離(Blind Source Separation)的方法進行,主要包括主成分分析(Principal Component Analysis,PCA)基于獨立成分分析(Independent Component Analysis,ICA)的方法。

當下的麥克風陣列

麥克風陣列技術雖然已經可以達到相當的技術水平,但是總體上還是存在一些問題的,比如當麥克風和信號源距離太遠時(比如10m、20m距離),錄制信號的信噪比會很低,算法處理難度很大;對于便攜設備來說,受設備尺寸以及功耗的限制,麥克風的個數不能太多,陣列尺寸也不能太大。而分布式麥克風陣列技術則是解決當前問題的一個可能途徑。所謂分布式陣列就是將子陣元或子陣列布局到更大的范圍內,相互之間通過有線或者無線的方式進行數據的交換和共享,并在此基礎上進行廣義上的聲源定位、波束形成等技術實現信號處理。

相對于目前集中式的麥克風陣列,分布式陣列的優勢也是非常明顯的。首先分布式麥克風陣列(尤其無線傳輸)的尺寸的限制就不存在了;另外,陣列的節點可以覆蓋很大的面積——總會有一個陣列的節點距離聲源很近,錄音信噪比大幅度提升,算法處理難度也會降低,總體的信號處理的效果也會有非常顯著的提升,因此分布式陣列有可能是未來智能家居和會議系統中的主流方案。目前科大訊飛已經開始了相關技術研究的布局工作。

在萬物互聯的今天,麥克風陣列技術已經深刻的走進了我們的日常生活。在智能車載、智能家居、機器人、可穿戴設備等應用熱潮正興起的時代,語音交互由于其便捷性,成了人機交互入口的第一選擇,麥克風陣列自然也成為其中非常重要的前端技術。

在美國當地時間2016年9月13日,國際多通道語音分離和識別大賽(CHiME)組委會在美國舊金山Google公司揭曉了第四屆CHiME-4的大賽結果,在公布結果之前,我們先來看看這個CHiME是什么?CHiME(Computational Hearing in Multisource Environments)始辦于2011年,由法國計算機科學與自動化研究所、英國謝菲爾德大學、美國三菱電子研究實驗室等知名研究機構所發起,比賽的目的是希望學術界和工業屆針對高噪聲和混響等現象影響下的實際場景提出全新的語音識別解決方案,以進一步提升語音識別的實用性和普適性,屬于國際語音識別評測中的高難度比賽。

今年科大訊飛首次參加該項賽事,通過和中國科學技術大學杜俊教授團隊、西北工業大學陳景東教授、佐治亞理工學院李錦輝教授等國內外知名專家的深入合作,斬獲全部三個項目的桂冠并大幅刷新了各項目的歷史最好記錄,三個項目分別是六麥克風、雙麥克風和單麥克風場景下的語音分離和英文識別任務。雖然比賽的語種是英文,但無論中文還是英文,在語音技術上是相通的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 麥克風陣列
    +關注

    關注

    4

    文章

    20

    瀏覽量

    13992
  • 科大訊飛
    +關注

    關注

    19

    文章

    756

    瀏覽量

    60505
收藏 人收藏

    評論

    相關推薦

    MEMS麥克風技術和專利侵權風險分析

    中國初創企業(芯奧微、敏芯),所以樓氏電子的市場份額將繼續下滑。MEMS麥克風廠商們都在研發創新的技術和制造解決方案,并及時申請專利來保護自己的發明。蘋果iPhone6中的MEMS麥克風
    發表于 05-15 15:17

    ICS‐41350 數字麥克風

    麥克風陣列(Microphone Array)技術能夠實現遠場拾音,人聲定位、回音消除和打斷等效果,麥克風陣列方案非常適合使用在視頻會議攝像
    發表于 02-11 12:01

    麥克風陣列音頻信號進行數字化設計

    陣列捕獲;這種情況下,陣列包括四個模擬駐極體電容麥克風。盡管在圖2中未顯示,但典型的駐極體電容麥克風在偏置時接近電流源。模數轉換器(ADC)對來自
    發表于 06-25 10:10

    基于Amazon AVS 智能音箱麥克風陣列立體聲開發方案

    適用于Amazon AVS的VocalFusion?立體聲開發套件具有緊湊的四麥克風線性陣列,使開發人員和OEM能夠為消費電子產品和物聯網產品添加遠場語音捕獲。線性設計經過優化,可集成到智能電視
    發表于 07-12 10:25

    為什么需要麥克風陣列?

    其他結構形式的麥克風陣列,比如分布式陣列。多個麥克風陣列之間的成本差異現在正在變小,估計明年的成本就會相差不大。這是趨勢,新興的
    發表于 07-28 14:25

    科普麥克風陣列原理

    1 麥克風陣列麥克風陣列,是一組位于空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對
    發表于 07-28 14:28

    麥克風陣列介紹

    1 麥克風陣列麥克風陣列,是一組位于空間不同位置的全向麥克風按一定的形狀規則布置形成的陣列,是對
    發表于 08-08 18:43

    麥克風陣列 僅有兩個麥克風,會不會不夠用?

    麥克風陣列麥克風只有2個,帶來的直接優勢是成本低很多。同時,它小巧的構型決定它的應用也更為靈活。雙麥克風陣列,顧名思義在錄音系統上只使用
    發表于 08-08 18:44

    全球量產麥克風陣列的陣型技術盤點

    以及分布式陣列。但是由于這些特殊陣列的產品目前銷量還較小,在市場上的影響還很小。為何不同產品的麥克風陣列差異如此大?從上面的盤點可以看出,A
    發表于 08-08 18:55

    如何正確選擇麥克風陣列陣型和技術?

    遠場語音交互產品確實比較復雜,僅僅選用麥克風陣列就有如此多的問題。那么應當如何選擇合適的麥克風陣列技術呢?1、從產品實際角度出發,先定前端
    發表于 08-08 18:56

    汽車 麥克風陣列技術進行詳述

    概述 我們之前介紹過語音識別技術(ASR),隨著ASR的逐步成熟,麥克風陣列也逐步得到重用。尤其在汽車里,空間有限,便于聲音的近場定位,而麥克風的布線可以很方便和很規則,便于實現成
    發表于 08-10 14:30

    麥克風技術規格解析

    作者 :Jerad Lewls簡介在 ADI 公司的眾多產品中,MEMS 麥克風 IC 的獨特之處在于其輸入為聲壓波。因此,這些器件的數據手冊中包括的某些技術規格可能不為大家所熟悉,或者雖然熟悉,但
    發表于 11-01 11:26

    MEMS與ECM:比較麥克風技術

    MEMS麥克風技術帶來的諸多優勢體現在其迅速擴大的市場份額中。例如,那些在空間有限的應用中尋找解決方案的人將看好MEMS麥克風提供的小封裝尺寸,以及通過在其內部包含模擬和數字電路實現的
    發表于 02-23 14:05

    MEMS麥克風設計方法及關鍵特性

    的前端是麥克風,它檢測語音和其他環境噪聲。因此,改善音頻捕捉可以提高信號鏈整體的性能并降低功耗。麥克風是把聲學信號轉換為電信號以供助聽器音頻信號鏈處理的傳感器。有許多技術可用于這種聲電轉換,但電容
    發表于 11-05 08:00

    如何去實現一種基于麥克風陣列的聲源定位裝置系統設計

    基于麥克風陣列的聲源定位裝置的組成及功能有哪些?如何去實現一種基于麥克風陣列的聲源定位裝置系統設計?
    發表于 11-11 06:49
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>