Vesper 麥克風的單層耐用結構使其免受空氣中的顆粒和污染物引起的漂移和降解。
隨著智能設備大戰愈演愈烈,許多傳感器公司的目標是為聲控設備構建最好的麥克風陣列。隨著此類設備的激增席卷消費市場,此類設備的需求量很大。先進的傳感器公司被證明是該領域的創新者,他們引入了新技術來延長電池壽命、提高遠場音頻質量并抵御環境污染物。
先進的傳感器公司Vesper就是這樣的實體之一。其最新、最先進的麥克風VM3000是一款脈沖密度調制 (PDM) 輸出麥克風,具有內置模數轉換器 (ADC),可轉換 MEMS 傳感器捕獲的輸入模擬信號進入數字領域。與需要外部 ADC 的模擬麥克風同類產品相比,數字麥克風可節省材料清單 (BOM) 和設計尺寸,以及更高的射頻 (RF) 和電磁干擾 (EMI) 噪聲抗擾度。
數字麥克風還可以在多種模式下運行,其中編解碼器或應用處理器可以使用時鐘頻率定義麥克風的狀態。例如,VM3000 提供四種此類功耗模式:睡眠 (《1 μA)、待機 (145 μA)、低功耗 (400 μA) 和正常 (700 μA),具體取決于操作的時鐘頻率。圖1為麥克風的狀態圖:
圖 1. VM3000 數字 MEMS 麥克風的狀態圖。
麥克風上的左/右 (L/R) 選擇引腳還允許在一對 VM3000 之間復用數據線,以形成立體聲麥克風配置(單聲道和立體聲配置的典型時序圖和應用電路可從數據表)。
獨特的差異化
雖然 PDM 輸出和多模式操作是當今市場上許多數字 MEMS 麥克風的典型特征,但與電容式同類產品相比,Vesper 的 VM3000 為嵌入式語音接口提供了獨特的差異化。
讓我們從 VM3000 麥克風的穩健性開始。VM3000 采用與 Vesper 的其他模擬麥克風相同的壓電 MEMS 結構,使用單層壓電晶體,對灰塵、水、濕氣和其他環境顆粒具有魯棒性。
在具有雙板設計的電容式 MEMS 麥克風中,進入 MEMS 傳感器的任何外來顆粒都可能被困在板之間,因此隨著時間的推移會降低靈敏度和頻率響應。隨著陣列中各個麥克風的性能漂移,波束形成算法將這種差異視為方向性線索,使波束遠離預期方向。覆蓋聲學端口的網格或薄膜會使 SNR 降低 2-3 dB,也增加了設計的成本和復雜性。
相比之下,Vesper 麥克風的單層耐用結構使其不受這些漂移的影響,并提供穩定的陣列而無需網格。圖 2 顯示了兩種不同類型的 MEMS 麥克風在獨立測試設施中暴露于灰塵之前和之后的頻率響應比較。
圖 2. 根據 JDEC 標準,電容式(左)和 Vesper(右)麥克風在灰塵暴露前后的頻率響應測量。
有人可能會問,“既然電容式 MEMS 麥克風已經存在多年,為什么現在這很重要?” 答案在于在智能揚聲器、安全攝像頭、耳機、智能手機等語音激活設備中越來越多地采用麥克風陣列?,F在強大的壓電麥克風的模擬和數字版本都可用,開發人員可以放心,長期其陣列的長期穩定性,無論其芯片組上可用的接口如何。對于需要多個帶有保護網或膜的麥克風的陣列,VM3000 是一個福音,因為具有 IP57 等級的 Vesper 產品不需要網/膜,從而實現更簡單的設計和不變的性能,以及節省 BOM 。
與其他壓電麥克風一樣,VM3000 不需要電荷泵來產生偏置電壓。因此,與電容式麥克風相關的 10 ms 啟動和模式切換延遲相比,VM3000 可以在 200 μs 內從睡眠中喚醒,并在 100 μs 內切換不同的電源模式。
這種 50 倍的啟動時間優勢使語音激活系統能夠以足夠快的速度喚醒以捕獲完整的喚醒詞。相比之下,電容式麥克風的緩慢啟動限制了整個系統的喚醒時間,從而影響了喚醒詞檢測性能。
對于啟動時間的直觀解釋,請考慮圖 3 所示的語音激活系統的簡化框圖。在此設計中,VM3000 與 Vesper 的零功率監聽 (ZPL) 麥克風 VM1010 結合使用。
圖 3. Vesper 的 ZPL 麥克風與 VM3000 數字麥克風相結合的簡化語音激活系統。
VM1010 是一款模擬麥克風,僅當有任何聲音活動超過預定義的聲壓級時才會從超低功耗睡眠模式中喚醒。此喚醒由處理器使用兩個 GPIO 控制引腳控制:Dout 和 Mode。綜上所述,當環境中有聲音活動時,VM1010 從睡眠模式切換到正常模式,并在 Dout 上輸出高電平。然后,Dout 信號驅動 DSP/編解碼器上的時鐘,進而設置 VM3000 上的 CLK 以將麥克風從睡眠中喚醒。
上述系統也進行了修改,以測量 VM3000 和具有可比聲學規格的電容式麥克風的啟動時間。圖 4a 和 4b 顯示了 VM1010 上 Mode/Dout 引腳的狀態轉換,以及每種情況下數字麥克風上的 CLK 和 PDM 數據引腳。當 VM1010 聽到喚醒字時,Dout 從低變高,處理器在 8 μs 內設置模式引腳。PDM 時鐘信號從 16 μs 開始(如圖 4a 所示)以將數字麥克風從睡眠模式切換出來,并且 PDM 數據在 200 μs 內可在 DATA 引腳上使用,如圖 4b 所示。
圖 4a。使用 VM1010 和數字麥克風進行模式轉換(為粒度單獨顯示)
圖 4b。在示波器上測量的 VM1010 + VM3000 時序。(來源:維斯珀)
相比之下,圖 5 顯示電容式麥克風上的 PDM 數據僅在 CLK 變為高電平后 10 ms 可用。因此,DSP/編解碼器必須等待這段時間才能接收 PDM 數據并執行額外的喚醒字處理。
圖 5. VM1010 和電容式 MEMS 數字麥克風時序。(來源:維斯珀)
從實現的角度來看,這意味著 DSP 必須將電容式麥克風保持在低功耗模式之一,而不是切換回待機模式(典型電流為 50 μA),因為它無法以足夠快的速度喚醒以服務于喚醒詞檢測請求。 相比之下,Vesper 的系統可以在電流略低于 1 μA 的情況下長時間保持睡眠模式,同時根據需要在不到 100 μs 的時間內切換到高性能模式。
這種啟動時間優勢如何轉化為喚醒詞檢測性能?為了進一步研究,Vesper 測量了喚醒詞檢測性能,以評估啟動時間對錯誤拒絕率 (FRR) 的影響。
FRR 被測量為所有 50 種不同的喚醒詞話語中錯過的喚醒詞的數量。在這些測試中,測量是在辦公室類型的房間內進行的,環境安靜,環境本底噪聲為 30 dBA。頭和軀干嘴模擬器 (HATS) 用于播放從 75 dB 到 98 dBSPL 的不同語音級別的話語。每個話語之間使用 30 秒的間隔,以確保整個系統(包括 VM1010 和 VM3000)在喚醒后切換到睡眠模式。圖 6 顯示了 FRR 性能與 VM3000 和電容式麥克風的比較。
圖 6. 使用 Vesper(藍色)和電容(紅色)麥克風進行喚醒詞檢測。
在較高的聲壓級下,由于麥克風輸入端的聲級較高,兩個麥克風的 FRR 性能相似。隨著 SPL 水平的降低,喚醒緩慢的系統會受到懲罰,因為喚醒詞中的第一個音節丟失了。結果表明,與 Vesper 的 ZeroPower Listening 技術結合使用時,VM3000 與電容式麥克風相比,關鍵字準確度提高了 2 倍。
總結
雖然數字麥克風為設計人員在編解碼器周圍布線和布線方面提供了更好的靈活性已被廣泛接受,但 Vesper 獨特的價值主張還提供了額外的設計靈活性和在啟動時間方面的前所未有的優勢。Vesper 數字麥克風產品組合的發展將是朝著強大而準確的語音激活設備的擴散邁出的一大步,即使在惡劣的環境條件下也可以運行。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
18563瀏覽量
224078 -
解碼器
+關注
關注
9文章
1080瀏覽量
40286 -
adc
+關注
關注
95文章
5689瀏覽量
540432
發布評論請先 登錄
相關推薦
評論