<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音識別的技術歷程及工作原理

要長高 ? 來源:網絡整理 ? 作者:網絡整理 ? 2024-03-22 16:58 ? 次閱讀

語音識別技術,也被稱為自動語音識別(Automatic Speech Recognition,ASR),是以語音為研究對象,通過語音信號處理和模式識別讓機器理解人類語言,并將其轉換為計算機可輸入的數字信號的一門技術。

語音識別的技術歷程

現代語音識別可以追溯到1952年,Davis等人研制了世界上第一個能識別10個英文數字發音的實驗系統,從此正式開啟了語音識別的進程。語音識別發展到今天已經有70多年,但從技術方向上可以大體分為三個階段。

下圖是從1993年到2017年在Switchboard上語音識別率的進展情況,從圖中也可以看出1993年到2009年,語音識別一直處于GMM-HMM時代,語音識別率提升緩慢,尤其是2000年到2009年語音識別率基本處于停滯狀態。2009年隨著深度學習技術,特別是DNN的興起,語音識別框架變為DNN-HMM,語音識別進入了DNN時代,語音識別精準率得到了顯著提升。

2015年以后,由于“端到端”技術興起,語音識別進入了百花齊放時代,語音界都在訓練更深、更復雜的網絡,同時利用端到端技術進一步大幅提升了語音識別的性能,直到2017年微軟在Swichboard上達到詞錯誤率5.1%,從而讓語音識別的準確性首次超越了人類,當然這是在一定限定條件下的實驗結果,還不具有普遍代表性。

語音識別原理

語音識別的本質是一種基于語音特征參數的模式識別,即通過學習,系統能夠把輸入的語音按一定模式進行分類,進而依據判定準則找出最佳匹配結果。目前,模式匹配原理已經被應用于大多數語音識別系統中。如圖1是基于模式匹配原理的語音識別系統框圖。

一般的模式識別包括預處理,特征提取,模式匹配等基本模塊。如圖所示首先對輸入語音進行預處理,其中預處理包括分幀,加窗,預加重等。其次是特征提取,因此選擇合適的特征參數尤為重要。

常用的特征參數包括:基音周期,共振峰,短時平均能量或幅度,線性預測系數(LPC),感知加權預測系數(PLP),短時平均過零率,線性預測倒譜系數(LPCC),自相關函數,梅爾倒譜系數(MFCC),小波變換系數,經驗模態分解系數(EMD),伽馬通濾波器系數(GFCC)等。

在進行實際識別時,要對測試語音按訓練過程產生模板,最后根據失真判決準則進行識別。常用的失真判決準則有歐式距離,協方差矩陣與貝葉斯距離等。

語音識別技術涉及的領域有哪些

它涉及的領域相當廣泛,包括但不限于以下幾個方面:

智能語音助手:智能語音技術為我們帶來了智能助理,如Siri、小愛同學等。用戶可以通過語音與智能助理進行交流,詢問天氣、定鬧鐘、發送消息等,實現更加直觀、便捷的操作。

智能家居:借助智能語音技術,用戶可以通過簡單的口頭指令控制家居設備,例如開關燈、調整溫度、播放音樂等,實現智能家居的全方位控制和管理。

醫療領域:語音識別技術可以輔助醫生對病人進行診斷,對病人的病情和治療方案進行記錄等。此外,它還可以應用于醫療設備的操作中,使得醫療設備更加智能化和便利化。

教育領域:語音識別技術可以輔助學生進行口語練習,提高學生的英語口語水平等。另外,它還可以應用于教育評測中,通過語音識別來評估學生的語音表達能力、語感等。

金融領域:語音識別技術可以用于身份驗證、語音指令操作等。此外,它還可以應用于金融客戶服務中,使得客戶可以通過語音來查詢賬戶信息、進行轉賬等操作,更加便捷快速。

游戲領域:語音識別技術可以應用于游戲領域,如通過語音識別來與游戲角色進行交互,使得游戲更加真實、有趣。

智能客服:語音識別技術可以幫助用戶通過語音指令獲取客服服務,解決客服等待時間長的問題。

語音翻譯:在全球化的今天,語音識別技術可以幫助人們實現不同語言之間的翻譯。

隨著技術的不斷發展和完善,語音識別技術將在更多領域得到應用,并為人們的生活帶來更多便利。

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 信號處理
    +關注

    關注

    47

    文章

    858

    瀏覽量

    102579
  • 數字信號
    +關注

    關注

    2

    文章

    800

    瀏覽量

    47246
  • 語音識別
    +關注

    關注

    37

    文章

    1635

    瀏覽量

    111866
收藏 人收藏

    評論

    相關推薦

    語音編碼識別的請進

    有哪位童鞋是研究語音編碼識別的,可以與我討論下.歡迎加Q:541274397
    發表于 07-11 09:46

    請問電銷機器人智能語音識別的原理是什么?

    個重要突破,而電銷機器人也是建立在這項技術上才得以出現的一個產品。目前的智能語音識別的技術已經趨于成熟,而且電銷機器人的服務商也會適時的對機器人的話術庫、知識庫進行補充和修正,所以還在
    發表于 06-12 14:03

    模式識別的關鍵技術

    領域中,聲紋識別技術以其獨特的方便性、經濟性和準確性等優勢受到世人矚目,并日益成為人們日常生活和工作中重要且普及的安驗證方式。而且利用基因算法訓練連續隱馬爾柯夫模型的語音
    發表于 12-11 14:17

    特定人語音識別的方法有哪些?

    特定人語音識別的方法有哪些?特定人語音識別技術在汽車控制上的應用是什么?
    發表于 05-14 06:34

    自動語音識別的原理是什么?

    自動語音識別的原理是什么?如何利用WaveNet實現自動語音識別?
    發表于 06-15 09:14

    離線語音識別和控制的工作原理及應用

    的應用越來越廣泛。本文將深入探討離線語音識別的工作原理,以及其所使用的技術。   一、離線語音識別的
    發表于 11-07 18:01

    離線語音識別及控制是怎樣的技術?

    信號轉化為文本或語義結果。  與傳統的云端語音識別相比,離線語音識別的工作原理是將語音
    發表于 11-24 17:41

    語音識別技術的發展歷程,語音識別是如何工作的?語音識別資料概述

    說到語音識別,大家熟悉的可能是最近十年里才出現的微信語音轉文字,或者語音實時記錄和翻譯。但其實語音識別的
    的頭像 發表于 09-01 10:48 ?9967次閱讀

    語音識別的技術歷程

    深度學習技術自 2009 年興起之后,已經取得了長足進步。語音識別的精度和速度取決于實際應用環境,但在安靜環境、標準口音、常見詞匯場景下的語音識別
    的頭像 發表于 08-22 14:21 ?4200次閱讀

    簡析語音識別技術工作原理

    語音識別技術是讓機器通過識別語音信號轉變為文本,進而通過理解轉變為指令的技術。
    發表于 12-23 11:20 ?1.1w次閱讀
    簡析<b class='flag-5'>語音</b><b class='flag-5'>識別</b><b class='flag-5'>技術</b>的<b class='flag-5'>工作原理</b>

    語音識別的兩個方法_語音識別的應用有哪些

    本文主要闡述了語音識別的兩個方法及語音識別的應用。
    發表于 04-01 09:04 ?5722次閱讀

    虹膜識別技術的過程_虹膜識別的發展歷程

    本文首先介紹了虹膜識別技術的概念,其次闡述了虹膜識別技術的過程,最后闡述了虹膜識別的發展歷程。
    發表于 04-02 14:22 ?5428次閱讀

    離線語音識別和控制的工作原理及應用

    。本文將深入探討離線語音識別的工作原理,以及其所使用的技術。一、離線語音識別的
    的頭像 發表于 11-07 18:04 ?353次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>和控制的<b class='flag-5'>工作原理</b>及應用

    情感語音識別的前世今生

    的支持。本文將探討情感語音識別的前世今生,包括其發展歷程、應用場景、面臨的挑戰以及未來發展趨勢。 二、情感語音識別的發展
    的頭像 發表于 11-12 17:33 ?361次閱讀

    情感語音識別的應用與挑戰

    一、引言 情感語音識別是一種通過分析人類語音中的情感信息實現智能化和個性化人機交互的技術。本文將探討情感語音
    的頭像 發表于 11-30 10:40 ?318次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>