小愛同學是小米公司于2017年7月26日發布的收款人工智能(AI)音箱的喚醒詞及二次元人物形象。小愛同學一經推入市場便受萬千寵愛,網絡上關于小愛同學的使用體驗各式各樣,無不是在稱贊,他們對小愛同學的功能、特點無不熟悉,但是你知道小愛同學是怎么工作的嗎?
智能語音交互是人工智能的分支,相當于語音助手,屬于一款智能型的手機應用,通過智能對話與即時問答的智能交互,實現幫助用戶解決問題的功能。
說起智能語音助手大家首先想起的是哪些呢?
1. Siri
蘋果iOS系統中的人工智能助手軟件
2. Cortana
微軟開發的全球第一款人工智能助手,中文名小娜,橫跨手機與PC兩大平臺。
3. Alexa
亞馬遜推出的語音助手,主要搭載在Amazon Fcho智能音箱上。
智能語音交互是怎么實現交互流程中的輸入輸出呢?
智能語音交互界面事實上包含了三個技術環節:
1. 語音識別(ASR)
將人類的語音中的詞匯轉換為計算機可讀的輸入,一般包括了信號處理,盡可能的降低環境噪聲、信道、說話人等因素對特征造成的影響。用戶根據系統設計的口令密碼與系統進行溝通。
比如:小愛同學的操作執行,每次發出指令的模式必須是“小愛同學+工作任務”,小愛同學接收后在把語音轉化成文字,再結合文字做出指令回復。
2. 語義處理(NLP)
自然語言的處理,就是把人的語言轉化成機器能夠理解的數字,分解開,并回復相應的語言。很多在購買智能音箱之后都會有覺得是“智障音箱”的主要原因就在這里,現在的技術條件下,只能做到固定的回答,無法像人類一樣思考,再加上人類語言有大量的表達方式和歧義語句,理解錯誤的地方也非常多。語義處理的主要目的就是把人類語言與機器語言盡可能的相互接近,實現真正的用戶正常對話。
3. 語音合成(TTS)
是通過機械的、電子的方法產生人造語音的技術,將計算機自己產生的、或外部輸入的文字信息轉變為樂意聽得懂的、流利的漢語口語輸出的技術,可以讓機器人像人一樣開口說話,小愛同學就是通過這項技術跟你交流的。
語音交互發展的優勢
1. 解放雙手、雙眼、雙腿,接觸空間限制,遠場可交互
2. 指向明確,語義直達目標,縮短使用路徑
3. 自然簡單人性化,學習門檻低
4. 可以一對一,也可以一對多
5. 對硬件的要求低
語音交互的劣勢
1. 不適合用戶選擇多、流程長,需要大量輔助信息決策的交互任務
2. 遠場語音交互對距離、噪音、混響、聲源數量等有一定的要求
3. 不適用于公共場合,需要安靜的嘗試
4. 依賴嘴巴和耳朵,對語種、口音和發音有一定要求
5. 輸出信息單一,表達能力有限
從技術和時間上來說,現在的智能語音交互系統還是存在一定缺陷和局限的,但是我們相信任何技術都是在實踐中成長的,你們的小愛同學也會越來越惹人愛的。
-
AI
+關注
關注
87文章
27061瀏覽量
264825 -
人工智能
+關注
關注
1780文章
44671瀏覽量
231501 -
智能語音
+關注
關注
10文章
761瀏覽量
48435
原文標題:智能語音交互:你知道小愛同學是怎么工作的嗎?
文章出處:【微信號:dkiot888,微信公眾號:鼎酷IOT部落】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論