<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

云知聲AGI技術實力在2023年再次獲得國際頂會認可

云知聲 ? 來源:云知聲 ? 2023-09-07 10:27 ? 次閱讀

近日,國際性語音及語言科學技術領域盛會INTERSPEECH 2023在愛爾蘭都柏林舉行。云知聲聯合上海師范大學發表的4篇論文被大會成功收錄,成果覆蓋語言增強、語音識別、防攻擊聲紋等研究方向。這是繼ACM MM 2023后,云知聲AGI技術實力在2023年再次獲得國際頂會認可。

INTERSPEECH在國際上享有極高盛譽并具有廣泛的學術影響力,是由國際語音通訊協會(ISCA)創辦的旗艦級國際會議,是國際性語音及語言科學技術領域的頂級會議之一,對參會企業和單位有著嚴苛的準入門檻,歷屆INTERSPEECH會議都倍受全球各地語音研究領域人士的廣泛關注。

此次獲得國際頂會認可,既是云知聲與上海師范大學通力合作、持續探索智能語音技術的結果,也離不開云知聲AGI技術架構的有力支撐。

云知聲:通過通用人工智能(AGI)創建互聯直覺的世界

云知聲AI技術體系及U+X戰略

作為中國AGI技術產業化的先驅之一,云知聲于2016年打造Atlas人工智能基礎設施,并構建公司云知大腦(UniBrain)技術中臺,以山海(UniGPT)通用認知大模型為核心,包括多模態感知與生成、知識圖譜、物聯平臺等智能組件,并通過領域增強能力,為云知聲智慧物聯、智慧醫療等業務提供高效的產品化支撐,推動“U(云知大腦)+X(應用場景)”戰略落實,踐行公司“通過通用人工智能(AGI)創建互聯直覺的世界”的使命。

作為云知大腦(UniBrain)的重要組件,智能語音技術包含語音識別、聲紋識別、語音合成等,目前已廣泛應用于家居、車載、客服等領域。以車載場景為例,在云知聲智能語音技術的加持下,可實現多音區識別、連續語音交互、個性化語音播報、所見即可說、模糊指令匹配等強大語音能力,為用戶帶來更智能更自然的交互體驗。隨著云知聲智能語音技術的不斷發展,其在各個場景的落地應用也將進一步提速。此次論文收錄,充分印證了云知聲在智能語音領域的技術創新實力,同時,也將進一步夯實其AGI技術底座,加速千行百業的智慧化升級。

接下來,云知聲將繼續踐行“U+X”戰略,攜手上海師范大學等高校機構,共同加強AI基礎理論和關鍵技術的研發,不斷拓展AGI應用場景,為智慧物聯與智慧醫療兩大領域提供更廣泛、更深入的人工智能解決方案,致力實現以人工智能賦能千行百業的美好愿景。

以下為入選論文概覽:

研究方向:語音增強

目前主流時頻語音增強系統以復頻譜作為輸入,存在著訓練工具不支持復數,復數建模方式不易訓練,以及基于掩蔽的方法理論上無法完全恢復出干凈語音的問題。為解決以上問題,本文提出了一種無需掩蔽的語音增強系統。該系統利用短時離散余弦變換(STDCT)作為特征,不僅與STFT同樣具備信息完備性,而且是一種實數特征。我們在MetaFomer基礎上,結合MobileNet block的輕量架構以及NAFNet的設計理念構建了全局局部模塊,整個網絡由此模塊堆疊而成。結果表明,相比其他網絡,MFNet的性能達到了SOTA水平,且計算量具有優勢。

1b353b40-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:語音識別

Multi-pass Training and Cross-information Fusion for Low-resource End-to-end Accented Speech Recognition

低資源重口音語音識別是當前ASR技術在實際應用中面臨的重要挑戰之一。在這項研究中,我們提出了一個基于Conformer的架構,稱為Aformer,以利用大量非口音和有限口音訓練數據的聲學信息。在Aformer中設計了一個普通編碼器和一個口音編碼器來提取互補的聲學信息。此外,我們使用多通道的方式訓練Aformer,并研究了三種交叉信息融合方法,以有效地結合來自一般編碼器和口音編碼器的信息。結果表明,在六個域內和域外口音測試集上,我們提出的方法優于Conformer基線,詞/字錯誤率相對減少了10.2%到24.5%。

1b7e7af8-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:語音識別

Phonetic-assisted Multi-Target Units Modeling for Improving Conformer-Transducer ASR system

在端到端的自動語音識別(ASR)中,開發有效的目標建模單元是非常重要的,也是大家一直關注的問題。我們提出一種語音輔助的多目標單元(PMU)建模方法,以漸進式表征學習的方式增強Conformer-TransducerASR系統。具體來說,PMU首先使用語音輔助子詞建模(PASM)和字節對編碼(BPE)分別產生語音誘導和文本誘導的目標單元;在此基礎上,我們提出了三種增強聲學編碼器的框架,包括基本PMU、paraCTC和paCTC,它們集成了不同層次的PASM和BPE單元,用于CTC和transducer多任務訓練。在LibriSpeech和口音ASR測試集上的實驗結果表明,與傳統的BPE相比,提出的PMU方法顯著降低了LibriSpeech clean、other和6個重音ASR測試集的WER,分別降低了12.7%、6.0%和7.7%。

1bb882ac-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:防攻擊聲紋

Advanced RawNet2 with Attention-based Channel Masking for Synthetic Speech Detection

自動揚聲器驗證系統通常很容易受到欺騙攻擊,特別是不可見的攻擊。由于語音合成和語音轉換算法的多樣性,如何提高合成語音檢測系統的泛化能力是一個具有挑戰性的問題。為了解決這個問題,我們提出了一種改進的RawNet2,通過引入一個基于注意力的通道掩蔽模塊來改進RawNet2,其中包括三個主要組成部分:SE、通道掩蔽和全局-局部特征聚合。在ASVspoof2019和ASVspoof 2021數據集上評估了該系統的有效性。其中,ARawNet2在ASVspoof 2019 LA任務上達到了4.61%,在ASVspoof 2021 LA和DF任務上的EER分別達到了8.36%和19.03%,比RawNet2基線分別降低了12.00%和14.97%。

1beb130c-4c9d-11ee-a25d-92fbcf53809c.png

1c1799ea-4c9d-11ee-a25d-92fbcf53809c.png

審核編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    37

    文章

    1635

    瀏覽量

    111856
  • 人工智能
    +關注

    關注

    1777

    文章

    43920

    瀏覽量

    230846
  • Agi
    Agi
    +關注

    關注

    0

    文章

    58

    瀏覽量

    10132
  • 云知聲
    +關注

    關注

    0

    文章

    114

    瀏覽量

    8276

原文標題:云知聲4篇論文入選國際頂會INTERSPEECH 2023

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    語云全景監測技術:現代安全防護的全面解決方案

    防護的全面解決方案,憑借其強大的實時監測、智能分析、主動防御等功能,以及易于部署、易于管理的優勢,正在為越來越多的用戶所認可和應用。未來,隨著技術的不斷進步和應用場景的不斷拓展,
    發表于 02-23 16:40

    OpenHarmony社區運營報告(202312月)

    ,2.4 萬多個 Star,6.7 萬多個 Fork,59 個 SIG。 ? 2023 12 月 16 日,以“技術創新,照見未來”為主題的首屆開放原子開發者大會 OpenHarmony 分論壇
    發表于 01-10 15:44

    華秋2023度大事記~~

    2023復雜多變的外部環境下,華秋緊隨時代步伐,以為企業減負、高質量發展為核心目標,助力企業“增效降本”。這一,華秋投入大量研發資源,聚焦產品質量提升、提升數字化能力,賦能硬件創
    發表于 01-05 10:59

    華秋2023度總結 | 聚焦發展,勇往直前

    2023復雜多變的外部環境下,華秋緊隨時代步伐,以為企業減負、高質量發展為核心目標,助力企業“增效降本”。這一,華秋投入大量研發資源,聚焦產品質量提升、提升數字化能力,賦能硬件創
    發表于 01-05 10:57

    新年驚喜!蓋樓有獎~一起來見證華秋2023度高光時刻吧

    ,2023,華秋舉辦了多場線下會議。如:2023電子工程師大會、2023電子設計與制造技術研討
    發表于 01-04 16:33

    精彩預告 | OpenHarmony即將亮相MTSC 2023

    MTSC 2023 第 12 屆中國互聯網測試開發大會(深圳站)即將于 2023 11 月 25 日,深圳登喜路國際大酒店舉辦,大會將
    發表于 11-22 10:28

    OpenHarmony社區運營報告(202310月)

    技術有限公司。 技術指導委員 202311月4日,第二屆開放原子開源基金OpenHarmo
    發表于 11-09 08:42

    閃耀“中國芯” 華大北斗榮獲2023“中國芯”優秀技術創新產品獎

    20239月20日,由工信部中國電子信息產業發展研究院、珠海市人民政府以及橫琴粵澳深度合作區執行委員共同主辦的2023琴珠澳集成電路產業促進峰會暨第十八屆“中國芯”頒獎儀式
    發表于 09-22 14:46

    音畫皆優,普奧視攜新品亮相荷蘭廣播電視展IBC2023

    全球50多個國家和地區客戶的信賴和認可。普奧視已獲得實用新型、外觀專利及軟件著作權證書等50余項發明,擁有圖像處理3A核心算法、自主的ISP圖像算法技術和高精度超靜音的臺結構應用設計
    發表于 09-20 17:03

    OpenHarmony社區運營報告(20238月)

    單位南京天奧智能醫療科技有限公司、廈門貝啟科技有限公司油氣專委會新增成員單位昆侖數智科技有限公司、深圳市證通電子股份有限公司。 技術指導委員治理 20238月26日OpenHarm
    發表于 09-12 18:35

    各品牌廠商齊聚2023深圳國際電子展

    核心板技術的應用與發展》主題演講,介紹飛凌嵌入式核心板各行業應用中的獨特優勢并對嵌入式SoM板卡行業的發展前景進行深入分析。 為期3天的Elexcon2023正在進行中,8月24日~25日將為大家
    發表于 08-24 15:37

    2023 RISC-V中國峰會:深圳技術分享(同期會議)

    ,把握全球新時機,呈現RISC-V全球新觀點、新趨勢。 2023 RISC-V中國峰會:深圳技術分享(同期會議) 由電子發燒友主辦的RISC-V技術分享
    發表于 08-16 11:08

    OpenHarmony社區運營報告(20237月)

    鴻智谷、潤開鴻、深開鴻共4家單位提報。2023太湖科學城論壇·數字經濟產業高峰論壇、2023高校開源教育OpenHarmony高校師資培訓、2023智慧高速建設與發展研討
    發表于 08-11 16:30

    OpenHarmony社區運營報告(20235月)

    OpenHarmony生態新路徑。 ● 5月11日至14日,由公安部主辦的第十一屆中國國際警用裝備博覽(簡稱“警博”)北京首鋼園舉辦,全球前沿警用裝備及尖端
    發表于 06-19 15:52

    OpenHarmony社區運營報告(20234月)

    1、本月,OpenHarmony平臺Gitee指數第一(Gitee指數的評估維度:綜合考慮代碼活躍度、社區活躍度、團隊健康、影響力、流行趨勢)。 20234月,OpenHar
    發表于 05-22 10:30
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>