<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Stability AI推出Stable audio的文本到音頻生成人工智能平臺

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師 ? 2023-09-20 10:20 ? 次閱讀

Stability AI是一家主要以人工智能生成的視覺效果而聞名的公司,它推出了一個名為Stable audio的文本到音頻生成人工智能平臺。

Stable Audio使用擴散模型,與該公司更受歡迎的圖像平臺Stable diffusion的AI模型相同,但使用音頻而非圖像進行訓練。用戶可以使用它為任何項目生成歌曲或背景音頻。

音頻擴散模型傾向于生成固定長度的音頻,這對音樂制作來說很糟糕,因為歌曲的長度可能不同。Stability AI的新平臺允許用戶發出不同長度的聲音,要求公司對音樂進行訓練,并在歌曲的開始和結束時間周圍添加文本元數據。

同時,它可以實現實時的音頻生成,無需等待長時間的渲染過程。Stability AI 宣稱,Stable Audio 模型可以在一秒內渲染出 95 秒的立體聲音頻,并且只需要一個 NVIDIA A100 GPU。

并且,Stable Audio是一個開源的項目,任何人都可以免費使用和修改。Stability AI 希望通過開源的方式促進 AI 領域的創新和發展,并讓更多人享受到 AI 技術帶來的便利和樂趣。

該公司在一份聲明中表示:“Stable Audio代表了Stability AI生成音頻研究實驗室Harmonai的尖端音頻生成研究。我們會繼續改進我們的模型架構、數據集和訓練程序,以提高輸出質量、可控性、推理速度和輸出長度?!?/p>

文本到音頻的生成并不是什么新鮮事,因為生成人工智能領域的其他大牌一直在玩弄這個概念。Meta于8月發布了AudioCraft,這是一套生成的人工智能模型,有助于根據提示創建聽起來自然的ERM、聲音和音樂。到目前為止,它只提供給研究人員和一些音頻專業人士。谷歌的MusicLM也可以讓人們產生聲音,但只對研究人員開放。

審核編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 音頻
    +關注

    關注

    28

    文章

    2654

    瀏覽量

    80285
  • AI
    AI
    +關注

    關注

    87

    文章

    27182

    瀏覽量

    264953
  • 人工智能
    +關注

    關注

    1781

    文章

    44775

    瀏覽量

    231926
  • 模型
    +關注

    關注

    1

    文章

    2797

    瀏覽量

    47972
  • 數據集
    +關注

    關注

    4

    文章

    1182

    瀏覽量

    24460

原文標題:Stability AI發布AI音頻平臺Stable Audio

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    阿里云視頻生成技術創新!視頻生成使用了哪些AI技術和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領域的創新 ? EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院開發的框架,一個音頻驅動的 AI
    的頭像 發表于 05-08 00:07 ?2885次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此模型具備從單張圖像中生成
    的頭像 發表于 03-22 10:30 ?370次閱讀

    OpenAI首席技術官穆拉蒂:Sora今年發布,音頻生成功能將提升場景呈現

    穆拉提還提到,Sora將覆蓋音頻生成領域,以增強應用效果;考慮到人工智能生成內容有時不夠精確,OpenAI擬允許用戶自主修改、創建視聽內容。
    的頭像 發表于 03-14 14:17 ?182次閱讀

    嵌入式人工智能的就業方向有哪些?

    。 國內外科技巨頭紛紛爭先入局,在微軟、谷歌、蘋果、臉書等積極布局人工智能的同時,國內的BAT、華為、小米等科技公司也相繼切入嵌入式人工智能的賽道。那么嵌入式AI可就業的方向有哪些呢
    發表于 02-26 10:17

    OpenAI 在 AI 生成視頻領域扔出一枚“王炸”,視頻生成模型“Sora”

    ABSTRACT摘要2月16日凌晨,也就是中國大年初七,OpenAI在AI生成視頻領域扔出一枚“王炸”,宣布推出全新的生成人工智能模型“S
    的頭像 發表于 02-22 08:25 ?180次閱讀
    OpenAI 在 <b class='flag-5'>AI</b> <b class='flag-5'>生成</b>視頻領域扔出一枚“王炸”,視<b class='flag-5'>頻生成</b>模型“Sora”

    OpenAI新年開出王炸,視頻生成模型Sora問世

    近日,OpenAI在AI生成視頻領域取得重大突破,發布了全新的生成人工智能模型“Sora”。該模型在視頻生成方面展現出了驚人的能力,通過
    的頭像 發表于 02-20 11:46 ?457次閱讀

    生成人工智能和感知式人工智能的區別

    生成新的內容和信息的人工智能系統。這些系統能夠利用已有的數據和知識來生成全新的內容,如圖片、音樂、文本等。生成
    的頭像 發表于 02-19 16:43 ?769次閱讀

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大,而
    的頭像 發表于 02-19 16:03 ?510次閱讀
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>試圖通過新的圖像<b class='flag-5'>生成人工智能</b>模型保持領先地位

    關于生成人工智能你應該知道的7件事

    ChatGPT和類似的人工智能工具可以生成包括文本、圖像和音頻在內的內容,讓高等教育領域領導者、教師、學生和其他人既興奮又擔憂。我們應將人工智能
    的頭像 發表于 02-19 13:27 ?515次閱讀
    關于<b class='flag-5'>生成</b>式<b class='flag-5'>人工智能</b>你應該知道的7件事

    OpenAI發布文生視頻模型Sora,引領AI頻生成新紀元

    人工智能(AI)領域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業界廣泛贊譽的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統視
    的頭像 發表于 02-19 11:03 ?532次閱讀

    Cognizant推出支持生成人工智能的新平臺

    Cognizant,全球領先的信息技術服務公司,近日宣布推出一個革命性的平臺——Cognizant Flowsource,旨在為企業提供下一代軟件工程解決方案。該平臺專注于生成
    的頭像 發表于 02-03 16:11 ?522次閱讀

    Stability AI推出迄今為止更小、更高效的1.6B語言模型

    Stability AI 宣布推出迄今為止最強大的小語言模型之一 Stable LM 2 1.6B。
    的頭像 發表于 01-23 10:11 ?403次閱讀
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b><b class='flag-5'>推出</b>迄今為止更小、更高效的1.6B語言模型

    ai人工智能機器人

    隨著時間的推移,人工智能的發展越來越成熟,智能時代也離人們越來越近,近幾年人工智能越來越火爆,人工智能的應用已經開始滲透各行各業,與生活交
    發表于 09-21 11:09

    AI 人工智能的未來在哪?

    人工智能、AI智能大模型已經孵化;繁衍過程將突飛猛進,ChatGPT已經上線。 世界首富馬斯克認為AI對人類是一種威脅;谷歌前CEO施密特認為AI
    發表于 06-27 10:48

    IGT Solutions推出企業級生成人工智能平臺TechBud.AI以實現卓越客戶體驗

    釋放快速創新以推動持續且盈利性的業務成果 西雅圖2023年6月23日 /美通社/ -- IGT Solutions 推出了創新、先進的企業級生成人工智能平臺TechBud.
    的頭像 發表于 06-24 21:20 ?392次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>