<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

全球AI音樂會,第一次聽見中國聲音

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-04-19 11:01 ? 次閱讀

盛夏將至,各條AI賽道也熱烈了起來。如果評選一下,近段時間哪個領域的AI應用最為火爆,那么AI音樂創作絕對名列前茅。

一個月之前,海外初創企業Suno發布新版AI音樂生成大模型Suno V3,它可以根據用戶自然語言快速生成相關風格音樂,在全球范圍內引發熱議。而就在不久前,來自前DeepMind團隊成員的Udio音樂大模型發布。這款模型可以帶來非常逼真的音樂制作效果,并且可以完成多段式、長音樂作品的生成。

AI音樂生成大模型賽道,競爭突然激烈了起來。加上OpenAI的MuseNet、谷歌的MusicLM、Meta的MusicGen等項目,我們似乎在今年迎來了一場全球AI音樂會。一時間異彩紛呈,好不熱鬧。

但在這場AI音樂會中,有一個現象非常值得重視:這一次,中國科技與全球前沿AI趨勢之間沒有時差,無縫銜接。我們不再是跟隨者與追趕者,而是第一時間加入了這場音樂與AI的盛宴,奏響了屬于自己的旋律。

4月2日,由昆侖萬維打造的AI音樂生成大模型“天工SkyMusic”開啟免費邀測,4月17日更是正式發布。

天工SkyMusic是國內唯一公開可用的AI音樂生成大模型,也是中國首個音樂SOTA模型。

它與震撼全球科技與音樂產業的Suno、Udio保持了時間線上的高度同步,同時多個領域的技術能力更加出色。在與Suno V3的橫向測評中,天工SkyMusic在人聲&BGM音質、人聲自然度、發音可懂度等領域顯著領先對手,并以6.65分的綜合得分超越Suno V3,成為全球AI音樂最新SOTA模型。

wKgaomYh3oqAOsQ-AAFs-iXnfDE192.jpg

“中國AI不缺席”,是一段我們期待了很久的旋律。究竟是什么讓昆侖萬維能夠完成這次演奏?天工SkyMusic,以及背后的天工3.0有著怎樣的產業與社會價值?

讓我們打開這場全球AI音樂會,聽懂一首關于“中國AI不缺席”的盛夏奏鳴曲。

天工SkyMusic:東方的AI音樂會

不缺席的中國AI音樂大模型,不僅需要第一時間躋身行業一線,更需要在能力上拿出足夠有說服力的答案。

天工SkyMusic在發布之后,獲得了各方非常積極的反饋。來自媒體、音樂人與行業專家以及廣大用戶的聲音,證明了其具備加入全球AI音樂大模型競逐的底氣。AI音樂會不僅發生在歐美,同時也奏響在東方。

首先,我們可以具體來看一下天工SkyMusic在技術能力上的特色。

通過采用音樂音頻領域類Sora的DiT模型架構,天工SkyMusic在AI音樂大模型的幾個核心能力指標上都有不俗的表現。

其中包括高質量的音樂生成能力、高逼真的人聲模擬能力、高豐富度的歌詞段落控制能力、高規模的音樂風格掌握,以及高靈活的音樂表達。

舉例而言,歐美AI音樂風格多以“器”見長,更偏重樂器豐富度參數,但在人聲擬合方面往往表現一般。

相較而言,昆侖萬維天工SkyMusic則專門在人聲自然度、發音可懂度上進行了模型專門訓練,使得AI發音清晰、無異響,讓大模型生成的音樂足以“以假亂真”。

此外,天工SkyMusic所能夠創作的音樂,展現出了對多種不同音樂風格,不同生成訴求的把握。比如神曲改造對流行音樂的把握,古詩詞改編對中國傳統文化與格律的把握等。

透過廣泛的生成案例,我們可以發現天工SkyMusic具有豐富的使用場景與廣泛的需求人群,例如:

1.音樂從業者可以借助天工SkyMusic尋找靈感,輔助音樂創作。比如說,創作者可以輸入一些“母題”,包括親情、愛情等。通過天工SkyMusic生成的歌詞與旋律來尋找靈感,探索創作邊界。

2.短視頻創作者和UP主可以通過音樂生成來拓展創作邊界,降低音樂方案的創作門檻。比如說,UP主可以用天工SkyMusic改編“網絡神曲”,獲得新的視頻BGM。下面這首神曲,天工SkyMusic就可以為你帶來完全不一樣的感受。


3.音樂愛好者與粉絲可以獲得更多樣的音樂樂趣,與自己喜歡的音樂類型、音樂風格進行更加多樣性、深層次的互動。比如我們可以換一個聲音,把我們喜歡的音樂進行重新演繹。

4.在教育教學場景中,天工SkyMusic可以用來輔助音樂教育,讓學習者感受到音樂創作的內在邏輯與豐富技巧。同時還能夠助力傳統文化、樂器演奏等方面的教育教學。比如說,天工SkyMusic可以基于古詩詞生成音樂,讓學生更生動準確掌握古典文化的精髓。

在這樣的應用價值基礎上,我們還必須看到天工SkyMusic作為國內最早,也是目前唯一的AI音樂大模型,在填補產業空白方面的價值是巨大的。它的出現,意味著中國用戶有了更加符合華語音樂創作習慣的AI模型,對中文有了更好的支持。同時它完全免費,不限使用次數,無需額外的使用門檻,這都是國外同類AI音樂模型所無法實現的。

而從技術角度上看,天工SkyMusic對比MuseNet、MusicLM、MusicGen等項目也具備獨特的技術優勢。

除了上文提到的人聲合成演唱能力外,在音樂風格上天工SkyMusic更加精巧且多元。它能夠通過歌詞控制情緒變化,實現如顫音、歌劇、吟唱等多種歌唱技巧,并且可以使生成的音樂作品情感更加豐富且貼合情境。在此基礎上,天工SkyMusic支持創作說唱、民謠、放克、古風、電子等多種音樂風格,用戶可以根據個人喜好定制音樂風格。

總體來看,天工SkyMusic開創了中國AI音樂大模型的先河,成為中國首個音樂AIGC SOTA,并且大幅提高了AI大模型音樂生成在人聲領域的技術表現。

天工 3.0:全球最大規模的開源MOE大模型

天工SkyMusic能夠與全球AI音樂會同頻奏響,背后必然離不開兩點:一是戰略方向的敏銳把握,二是技術底座的基石打造。

而天工SkyMusic背后的技術基石,則是剛剛發布的“天工3.0”

天工3.0采用了4000億級參數MoE混合專家模型,是目前全球模型參數最大、性能最強的MoE模型之一。相較于上一代天工2.0MoE大模型,其在模型語義理解、邏輯推理,以及通用性、泛化性、不確定性知識、學習能力等領域都有著大幅的性能提升,其模型技術知識能力提升超過20%,數學/推理/代碼/文創能力提升超過30%。

具體來看,天工3.0在四個方向帶來了全面升級:

首次是邏輯推理能力的增強。天工3.0強大的邏輯推理能力使其能夠在實際應用中更加準確和高效地處理信息。例如,在天工3.0AI搜索的研究模式中,能夠圍繞用戶的某個簡單指令進行相關問題的延伸,并實時判斷該段落信息是否需要聯網搜索。在分析某個具體行業的信息時,能夠實現總結相關事件、拆解產業鏈地圖等復雜功能,并以結構化或思維導圖的形式進行最終展示,讓AIGC能力與行業應用更緊密融合。

其次,是語義理解能力的增強。天工3.0能夠更好地理解和處理用戶自然語言Query中的復雜語義信息,包括隱喻、多義詞等。比如說,天工3.0可以對用戶Query進行拆解、細化,甚至對用戶進行追問,從而在面對不確定知識時表現更好,能夠滿足用戶多樣化的需求。

此外,天工3.0新增了專項Agent訓練能力。天工3.0可以針對模型獨立規劃、調用、組合外部工具及信息的能力進行了專項訓練,使其能夠獨立生成并調用代碼,完成包括產業研究、產品橫評、信息分析、圖片生成、圖表繪制等多種復雜用戶需求。

針對B端產業用戶的需求,天工3.0也在知識庫能力、任意工具調用能力、復雜角色指令追尋能力等領域進行了升級,企業用戶可以通過上傳知識文檔構建專屬知識庫及Agent,并實現自動調用制定工具、完成復雜指令遵循Agent構建等實用能力。

最后,天工3.0的內容生成能力也得到了全面升級。對比天工2.0,天工3.0群星了全面的內容創作能力增強,能夠完成AI音樂生成、AI語音、AI對話、AI二次元漫畫生成等內容創作。還可以通過專項Agent訓練實現在對話中結合文本需求實時生成圖片、結合文本需求實時內容分析及圖表構建等能力。

總結天工3.0的技術特點,最為關鍵的一點就是:獨立思考。

天工3.0可以將復雜任務進行拆解優化,并在每一步都獨立思考,判斷每一步是否需要調用不同的工具。也是基于獨立思考能力,天工3.0新增了聯網能力、文生圖、代碼能力等優勢應用能力,同時增強了AI搜索等能力的表現。

更為值得注意的是,性能強大,技術獨創性極強的天工3.0,選擇了開源開放的策略。在全球開源大模型極速發展,基于開源生態的AI應用百花齊放的大背景下,天工3.0的開源無疑是給中國AI開源事業注入了強心劑。全面提升了中國開源大模型的整體技術水平與產業底座厚度。

在選擇開源開放的同時,天工3.0還搭建了智能體廣場,幫助開發者定制化打造智能體。更好的中文適配度,也讓天工3.0與中文開發需求更加契合。

全面增強的能力,更加豐富的功能,以及與開發者更緊密地契合,讓天工3.0成為一塊基石——“中國AI不缺席”的基石。

這一次,中國AI不缺席

過去AI行業內部總是認為,我們與歐美頂級AI企業之間存在著時間差。在新模型、新技術火熱之后,中國AI行業才開始跟隨和學習。

但在AI音樂大模型的熱潮里,情況顯然并非如此。為什么我們這次可以不跟隨,不焦慮,而是第一時間抵達這個舞臺,開始自己的演奏?

事實上,在AI音樂生成這個方向上,昆侖萬維一直保持著高度關注。早在2022年12月昆侖萬維發布的“昆侖天工”AIGC全系列開源算法與模型中,就包括多模態音樂內容生成大模型。此后,昆侖萬維還打造了多個基于AI音樂大模型的合作項目,掌握了豐富的實踐經驗。昆侖萬維關注并且重視AI音樂生成,是天工SkyMusic的戰略牽引。

天工3.0與天工SkyMusic的發布展現出來了這樣一個價值邏輯:在AI大模型快速發展的產業紀元里,想要提升創新效率,把握戰略機遇,需要首先孕育一個底座。這個底座可以融合各種先進的AI技術能力。

wKgZomYh3oqAHuwZAABV3EHqUIw366.jpg

昆侖萬維集團董事長兼CEO方漢認為,SOTA指的是當前技術在本領域技術指標全球第一。OpenAI是文本大模型和視頻生成大模型的SOTA,而昆侖萬維目前實現了音樂AIGC的SOTA。

之所以能夠實現這一點,有賴于天工3.0提供了底座級別的AI能力,進而實現發展效率與發展質量的統一。

昆侖萬維創始人周亞輝認為:“未來三十年,人類社會很大的一個變化,是人類要從感知線,變成表達線,整個人類社會在自我表達側要翻1000倍;創作和自我表達是未來30年在整個社交和文化領域增長最快的曲線,會有越來越多人表達自我,表達對世界的理解、對社會事物的態度,表達越來越藝術化和趣味化;這種表達在過去很困難,因為工具門檻高,而未來30年是自我表達的30年,我們要用AI把人類創作的門檻降得足夠低,讓人們更充分地實現自我表達?!?/p>

基于昆侖萬維“All in AGI 和 AIGC”的戰略布局,天工3.0成為集自然語言處理、計算機視覺、多模態、AI搜索、AI智能體等多項前沿技術為一身的AI大模型?;谔旃?.0提供的底座能力,昆侖萬維可以敏銳步驟發展機會,抓住諸如AI音樂創作這樣的產業風口。而廣大開發者則可以獲得多元且豐富的AI能力,將AI帶到千行百業的每個角落。

以超級模型蘊育種種AI技術,包容千行百業,這才是全球AI音樂會中,那道獨特且悅耳的東方旋律。

在起步階段的天工SkyMusic,已經為用戶帶來了豐厚的音樂創作樂趣。隨著未來的持續優化升級,我們會得到一個專業且易用的音樂創作平臺。圍繞天工SkyMusic,將可能出現AI音樂創作者生態,新的音樂明星。進而影響音樂行業的發展。

在全球AI音樂的熱潮背后,我們可以看到從“中國AI不缺席”到“中國AI如何引領”的深刻變革。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    26450

    瀏覽量

    264064
  • OpenAI
    +關注

    關注

    8

    文章

    760

    瀏覽量

    5914
  • 大模型
    +關注

    關注

    2

    文章

    1525

    瀏覽量

    1116
收藏 人收藏

    評論

    相關推薦

    通過CAN控制電機啟動,第一次發送start motor后,電機沒有起來的原因?

    各位大神,我通過CAN控制電機啟動,第一次發送start motor后,電機沒有起來,然后返回狀態為ALIGN_CHARGE_BOOT_CAP;再發一次start motor才可以正常使能。不知道這是什么情況呢?求大神解答,謝謝。
    發表于 04-18 07:47

    stm32f767zg外擴sram第一次讀寫沒問題,再次直接死機的原因?

    代碼是用cubemx生成的,自己加了個讀寫測試,第一次可以連續的讀寫外擴的整片內存,也可以只讀寫個地址,都可以成功,之后再次讀寫程序就死機了,直接讀取地址和調用庫里的讀寫函數結果也
    發表于 04-16 06:13

    stm32f767第一次讀取nandflash導致屏幕閃爍的原因?

    fmsc總線上同時掛在sdram做ltdc顯存,nandflash存儲文件圖片,比如我把張圖片存入nandflash,當我第一次從nandflash讀取這張圖片的時候導致屏幕閃爍花屏
    發表于 04-09 06:02

    第一次使用芯海CS32L010,請問硬件設計需要注意些什么,川渝代是否有技術支持?

    第一次使用芯海CS32L010,有幾個問題請教下: 1:請問硬件設計需要注意些什么? 2:內置振蕩器之類的資源是否可以可靠使用? 3:內置復位電路是否可靠? 4:川渝代是否有技術支持?
    發表于 03-30 07:49

    STM32L4 I2C主從通信,第一次通信成功,第二只檢測一次中斷就卡住了為什么?

    STM32L4 通過I2C方式組成主機——從機通信(主機從機都是stm32L431),主機給從機第一次發送消息能夠成功,但是從機返回信息就會失敗。 主機給從機第一次發送消息后,不讓從機響應。主機
    發表于 03-29 08:32

    用Aurix TC397x制作了定制主板,需要第一次對UCB存儲區進行編程嗎?

    我們用 Aurix TC397x 制作了定制主板。 我們需要第一次對 UCB 存儲區進行編程嗎? UCB 地區的默認數據是什么?
    發表于 01-25 06:00

    ad9824第一次讀取是對的,第二寫入后再讀取數據是錯誤的原因?

    這兩個配置互換下位置,發現VGA_Gain_Address配置后讀取正常,而Operatin_Address讀取異常,請問是怎么回事?是否這個AD本身就是這樣的。第一次遇到這樣的ad ,請問是怎么回事?
    發表于 12-13 07:41

    電機在停機段時間后,在第一次開車時有異響的原因?

    我們是部礦井提升機,提升機用的西瑪格的,電機是西門子變頻電機,采用SM150驅動,當電機在停機段時間后,在第一次開車時有異響,但當滾筒轉過周后就沒有
    發表于 12-13 07:38

    AD7656使用在串行模式輸出,復位后第一次轉換并讀取的數據只有真實值的半是為什么?

    AD7656使用在串行模式輸出,但每次復位后,第一次轉換并讀取的數據只有真實值的半,從第二開始,之后的每次轉換得到的數據都正常,請問有人遇到過嗎?為什么?
    發表于 12-11 08:24

    AT指令的模塊第一次通信是如何獲取波特率的?

    這個第一次通信的波特率是怎么確定的
    發表于 11-02 06:48

    串口收發,上電后第一次總是多個FF字節怎么解決?

    串口1 收發,上電后第一次收到的數據 總是多個FF,導致后面數據亂了,但是在仿真狀態是,收發是正常的,如下圖。望大家多多指點。謝謝! 調換過串口和GPIO配置的順序,還是沒有解決。
    發表于 10-20 08:27

    51單片機電路第一次上電無法下載程序

    使用stc15W204s單片機,第一次上電時復位鍵無法工作,不能下載程序,已下載過程序的單片機焊接在這個電路上可正常下載。
    發表于 10-08 14:12

    USB帶電狀態下枚舉后第一次數據上傳,PC收不到是為什么?

    各位大佬好,我在工作使用NUC123這款設備,發現芯片帶電情況下進行USB枚舉后的第一次的上傳數據, PC有幾率收不到,通過Debug發現設備發送了,但是PC就是沒收到。 于是在NUC123例程
    發表于 08-22 06:46

    NTPClient為什么只有第一次調用“timeClient.update”時日期部分是錯誤的嗎?

    秒讀取一次)。 要讀取日期和時間,我正在使用 NTPClient 庫,當“顯示單元”啟動時會出現問題。 在草圖中“循環”的“第一次”調用中,它讀取當前日期和時間并顯示它。 所以第一次只有“日期”部分
    發表于 05-12 07:35

    為什么ESP8266單元在第一次連接時向DHCP服務器宣布其主機名為ESP_XXXXXX?

    你知道為什么 ESP8266 單元在第一次連接時向 DHCP 服務器宣布其主機名為 ESP_XXXXXX,然后在所有后續連接中它宣布自己為 NODE-XXXXXX(XXXXXX 顯然是 MAC 地址
    發表于 05-09 10:00
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>