通義千問近日開源了其首個千億級參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B模型繼承了Qwen1.5系列的Transformer解碼器架構,并在技術上引入了分組查詢注意力方法(GQA),極大地提升了模型在推理時的效率。
這款擁有1100億參數的模型支持高達32K的上下文長度,同時展現出了卓越的多語言能力。無論是中文、英文、法語、德語、西班牙語、俄語,還是日語、韓語、越南語和阿拉伯語等,Qwen1.5-110B都能提供精準、流暢的語言處理體驗。這一里程碑式的開源模型,無疑將為AI領域的科研人員、開發者和愛好者提供更為強大、靈活的工具。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
開源
+關注
關注
3文章
3026瀏覽量
41779 -
通義千問
+關注
關注
1文章
20瀏覽量
163
發布評論請先 登錄
相關推薦
阿里通義千問Qwen2大模型發布
阿里巴巴最近發布了其通義千問系列的新成員——Qwen2大模型,并在Hugging Face和ModelScope兩大平臺上實現了同步開源。這一舉措無疑為人工智能領域的研究者和開發者們提供了更多選擇和可能。
昆侖萬維開源2千億稀疏大模型Skywork-MoE
近日,昆侖萬維公司宣布開源一款名為Skywork-MoE的稀疏大模型,該模型擁有高達2千億參數,不僅性能強勁,而且推理成本更低,為人工智能領
阿里云正式發布通義千問2.5,中文性能全面趕超GPT-4 Turbo
在通義大模型發布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文大模型之巔。
通義千問推出1100億參數開源模型
通義千問近日震撼發布1100億參數的開源模型Qwen1.5-110B,這一舉措標志著通義千問在AI領域邁出了重大步伐。該
阿里云通義千問發布320億參數模型,優化性能及效率
與之前的模型相比,新版320億參數模型在性能、效率以及內存占用方面取得了明顯改善。具體來說,32B在智能體場景下能力優于14B模型,并且推理成本較小。
聯發科天璣9300等旗艦芯片搭載通義千問大模型,成功實現
通義千問大模型可在離線環境下輕松應對多輪AI對話。此外,阿里云也承諾與聯發科進行深度合作,為全球手機制造商提供端側大模型解決方案。
聯發科天璣9300搭載通義千問大模型,阿里云提供解決方案
通義千問大模型已開源多項版本,包括18億、70億、140億及720億參數等版本伴隨視覺、音頻多模態能力提升。阿里云于去年10月發布的通義千問
阿里大模型“通義聽悟”升級
阿里旗下的強大模型產品“通義聽悟”近日迎來了一系列功能升級,其中包括備受矚目的音視頻問答助手“小悟”的正式上線。這一新功能憑借出色的多語言Query處理能力、長篇章文本理解能力以及指令演化框架優化
阿里云通義千問720億參數模型宣布開源
12月1日,阿里云通義千問720億參數模型Qwen-72B宣布開源。與此同時,他們還開源了18億參數模型Qwen-1.8B和音頻大
阿里云通義千問大模型已首批通過備案,正式向公眾開放
據悉,通義千問在技術創新和行業應用上均位居大型模型行業前列。在idc的最新ai大模型評估報告中,通義千問在11個測試中,在共同能力、服務能力、創新能力、服務能力、平臺能力、生態合作、電
阿里“通義千問”已完成備案 即將上線
阿里“通義千問”已完成備案 即將上線 就在文心一言開放之后,其他的大模型都在加速,阿里旗下的大模型“通義千問”也即將上線。 目前阿里旗下的大模型
發表于 09-02 15:56
?344次閱讀
云知聲千億參數山海大模型首次亮相
8月28日,山海大模型迎來又一次迭代升級,當前版本參數規模達到千億,實現了多學科能力、醫療能力雙提升,實測性能在C-Eval全球大模型綜合性評測中超越GPT-4,以平均分70分的成績進
評論