<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

谷歌Gemini模型AI網絡及TPU拆解

Gemini 是一款新型的多模態大語言模型，此前多模態大模型在處理視頻、文字、圖像等多維度輸入信息時是采用分別訓練分別輸出再進行拼接的方式，這種方式的缺點在于面對復雜邏輯問題時，大模型的回復略顯遲鈍。

Gemini 采用了全新的訓練方式，直接在多模態數據上進行預訓練，并利用額外的多模態數據進行微調，因而可在處理復雜邏輯問題上更加智能。

下載鏈接：

Gemini 模型一共包括三個版本，可以在不同設備上進行使用。

1）Gemini Nano—端側設備上最高效的模型。這款模型專為智能手機設計，可以在沒有連接外部服務器的情況下完成 AI 處理任務。

2）Gemini Pro—運行在谷歌數據中心。Pro 版本將在最新版本的 AI 聊天機器人 Bard 提供支持，是 Bard推出以來的最大升級。目前為 170 多個國家和地區提供英語服務，計劃未來幾個月內支持新的語言和地區，并應用于搜索、廣告、Chrome 和 Duet AI 等更多谷歌產品。

3）Gemini Ultra —規模最大且功能最強大的模型，專用于高度復雜的任務，會在完成當前測試階段后的明年初向開發者和企業客戶提供。屆時還會推出基于 Gemini Ultra 的 Bard Advanced 更新版本。

Gemini 模型訓練基于谷歌自研 TPU 芯片，發布 TPU v5P，性能全部升級。谷歌較早就開始布局 AI 市場，2015 年便發布了專門用于 AI 領域的專用芯片 TPU v1,2015 年至今，谷歌已經完成了五個版本的迭代。目前現階段谷歌展示的 Gemini 1.0 模型就是基于 TPU v4 和 TPU v5e 兩類芯片來完成訓練過程。

在發布 Gemini 模型的同時，谷歌發布了最新的 TPU v5p 系列。v5p 進一步增強了方案可拓展性，并為了應對復雜模型的推理訓練與調整需求，設計了新的硬件架構。在 v5p 構建的集群，每個 Pod 計算單元由 8960顆芯片互聯，數量較之前的版本翻倍。計算性能上，新的 pod 浮點運算能力相比 v4 提升了兩倍，訓練速度相比 v4 提升 2.8 倍以上。

谷歌 TPU：創新網絡拓撲結構，采用光交換技術（OCS）。傳統數據中心網絡結構為 leaf-spine 葉脊架構，英偉達 AI 集群采用的是無收斂胖拓撲結構，谷歌的 AI 網絡集群在 spine 層進行創新，用 OCS 交換機（光路開關，optical circuit switch）代替傳統的電交換機（以太網交換機）。傳統數據中心在 spine 層需要進行大量的電光轉換，會產生較多的功耗，并且隨著數據量增加 spine 層每 2-3 年都需要進行更換。谷歌的 OCS 的目的是替代當下的電網絡交換機，從而實現近一步成本和功耗的降低。

谷歌的 OCS 稱為為 Palomar，內部結構為：輸入輸出為光纖準直器陣列，光纖準直器包括光纖陣列和微透鏡陣列，輸入和數據均為 136 個通道（128 個端口+8 個備用端口）。當光通過光纖進入 OCS 系統后，會通過兩個 2D 的 MEMS 陣列，每個 MEMS 陣列含有 136 個平面鏡，用于調整光的傳播方向。波長為 850nm。

谷歌 AI 網絡結構拆解：TPU v4 為例。在 TPU v4 網絡結構設計時候，每個基礎單元是 4*4*4=64 顆 TPU 組成，每個面有 16 個鏈路，因此每個單元一共有 16*6=96 個鏈路連接到 OCS 的光鏈路.此外因為提供 3D 環面的環繞鏈接，相對側的鏈接必須連接到同一個 OCS。因此，每個基礎單元需要 6×16/2=48 個 OCS。

谷歌 TPU v4 支持 4096 顆 TPU 互聯，具體方案為一共使用 64 個機柜，每個機柜內部構建 4*4*4=64 顆 TPU的 3D 網絡結構，其中 3D 結構的外表部分連接到 OCS，中間部分采用無源電纜互聯。在 4096 顆 TPU 互聯的系統中一共使用 48 了個 OCS，每個 OCS128 個端口。此外因為 OCS 本身直接進行光信號的傳輸，所以每個端口只需要 1 個光模塊。因為該集群需要 48*128=6144 個光模塊。TPU：光模塊用量=4096：6144=1：1.5

AMD MI300X 對標英偉達 H100。MI300X 由臺積電代工，基于自研的第三代 CDNA 架構，集成了 1530 億個晶體管。

對比英偉達 H100，集成了 800 億個晶體管。在性能指標上：1）AI 芯片算力：8 位精度浮點數（FP8）計算水平來看，MI300X 為 42petaFLOPs（每秒千萬億次浮點運算），H100 則為 32petaFLOPs；2）內存：MI300X為 192GB，英偉達 H109 為 120GB。目前，集合 8 張 MI300X 的 Instinct 工作臺已經可以支持運行 Llama2（700 億參數）、BLOOM（1760 億參數）大模型的訓練與推理。

MI300A：首款高性能 APU。具體參數上，MI300A 具有 228 個 CDNA3 架構的計算核心，24 個 Zen4 架構的 X86核心，4 個 I/O DIe，8 個 HBM3，128GB 顯存，5.3TB 峰值帶寬，256MB 的 Infinity 緩存，采用 3.5D 的封裝形式。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
5937

瀏覽量
103366
Gemini

Gemini

+關注

關注
0

文章
44

瀏覽量
7485
AI

AI

+關注

關注
87

文章
26683

瀏覽量
264339
語言模型

語言模型

+關注

關注
0

文章
445

瀏覽量
10069
TPU

TPU

+關注

關注
0

文章
133

瀏覽量
20574

原文標題：谷歌Gemini模型AI網絡及TPU拆解

文章出處：【微信號：AI_Architect，微信公眾號：智能計算芯世界】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

好奇~！谷歌的 Edge TPU 專用 ASIC 旨在將機器學習推理能力引入邊緣設備

單片的 MIPI-CSI 連接器中。攝像頭的焦距為 2.5 毫米，定焦范圍從 10 厘米到無限遠，視野為 84 度。相關軟件開發單片與 USB 加速棒皆以谷歌 TPU 軟件堆棧為基礎。各模型的開發環境為

發表于 03-05 21:20

谷歌Gemini被曝算力達GPT-4五倍，手握TPU王牌碾壓OpenAI

根據Patel和Nishball的說法，此前屢屢被爆料將成為GPT-4大殺器的谷歌Gemini，已經開始在新的TPUv5 Pod上進行訓練了，算力高達~1e26 FLOPS，比訓練GPT-4的算力還要大5倍。如今，憑借著TPUv5，谷歌

發表于 09-04 16:02 ?629次閱讀

谷歌揭秘Gemini，AMD對峙英偉達

今天，我們看到谷歌揭開了多模態AI模型Gemini的神秘面紗，AMD挑戰英偉達在AI芯片市場的霸主地位，微軟在英國

發表于 12-07 20:05 ?468次閱讀

成都匯陽投資關于谷歌攜 Gemini 王者歸來，AI 算力和應用值得期待

【Gemini 大模型主打多模態，性能對標GPT-4】當地時間12月6日，谷歌公司宣布推出其規模最大、功能最強的多模態大模型 Gemini

發表于 12-11 14:40 ?648次閱讀

谷歌發布多模態Gemini大模型及新一代TPU系統Cloud TPU v5p

谷歌亦發布新一代TPU 系統——Cloud TPU v5p，以幫助訓練尖端的 AI 模型。目

發表于 12-12 10:50 ?841次閱讀

谷歌推出Gemini 希望擊敗GPT-4

Gemini不僅僅是一個單一的人工智能模型。有一個簡單版本叫Gemini Nano，旨在在安卓設備上離線運行。有一個更強大的版本叫Gemini Pro，很快將為

發表于 12-14 17:30 ?505次閱讀

新火種AI | 谷歌Gemini“抄襲”百度文心一言？AI訓練數據陷難題

谷歌自己放出“實錘”，Gemini化身百度文心大模型？

發表于 12-20 09:09 ?250次閱讀

谷歌Gemini自曝用文心一言訓練，字節被OpenAI封號，大模型互薅羊毛是常態？

博主@闌夕爆料，對谷歌Gemini進行測試時，如果用中文詢問Gemini的身份，其回答竟然是百度文心一言。 ? 更讓人大跌眼鏡的是，測試人員可以使用“小愛同學”“小度”等提示詞喚醒Gemini

發表于 12-20 09:03 ?2243次閱讀

谷歌最新人工智能模型Gemini Pro已在歐洲上市

近日，谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市，向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(

發表于 02-04 15:10 ?758次閱讀

谷歌推出新一代大模型Gemini 1.5

近日，谷歌在無預警的情況下發布了其下一代大模型——Gemini 1.5，這款模型在性能上實現了顯著增強，并在長上下文理解方面取得了令人矚目的突破。更令人驚嘆的是，

發表于 02-20 13:55 ?375次閱讀

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轟動，超越了傳統GPU和谷歌TPU。

發表于 02-26 10:24 ?429次閱讀

谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

谷歌DeepMind的首席執行官德米斯·哈薩比斯在2月26日透露，公司計劃在接下來的幾周內重新發布其備受關注的Gemini AI模型人像生成功能。此前，由于在某些歷史圖像生成描述中出現

發表于 02-28 10:17 ?182次閱讀

谷歌計劃將先進大模型Gemini明年嵌入安卓手機

谷歌對其人工智能大模型在智能手機上的應用前景持樂觀態度，并預計其更先進的大模型Gemini將于明年嵌入安卓手機。這一消息由谷歌Pixel部門

發表于 03-06 11:37 ?360次閱讀

谷歌Pixel 8將采用Gemini Nano模型，新增兩項AI功能

經谷歌披露，Pixel 8 在配備 Gemini Nano 后，首先將增加兩大創新 AI 功能：其中之一是 Recorder 應用內新增 Summarize 功能，無網絡情況下可記錄并

發表于 03-29 15:46 ?165次閱讀

谷歌Google Calendar、Tasks與Keep應用中成功整合Gemini模型

谷歌于今日發布的I/O 2024開發者大會新聞中展現了其在Google Calendar， Tasks以及Keep應用中整合Gemini模型的最新進展，為用戶呈現出更為智能化的使用體驗。

發表于 05-15 11:10 ?45次閱讀

智能計算芯世界
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 2023年CPU&GPU天梯圖（最新版）
Hot 十大國產GPU產品及規格概述

New 英偉達Blackwell平臺網絡配置分析
New 一文詳解超算中的InfiniBand網絡、HDR與IB

精選推薦
更多

文章

資料

帖子

RRAM機制、材料及其在神經形態計算中的應用

存內計算開發者
16小時前

335 閱讀

e2studio開發磁力計LIS2MDL(1)----輪詢獲取磁力計數據

嵌入式單片機MCU開發
16小時前

350 閱讀

鴻蒙開發接口Ability框架：【AbilityDelegator】

jf_46214456
17小時前

353 閱讀

鴻蒙ArkUI-X跨平臺技術：【概述】

jf_46214456
17小時前

314 閱讀

探索存內計算—基于 SRAM 的存內計算與基于 MRAM 的存算一體的探究

存內計算開發者
17小時前

316 閱讀

波形的采樣、顯示方式都有哪些？

Hx
202KB

1積分

20下載

鴻蒙HarmonyOS燒錄方法總結

KK
1.08 MB

1積分

13下載

SmartColorPicker Sublime顏色選擇插件

李波
0.09 MB

免費

1下載

dlfblog基于Yii的博客

李華瑞
17.02 MB

免費

0下載

AppTemplate App快速構建模板

h1654155275.5748
6.57 MB

免費

1下載

芯海 32 位 MCU 開發調試，基于 VS Code 插件實現芯海 32 位 MCU 開發調試

jf_69343398
1天前

298 閱讀

DSP教學實驗箱_DSP算法實驗_嵌入式教程：4-3 有限沖激響應濾波器（FIR）算法（CCS顯示）

創龍教儀
1天前

354 閱讀

飛凌嵌入式-ElfBoard-項目分享|基于ELF 1S開發板完成的物聯網開源項目

jf_13411809
1天前

521 閱讀

【紫光同創盤古PGX-MINI-4K教程】——（盤古PGX-MINI-4K開發板/PGC4KD-6ILPG144第五章）序列檢測器實驗例程

yonglong11
2天前

440 閱讀

ICCVR建立工程運行有問題

chenbingjy
2天前

709 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看