<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌Gemini模型AI網絡及TPU拆解

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-12-14 09:55 ? 次閱讀

Gemini 是一款新型的多模態大語言模型,此前多模態大模型在處理視頻、文字、圖像等多維度輸入信息時是采用分別訓練分別輸出再進行拼接的方式,這種方式的缺點在于面對復雜邏輯問題時,大模型的回復略顯遲鈍。

Gemini 采用了全新的訓練方式,直接在多模態數據上進行預訓練,并利用額外的多模態數據進行微調,因而可在處理復雜邏輯問題上更加智能。

下載鏈接:

Gemini 模型一共包括三個版本,可以在不同設備上進行使用。

8765a7fc-9a11-11ee-8b88-92fbcf53809c.png

1)Gemini Nano—端側設備上最高效的模型。這款模型專為智能手機設計,可以在沒有連接外部服務器的情況下完成 AI 處理任務。

2)Gemini Pro—運行在谷歌數據中心。Pro 版本將在最新版本的 AI 聊天機器人 Bard 提供支持,是 Bard推出以來的最大升級。目前為 170 多個國家和地區提供英語服務,計劃未來幾個月內支持新的語言和地區,并應用于搜索、廣告、Chrome 和 Duet AI 等更多谷歌產品。

3)Gemini Ultra —規模最大且功能最強大的模型,專用于高度復雜的任務,會在完成當前測試階段后的明年初向開發者和企業客戶提供。屆時還會推出基于 Gemini Ultra 的 Bard Advanced 更新版本。

Gemini 模型訓練基于谷歌自研 TPU 芯片,發布 TPU v5P,性能全部升級。谷歌較早就開始布局 AI 市場,2015 年便發布了專門用于 AI 領域的專用芯片 TPU v1,2015 年至今,谷歌已經完成了五個版本的迭代。目前現階段谷歌展示的 Gemini 1.0 模型就是基于 TPU v4 和 TPU v5e 兩類芯片來完成訓練過程。

在發布 Gemini 模型的同時,谷歌發布了最新的 TPU v5p 系列。v5p 進一步增強了方案可拓展性,并為了應對復雜模型的推理訓練與調整需求,設計了新的硬件架構。在 v5p 構建的集群,每個 Pod 計算單元由 8960顆芯片互聯,數量較之前的版本翻倍。計算性能上,新的 pod 浮點運算能力相比 v4 提升了兩倍,訓練速度相比 v4 提升 2.8 倍以上。

谷歌 TPU:創新網絡拓撲結構,采用光交換技術(OCS)。傳統數據中心網絡結構為 leaf-spine 葉脊架構,英偉達 AI 集群采用的是無收斂胖拓撲結構,谷歌的 AI 網絡集群在 spine 層進行創新,用 OCS 交換機(光路開關,optical circuit switch)代替傳統的電交換機(以太網交換機)。傳統數據中心在 spine 層需要進行大量的電光轉換,會產生較多的功耗,并且隨著數據量增加 spine 層每 2-3 年都需要進行更換。谷歌的 OCS 的目的是替代當下的電網絡交換機,從而實現近一步成本和功耗的降低。

8782ff00-9a11-11ee-8b88-92fbcf53809c.png

谷歌的 OCS 稱為為 Palomar,內部結構為:輸入輸出為光纖準直器陣列,光纖準直器包括光纖陣列和微透鏡陣列,輸入和數據均為 136 個通道(128 個端口+8 個備用端口)。當光通過光纖進入 OCS 系統后,會通過兩個 2D 的 MEMS 陣列,每個 MEMS 陣列含有 136 個平面鏡,用于調整光的傳播方向。波長為 850nm。

87a4a9fc-9a11-11ee-8b88-92fbcf53809c.png

谷歌 AI 網絡結構拆解:TPU v4 為例。在 TPU v4 網絡結構設計時候,每個基礎單元是 4*4*4=64 顆 TPU 組成,每個面有 16 個鏈路,因此每個單元一共有 16*6=96 個鏈路連接到 OCS 的光鏈路.此外因為提供 3D 環面的環繞鏈接,相對側的鏈接必須連接到同一個 OCS。因此,每個基礎單元需要 6×16/2=48 個 OCS。

87bcb236-9a11-11ee-8b88-92fbcf53809c.png

谷歌 TPU v4 支持 4096 顆 TPU 互聯,具體方案為一共使用 64 個機柜,每個機柜內部構建 4*4*4=64 顆 TPU的 3D 網絡結構,其中 3D 結構的外表部分連接到 OCS,中間部分采用無源電纜互聯。在 4096 顆 TPU 互聯的系統中一共使用 48 了個 OCS,每個 OCS128 個端口。此外因為 OCS 本身直接進行光信號的傳輸,所以每個端口只需要 1 個光模塊。因為該集群需要 48*128=6144 個光模塊。TPU:光模塊用量=4096:6144=1:1.5

AMD MI300X 對標英偉達 H100。MI300X 由臺積電代工,基于自研的第三代 CDNA 架構,集成了 1530 億個晶體管。

對比英偉達 H100,集成了 800 億個晶體管。在性能指標上:1)AI 芯片算力:8 位精度浮點數(FP8)計算水平來看,MI300X 為 42petaFLOPs(每秒千萬億次浮點運算),H100 則為 32petaFLOPs;2)內存:MI300X為 192GB,英偉達 H109 為 120GB。目前,集合 8 張 MI300X 的 Instinct 工作臺已經可以支持運行 Llama2(700 億參數)、BLOOM(1760 億參數)大模型的訓練與推理。

MI300A:首款高性能 APU。具體參數上,MI300A 具有 228 個 CDNA3 架構的計算核心,24 個 Zen4 架構的 X86核心,4 個 I/O DIe,8 個 HBM3,128GB 顯存,5.3TB 峰值帶寬,256MB 的 Infinity 緩存,采用 3.5D 的封裝形式。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    5937

    瀏覽量

    103366
  • Gemini
    +關注

    關注

    0

    文章

    44

    瀏覽量

    7485
  • AI
    AI
    +關注

    關注

    87

    文章

    26683

    瀏覽量

    264339
  • 語言模型
    +關注

    關注

    0

    文章

    445

    瀏覽量

    10069
  • TPU
    TPU
    +關注

    關注

    0

    文章

    133

    瀏覽量

    20574

原文標題:谷歌Gemini模型AI網絡及TPU拆解

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    好奇~!谷歌的 Edge TPU 專用 ASIC 旨在將機器學習推理能力引入邊緣設備

    單片的 MIPI-CSI 連接器中。攝像頭的焦距為 2.5 毫米,定焦范圍從 10 厘米到無限遠,視野為 84 度。相關軟件開發單片與 USB 加速棒皆以谷歌 TPU 軟件堆棧為基礎。各模型的開發環境為
    發表于 03-05 21:20

    谷歌Gemini被曝算力達GPT-4五倍,手握TPU王牌碾壓OpenAI

    根據Patel和Nishball的說法,此前屢屢被爆料將成為GPT-4大殺器的谷歌Gemini,已經開始在新的TPUv5 Pod上進行訓練了,算力高達~1e26 FLOPS,比訓練GPT-4的算力還要大5倍。如今,憑借著TPUv5,谷歌
    的頭像 發表于 09-04 16:02 ?629次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>被曝算力達GPT-4五倍,手握<b class='flag-5'>TPU</b>王牌碾壓OpenAI

    谷歌揭秘Gemini,AMD對峙英偉達

    今天,我們看到谷歌揭開了多模態AI模型Gemini的神秘面紗,AMD挑戰英偉達在AI芯片市場的霸主地位,微軟在英國
    的頭像 發表于 12-07 20:05 ?468次閱讀

    成都匯陽投資關于谷歌Gemini 王者歸來,AI 算力和應用值得期待

    Gemini模型主打多模態,性能對標GPT-4】 當地時間12月6日, 谷歌公司宣布推出其規模最大、功能最強的多模態大模型 Gemini
    的頭像 發表于 12-11 14:40 ?648次閱讀
    成都匯陽投資關于<b class='flag-5'>谷歌</b>攜 <b class='flag-5'>Gemini</b> 王者歸來,<b class='flag-5'>AI</b> 算力和應用值得期待

    谷歌發布多模態Gemini模型及新一代TPU系統Cloud TPU v5p

    谷歌亦發布新一代TPU 系統——Cloud TPU v5p,以幫助訓練尖端的 AI 模型。目
    的頭像 發表于 12-12 10:50 ?841次閱讀
    <b class='flag-5'>谷歌</b>發布多模態<b class='flag-5'>Gemini</b>大<b class='flag-5'>模型</b>及新一代<b class='flag-5'>TPU</b>系統Cloud <b class='flag-5'>TPU</b> v5p

    谷歌推出Gemini 希望擊敗GPT-4

    Gemini不僅僅是一個單一的人工智能模型。有一個簡單版本叫Gemini Nano,旨在在安卓設備上離線運行。有一個更強大的版本叫Gemini Pro,很快將為
    的頭像 發表于 12-14 17:30 ?505次閱讀

    新火種AI | 谷歌Gemini“抄襲”百度文心一言?AI訓練數據陷難題

    谷歌自己放出“實錘”,Gemini化身百度文心大模型?
    的頭像 發表于 12-20 09:09 ?250次閱讀
    新火種<b class='flag-5'>AI</b> | <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>“抄襲”百度文心一言?<b class='flag-5'>AI</b>訓練數據陷難題

    谷歌Gemini自曝用文心一言訓練,字節被OpenAI封號,大模型互薅羊毛是常態?

    博主@闌夕爆料,對谷歌Gemini進行測試時,如果用中文詢問Gemini的身份,其回答竟然是百度文心一言。 ? 更讓人大跌眼鏡的是,測試人員可以使用“小愛同學”“小度”等提示詞喚醒Gemini
    的頭像 發表于 12-20 09:03 ?2243次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>自曝用文心一言訓練,字節被OpenAI封號,大<b class='flag-5'>模型</b>互薅羊毛是常態?

    谷歌最新人工智能模型Gemini Pro已在歐洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在歐洲市場上市,向歐洲用戶開放。Gemini Pro是谷歌最大的人工智能(
    的頭像 發表于 02-04 15:10 ?758次閱讀

    谷歌推出新一代大模型Gemini 1.5

    近日,谷歌在無預警的情況下發布了其下一代大模型——Gemini 1.5,這款模型在性能上實現了顯著增強,并在長上下文理解方面取得了令人矚目的突破。更令人驚嘆的是,
    的頭像 發表于 02-20 13:55 ?375次閱讀

    Groq推出大模型推理芯片 超越了傳統GPU和谷歌TPU

    Groq推出了大模型推理芯片,以每秒500tokens的速度引起轟動,超越了傳統GPU和谷歌TPU。
    的頭像 發表于 02-26 10:24 ?429次閱讀
    Groq推出大<b class='flag-5'>模型</b>推理芯片 超越了傳統GPU和<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>

    谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執行官德米斯·哈薩比斯在2月26日透露,公司計劃在接下來的幾周內重新發布其備受關注的Gemini AI模型人像生成功能。此前,由于在某些歷史圖像生成描述中出現
    的頭像 發表于 02-28 10:17 ?182次閱讀

    谷歌計劃將先進大模型Gemini明年嵌入安卓手機

    谷歌對其人工智能大模型在智能手機上的應用前景持樂觀態度,并預計其更先進的大模型Gemini將于明年嵌入安卓手機。這一消息由谷歌Pixel部門
    的頭像 發表于 03-06 11:37 ?360次閱讀

    谷歌Pixel 8將采用Gemini Nano模型,新增兩項AI功能

    谷歌披露,Pixel 8 在配備 Gemini Nano 后,首先將增加兩大創新 AI 功能:其中之一是 Recorder 應用內新增 Summarize 功能,無網絡情況下可記錄并
    的頭像 發表于 03-29 15:46 ?165次閱讀

    谷歌Google Calendar、Tasks與Keep應用中成功整合Gemini模型

    谷歌于今日發布的I/O 2024開發者大會新聞中展現了其在Google Calendar, Tasks以及Keep應用中整合Gemini模型的最新進展,為用戶呈現出更為智能化的使用體驗。
    的頭像 發表于 05-15 11:10 ?45次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>