<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU是否有替代方案?

芯片半導體 ? 來源:半導體行業觀察 ? 2023-10-23 15:37 ? 次閱讀

最近在華爾街舉行的 HPC + AI展會上舉辦了一場小組討論,匯聚了主要供應商來討論當前的 GPU Squeeze(短缺)問題?!皵D壓”是由于生成型人工智能/ LLM的快速持續增長造成的,現在已將 GPU 的需求推向前所未有的水平,并對 GPU 的可用性造成了“擠壓”。

下面是主要討論內容。

GPU到底有多缺貨?

根據我們報道的消息,我認為 HPC 用戶訪問 GPU(購買的或在云中)會遇到一些挑戰。我想檢查我的假設,并從貴公司的角度詢問“GPU 擠壓”問題有多大。

Supermicro 的 Thomas Jorgensen 分享了一個有趣的數據點?!拔铱梢愿嬖V你,由于缺乏 H100 GPU,我們有數以萬計的系統缺貨。但是,我還要說,市場上有很多替代品,例如,我們有一組更新的 CPU,用于 HPC 工作負載,而傳統上這些工作負載是由 GPU 提供服務的?!?/p>

Thomas 提到了帶有 64 GB 嵌入式 HBM2 內存的新型 Intel Max Xeon CPU,極大地增強了一些 HPC 工作負載。他建議,如果無法獲得 Nvidia GPU,本地 HPC 是緩解這種情況的方法之一。作為硬件中立的供應商,他還提到英特爾AMD 的其他 GPU 都很容易獲得。

Thomas還提到了重要的一點,“很多人都說我們依賴CUDA,但如果你要等NVidia GPUS一年,那段時間你可以轉換很多代碼。因此,市場上其他一些 GPU 絕對有生命力,其中一些可以在很短的等待時間內被黑客攻擊?!?/p>

他最后還提到了 Nvidia L40 GPU,他認為這是一個很好的替代品,或者至少是你可以購買的東西。此外,Thomas還提到,“所以,我想說,對于我們的本地客戶來說,有很多替代方案,客戶現在正在探索這一點。我想補充一點,為了取得巨大成功?!?/p>

英特爾的 Kiran Agrahara 補充道:“這取決于用例。當您查看短缺時,這取決于您正在研究的用例?!?他繼續說道,“還有其他選擇,并且大多數學習和推理現在都可以使用 Xeon Gen 4 處理器來完成?!?他提到英特爾有針對不同用例的基準測試。他還指出,每個人都認為每個用例都需要 NVidia GPU。

Kiran 還指出,英特爾擁有 Gaudi 2,它更像是一個推理處理器,而不是學習處理器,并且可以在本地和云端使用。他繼續提到 Datacenter GPU Max 系列可以作為 A100 的替代品或替代品。最后,他呼吁大家關注英特爾的 OpenVINO(開放式視覺推理和神經網絡優化)——所有英特爾 HPC 和人工智能產品之上的軟件層。

Nvidia 全球合作伙伴成功經理Prabhu Ramamoorthy 指出,人們認為 GPU 短缺是最近才發生的,但我們已經看到這種情況好幾年了。例如,三年前,GPU 在云端運行進行 NLP(自然語言處理)。許多對沖基金都在運行所有這些工作負載。生成式人工智能就像 NLP 的新的、美麗的、更性感的術語,現在對這些 GPU 的需求要大得多。正如Thomas所指出的,我們希望客戶選擇正確的用例。他還提醒大家,NVidia 雇傭的軟件工程師比硬件工程師更多。作為這些努力的結果,他提到 TensorRT-LLM 等 Nvidia 軟件可以優化應用程序并確保更有效地利用 GPU。

Google Cloud HPC 和 AI 基礎設施解決方案經理Wyatt Gorman 總結道,他認為長期規劃 GPU 需求非常重要?,F在,看看替代方案,不要超出你的應用程序太多??紤]一下現在有哪些可能性,并且有一些方法可以優化 GPU 使用,這是很好的替代方案。是很好的選擇。

GPU 替代方案

有關短缺的報道可能還會持續 18 個月。是否有其他方法建議 HPC 用戶運行應用程序(云、替代硬件、軟件優化)?例如,NAMD(一種 HPC 分子動力學代碼)將使用 CPU 和 MPI 和/或 GPU 運行。用戶會恢復使用 MPI 嗎?

Kiran Agrahara 回憶起一個較舊的示例,其中用戶需要 20 個 GPU,而要完成相同的工作,他們需要大約 180 個 CPU。但他建議看看過去三年發生了什么變化。他繼續說道:“CPU 已經取得了長足的進步。那時我們還沒有硬件加速器。如果你看看下一代 Xeon 處理器,我們有一個稱為 RMX 的先進矩陣架構。所以今天,CPU 已經取得了長足的進步。你看到的是 128 個核心,然后你就有了 RMX 架構,我可以說它就像是增強版的 AVX512。所以答案是肯定的,你可以用 CPU 來實現這一點?!?/p>

Wyatt Gorman 補充說,讓人們意識到較小的 GPU 非常重要?,F在每個人都在考慮 A100 和 H100。速度較慢的 Nvidia T4、L4 和 L40 GPU 有足夠的容量,并且可以在 Google Cloud 上使用,因為目前對它們的需求并不高。如果您對這些 GPU 進行一些調整和優化,您可以看到代碼的加速。

HPC 和數據中心融合

通常,HPC 位于其自己的孤島中,然后您可以在另一個正在開發的孤島中使用快速增長的 GenAI 和類似的硬件。當人們開始認識到我們可以將這兩種資源整合在一起時,您是否認為這可能會使 HPC 受益?您如何看待在數據中心運行的 HPC 應用程序與在具有單獨硬件的研發實驗室中運行的 HPC 應用程序的融合?

Wyatt Gorman 表示,谷歌在 HPC RFP 中看到了更多人工智能功能。他認為,隨著這些問題類型的出現,隨著 HPC 和 AI 的融合,我們會看到 AI 技術被引入傳統的 HPC 問題解決應用程序中,并且我們將看到越來越多的此類技術以及越來越多的資源。正如我提到的,Slurm 現在支持 Google TPU,現在或將來您不一定需要 Kubernetes 來運行 HPC。你知道,即使它是一種選擇,也沒有必要。

Supermicro 的 Thomas Jorgensen 提到,英特爾第五代路線圖顯示,未來的某些 CPU 上將有多達 288 個核心。當然,CPU 平臺上也發生了一些事情,這些事情將帶來比傳統 CPU 平臺更高的性能。還有一點是Intel打造的Max GPU是HPC+AI GPU。我們在 Supermicro 所做的第一次測試展示了使用該 GPU 的 HPC 的真實性能。

從硬件的角度來看, Supermicro 試圖成為中立者,與 Nvidia、AMD 和 Intel 合作。

Thomas 繼續說道:“與英特爾 AMD 平臺一樣,我們擁有非常高的核心數量 Epyc 處理器,并與 Nvidia 進行了科學實驗。在此測試中,我們可以在單個系統中放置十個 GPU。HPC 基準測試以及我們從 HPC 上的一個系統中獲得的性能令人震驚。但這是一種前進的方式,至少,我的意思是,它對擠壓沒有幫助,對吧,因為使用 H100,但那里的一些性能顯示出 HPC 工作負載的真正前景。因此,我對硬件和我們看到的一些優化非常充滿希望,這些優化可以從現有硬件中發揮更多作用?!?/p>

此外,一些用戶可能會發現傳統 HPC 和 GenAI 之間的界限有點模糊。對快速 GPU 的需求表明這兩種類型的應用程序都在進行大量的數字運算,但傳統的 HPC 蒙特卡羅風險分析是否類似于經過訓練進行風險分析的 GenAI?換句話說,您如何看待GenAI和HPC?它們屬于同一大類還是代表兩個不同的市場?它們相輔相成嗎?

NVidia 的 Prabhu Ramamoorthy 立即提到,他看到這種融合現在正在發生,他們看到客戶在致力于最終用例時混合使用 HPC 和 AI 解決方案。

Google Cloud 的 Wyatt Gorman 回答說,他看到人們將機器學習技術引入不同級別的 HPC 流程中。因此,請將其視為 HPC 中的一個子集、一個域。他認為,它可能會分拆出來,變得更加孤立,就像大數據從 HPC 中分離出來一樣。但就目前而言,他認為情況正在趨同。

編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    18546

    瀏覽量

    223820
  • 嵌入式
    +關注

    關注

    5002

    文章

    18421

    瀏覽量

    291690
  • NVIDIA
    +關注

    關注

    14

    文章

    4667

    瀏覽量

    102048
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4481

    瀏覽量

    127235
  • HPC
    HPC
    +關注

    關注

    0

    文章

    289

    瀏覽量

    23450

原文標題:GPU到底有多缺貨?有替代者嗎?

文章出處:【微信號:TenOne_TSMC,微信公眾號:芯片半導體】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    使用SMPS穩壓器獲得1.3V核心電壓,是否可能從6.5V的外部電壓而不是VEXT=3.3V產生1.3V電壓?

    認為問題在于如何驅動 VGATE1P,但使用柵極驅動器或許可以解決這個問題。 什么缺點需要考慮嗎? 歡迎提出任何替代解決方案的建議。
    發表于 05-29 06:04

    FPGA在深度學習應用中或將取代GPU

    、運動和電力限制等環境因素。 Larzul 說:“在一些關鍵的應用場景中,比如智慧城市的視頻監控,要求硬件暴露在對 GPU 不利影響的環境因素 (比如太陽) 下?!?GPU 受晶體管技術的限制,導致
    發表于 03-21 15:19

    GPU供不應求,出貨是否需延后?

    目前,英偉達占據80%的AI服務器GPU芯片市場份額,AI系統和互聯網大廠都需要該公司的GPU,因此,英偉達在該市場擁有很大話語權。
    發表于 03-14 11:05 ?160次閱讀

    英偉達GTX 16系列GPU全面停產,無替代型號

    3 月 5 日消息,根據英偉達GPU產品路線圖,GTX 16系列已于2024年第一季度全面停產,正式成為歷史。這標志著GTX系列漫長而傳奇的時代結束,且該系列停產后暫時沒有其他替代的型號, GTX
    的頭像 發表于 03-06 18:32 ?262次閱讀

    PCM1750U-DUAL CMOS 18 BIT這款數模轉換芯片國產替代嗎?

    PCM1750U-DUAL CMOS 18 BIT這款數模轉換芯片國產替代嗎?國產替代是否會涉及專利權或者知識產權問題?
    發表于 03-05 18:46

    尋求溫濕度變送器可替代方案

    這是一個溫濕度變送器,對接電腦端相應軟件能讀取到溫濕度信息,壞了就不好維修,請問各位大能有沒有可替代的模塊,或者替代模塊的生產商可以私信聯系我。
    發表于 12-28 14:36

    OpenHarmony開源GPU庫Mesa3D適配說明

    、LCD驅動完整的基礎之上,否則Launcher沒有啟動,也不能確定適配是否完好。所以,在GPU適配之前,需要確保在CPU渲染的基礎上,Launcher是能正常啟動的。 CPU渲染修改方法: 設置
    發表于 12-25 11:38

    替代光耦合器的隔離解決方案應用筆記

    電子發燒友網站提供《替代光耦合器的隔離解決方案應用筆記.pdf》資料免費下載
    發表于 11-29 10:07 ?0次下載
    <b class='flag-5'>替代</b>光耦合器的隔離解決<b class='flag-5'>方案</b>應用筆記

    請問ADI是否寬帶雙極性運算跨導放大器(OTA),可以替代TI的OPA861?

    請問ADI是否寬帶雙極性運算跨導放大器(OTA),可以替代TI的OPA861.
    發表于 11-14 07:49

    什么是虛擬GPU?虛擬GPU的優勢有哪些?

    虛擬 GPU,也稱為 vGPU,是通過將數據中心 GPU 進行虛擬化,用戶可在多個虛擬機中共享該 GPU。
    的頭像 發表于 11-10 09:48 ?865次閱讀
    什么是虛擬<b class='flag-5'>GPU</b>?虛擬<b class='flag-5'>GPU</b>的優勢有哪些?

    jlink的主要使用場景有沒有可以替代的非硬件方案?

    jlink的主要使用場景,有沒有可以替代的非硬件方案?
    發表于 10-07 09:00

    GPU發起的Rowhammer攻擊常見問題

    以下信息提供了有關GPU發起的“Rowhammer”攻擊的一些常見問題的答案。 你能用外行的話解釋這個問題嗎? 安全研究人員已經證明了GPU通過WebGL程序發起的微體系結構攻擊,使他們能夠構建指向
    發表于 08-25 06:41

    Arm Mali? GPU OpenCL開發者指南

    多得多的處理單元。這使馬里? GPU可以在不使用更多功率的情況下以比應用程序處理器更高的速率進行計算。 馬里? GPU可以一個或多個著色器核心。 標量指令是并行執行的,因此GPU同時
    發表于 08-10 07:47

    基于磁貼的GPU架構優缺點

    本指南介紹了基于磁貼的GPU架構的優缺點。它還將ARM馬里基于瓷磚的GPU架構設計與臺式PC或控制臺中常見的更傳統的即時模式GPU進行了比較。 馬里GPU使用基于平鋪的渲染體系結構。
    發表于 08-02 12:54
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>