<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

刷屏的Groq芯片，速度遠超英偉達GPU！成本卻遭質疑

電子發燒友網報道（文/李彎彎）英偉達遇到勁敵了？近日，Groq芯片計算速度超過英偉達GPU的消息刷屏。Groq是一家成立于2016年的AI創企，該公司近日開放了自家產品的免費試用，相比其他AI聊天機器人，Groq閃電般的響應速度迅速引爆朋友圈，經網友測試，Groq每秒生成速度接近500 tok/s，碾壓GPT-4的40 tok/s。

而這樣的速度背后，源于Groq自研了一種名為張量流處理器（TSP）的新型處理單元，Groq將其命名為語言處理單元，即LPU，它的工作原理與GPU截然不同。

Groq芯片跑大模型的速度有多快

Groq芯片跑大模型最突出的特點，便是快。有網友震驚地說：“它回復的速度比我眨眼還快?！痹趥鹘y生成AI中，等待是很平常的事，經常是字符一個個往外蹦，回答完需要挺長時間。而有網友稱，在Groq近日開放的云服務體驗平臺上，你可以看到，當模型收到提示后，幾乎能夠立即生成答案。

電子郵件初創企業OthersideAI的首席執行官兼聯合創始人馬特·舒默在演示中親自體驗了Groq的強大功能。他稱贊Groq快如閃電，能夠在不到一秒鐘的時間內生成數百個單詞的事實性、引用性答案。更令人驚訝的是，它超過3/4的時間用于搜索信息，而生成答案的時間卻短到只有幾分之一秒。

需要說明的是，Groq并沒有研發新模型，它只是一個模型啟動器，主頁上運行的是開源模型Mixtral 8x7B-32k和Llama 270B-4k。而驅動模型的硬件便是Groq自研的一種名為張量流處理器（TSP）的新型處理單元，Groq將其命名為語言處理單元，即LPU（Language Processing Units），它的工作原理與GPU截然不同。

各種測試結果和網友的體驗，都顯示Groq LPU的計算速度相當快。根據2024年一月的測試結果，由Groq LPU驅動Meta Llama 2模型，推理性能遙遙領先，是頂級云計算供應商的18倍。有報道稱，Groq LPU搭配Meta Llama 2 70B能在7分鐘內就能生成與莎士比亞《哈姆雷特》相同數量的單詞，比普通人的打字速度快75倍。

有網友測試同時用Gemini、GPT-4和Groq完成一個代碼調試問題，結果，Groq的輸出速度比Gemini快10倍，比GPT-4快18倍。

有從事人工智能開發的用戶稱贊，Groq是追求低延遲產品的“游戲規則改變者”。有用戶認為，Groq的LPU可能成為英偉達A100和H100芯片的“高性能硬件”的有力替代品。不過，也有AI行業的專家表示，Groq的LPU從成本上來看并不具優勢，目前并不能代替英偉達。

Groq 開發的LPU與GPU有何不同

Groq開發的LPU到底是個怎樣的產品？據其官網介紹，LPU是一種專為AI推理所設計的芯片。驅動包括GPT等主流大模型的GPU，是一種為圖形渲染而設計的并行處理器，有數百個內核。而LPU架構則與GPU使用的SIMD（單指令，多數據）不同，這種設計可以讓芯片更有效地利用每個時鐘周期，確保一致的延遲和吞吐量，也降低了復雜調度硬件的需求。

Groq的LPU推理引擎不是普通的處理單元；它是一個端到端系統，專為需要大量計算和連續處理的應用（如LLM）提供最快的推理而設計。通過消除外部內存瓶頸，LPU推理引擎的性能比傳統GPU高出幾個數量級。

根據與Groq關系密切的投資人k_zeroS分享，LPU的工作原理與GPU截然不同。它采用了時序指令集計算機（TemporalInstructionSetComputer）架構，這意味著它無需像使用高帶寬存儲器（HBM）的GPU那樣頻繁地從內存中加載數據。這一特點不僅有助于避免HBM短缺的問題，還能有效降低成本。

Groq創始人兼首席執行官Jonathan Ross此前在接受采訪的時候就談到，在大模型推理場景，Groq LPU芯片的速度比英偉達GPU快10倍，但價格和耗電量都僅為后者的十分之一。

Ross認為，對于在產品中使用人工智能的公司來說，推理成本正在成為一個問題，因為隨著使用這些產品的客戶數量增加，運行模型的成本也在迅速增加。與英偉達GPU相比，Groq LPU集群將為大模型推理提供更高的吞吐量、更低的延遲和更低的成本。

他強調，由于技術路徑不同，Groq的LPU芯片不依賴于三星或SK海力士的HBM，也不依賴于臺積電將外部HBM焊接到芯片上的CoWoS封裝技術。它在供應方面比英偉達更充足，不會被臺積電或者SK海力士等供應商卡脖子。

可以看到，Groq LPU芯片相當于是去掉了HBM，而只是依靠SRAM來計算。雖然這樣計算速度確實相當驚艷，然而其更低成本的問題卻遭到質疑。

有AI專家表示，Groq芯片的實際成本并不低，如人工智能專家賈揚清分析稱，因為Groq小的可憐的內存容量（230MB），在運行Llama-270b模型時，需要305張Groq卡才足夠，而用H100則只需要8張卡。從目前的價格來看，這意味著在同等吞吐量下，Groq的硬件成本是H100的40倍，能耗成本是10倍。

當然也有SRAM行業的專家非?？春眠@種架構模式，他認為，賈揚清對Groq成本的估算不是很對，因為沒有考慮到Groq的per token cost明顯低于GPGPU。

可以看到，作為一種新的架構模式，Groq LPU當前必然還面臨一些潛在問題，然而它的出現，也讓人們看到GPU之外的可能路徑。

Groq LPU芯片未來能否肩負起運行大模型的重任，或許再等等，就能看到明確答案。事實上，在去年年底的采訪中，Ross就表示，考慮到GPU的短缺和高昂的成本，他相信Groq未來的發展潛力。他說到：“在未來12個月內，我們可以部署10萬個LPU，在24個月內，我們可以部署100萬個LPU?！?br />
寫在最后

過去一年多時間，全球眾多科技公司都在研發大模型，今年將會是大模型落地部署的重要一年，而如眾多大模型的訓練和推理卻依賴英偉達的GPU。業界亟需除英偉達GPU之外的芯片，能夠用于大模型的部署推理，Groq的LPU芯片可以說是帶來了新的探索方向。

雖然Groq公司對自己的LPU芯片在性能和成本上都自信滿滿，然而業界對于其成本問題還是有所質疑。如果今年LPU芯片能夠如規劃那樣進行較大規模的部署，或許就能一定程度證明LPU芯片在成本上也在眾多用戶所能接受的范圍之內。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
27

文章
4430

瀏覽量
126785
英偉達

英偉達

+關注

關注
22

文章
3344

瀏覽量
87876
Groq

Groq

+關注

關注
0

文章
7

瀏覽量
45

評論

相關推薦

Groq聲稱碾壓英偉達GPU 國產芯片如何借鑒?

洞見分析

電子發燒友網官方

發布于 :2024年03月15日 09:30:26

英偉達要小心了！爆火的Groq芯片能翻盤嗎？AI推理速度「吊打」英偉達？

隨著科技的飛速發展，人工智能公司Groq挑戰了英偉達的王者地位，其AI芯片不僅展現出卓越的實力，還擁有巨大的潛力。Groq設計了一種獨特的推理代幣經濟學模式，該模式背后牽動著眾多因素，

的頭像

發表于 03-08 09:44 ?329次閱讀

<b class='flag-5'>英偉</b>達要小心了！爆火的<b class='flag-5'>Groq</b><b class='flag-5'>芯片</b>能翻盤嗎？AI推理<b class='flag-5'>速度</b>「吊打」<b class='flag-5'>英偉</b>達？

Groq收購Definitive intelligence，提升云平臺能力

　Groq去年1月發布新型人工智能芯片LPU（語言處理單元），近來引發市場熱烈反響——眾多公開測試以及客戶實測顯示，其低延遲與高吞吐量優勢顯著，尤其是AI推理運算速度相較于英偉達

的頭像

發表于 03-04 09:49 ?164次閱讀

“網紅”芯片Groq讓英偉達蒸發5600億

鑒于ChatGPT的廣泛應用，引發了AI算力需求的迅猛增長，使得英偉達的AI芯片供不應求，出現大規模短缺。如今，英偉達似乎在面對更多挑戰。

的頭像

發表于 02-27 15:10 ?471次閱讀

“網紅”<b class='flag-5'>芯片</b><b class='flag-5'>Groq</b>讓<b class='flag-5'>英偉</b>達蒸發5600億

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轟動，超越了傳統GPU和谷歌TPU。

的頭像

發表于 02-26 10:24 ?405次閱讀

<b class='flag-5'>Groq</b>推出大模型推理<b class='flag-5'>芯片</b> 超越了傳統<b class='flag-5'>GPU</b>和谷歌TPU

Groq一夜爆紅自研LPU速度碾壓英偉達GPU

洞見分析

電子發燒友網官方

發布于 :2024年02月21日 13:53:42

盤點英偉達24年來最差的五款GPU

英偉達的GPU也可能失敗。

的頭像

發表于 01-04 17:06 ?785次閱讀

英偉達將在越南設法人實體

英偉達行業資訊

深圳市浮思特科技有限公司

發布于 :2023年12月12日 10:29:04

英偉達為何放不下中國？

英偉達行業資訊

深圳市浮思特科技有限公司

發布于 :2023年11月27日 15:11:09

#英偉達 #顯卡英偉達全新旗艦顯卡RTX 5090性能暴漲70%

顯卡英偉達

深圳市浮思特科技有限公司

發布于 :2023年11月20日 14:19:25

#消費級顯示被禁止出口英偉達RTX 4090顯卡遭遇下架風波

英偉達

深圳市浮思特科技有限公司

發布于 :2023年10月19日 15:58:35

00032 Jetson TX2 NX開發者套件！TX2的性能，NANO的尺寸！ #英偉達 #jetson

英偉達

學習電子知識

發布于 :2023年07月02日 13:21:19

英偉達與聯發科合作艙駕一體芯片

可以理解為，聯發科將在未來提供給汽車制造商和一級供應商的Dimensity Auto智艙芯片封裝中加入英偉達的GPU，該GPU使用一種稱為小芯片

發表于 06-01 15:17 ?935次閱讀

NVIDIA仍不死心，再次加入ARM站場

加強聯發科芯片在游戲和AI方面的功能與性能，計劃最早于2024年將含有英偉達圖形技術的GPU集成到聯發科的芯片上。目前聯發科已成為Chro

發表于 05-28 08:51

聯發科回應結盟英偉達合攻 Arm 架構芯片傳聞

外界推測英偉達將與聯發科共同宣布雙方在 Arm PC 相關芯片的合作，但聯發科發布公告表示，這個傳聞純屬外界猜測，聯發科不做任何評論。外界認為，根據聯發科的活動邀請函內容來看，將展示該公司產品在智能生活、移動通信、車用電子三領

發表于 05-28 08:47

Carol Li
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 國內最值得關注的10家人工智能語音識別公司
Hot 國內外 18 家藍牙芯片廠商及產品型號集合

New 阿里云視頻生成技術創新！視頻生成使用了哪些AI技術和算法
New 阿里云視頻生成技術創新！視頻生成使用了哪些AI技術和算法

精選推薦
更多

文章

資料

帖子

微軟將推5000億AI大模型！AI大航海時代開啟，微軟專家發聲

章鷹觀察
7小時前

428 閱讀

RZ/G2L Demo調試經驗分享（2）

瑞薩MCU小百科
8小時前

272 閱讀

芯品#MAX78002 新型AI MCU，能夠使神經網絡以超低功耗運行

eeDesign
8小時前

234 閱讀

鴻蒙OpenHarmony南向：【Hi3516標準系統入門（IDE方式）】

jf_46214456
8小時前

254 閱讀

SiMa.ai推出針對Edge AI調整的SoC

eeDesign
9小時前

269 閱讀

nokia(諾基亞)6020原廠完整原理圖

王蘭
444

免費

1705下載

ERP完整開發資料整理

林鴻斌
593 KB

免費

0下載

微電子與電路基礎教材

HSCJ2004
未知

免費

0下載

接地抗干擾技術分析探討

lanlanw
425 KB

免費

145下載

VMware-Dispatch開源Serverless框架

灑下墨色
14.09 MB

免費

0下載

FPGA設計中，對SPI進行參數化結構設計

FPGA技術江湖
1天前

161 閱讀

為什么單片機keil5debug結果與實際輸出結果不同

jf_96912008
1天前

269 閱讀

LabVIEW2021加載動態鏈接庫初始化例程失敗怎么解決

jf_05827310
2天前

211 閱讀

浪涌測試線對地4000V測試不通過求指點

aha_yu
1天前

297 閱讀

HarmonyOS實戰開發-如何通過Text實現部分文本高亮和超鏈接。

jf_71304091
1天前

152 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看