目前,數據中心在異構計算和算法標準上不斷變化,越來越多的應用領域需要專用的架構,使得硬件能夠和算法去進行匹配以達到最佳運行效果或者是提高它的運行速度。網絡上有很多不同的數據,這些數據在運行過程當中有不同的要求,而且網絡自身也在不斷迭代,計算、網絡和存儲對加速的要求都在水漲船高。對于硬件而言,理想的方式是能在不改變硬件的情況下,加速任何工作負載,并能降低總體擁有成本。
針對這一需求趨勢,去年10月份的時候,賽靈思推出了Alveo系列加速卡。賽靈思數據中心業務部產品規劃和市場營銷總監Jamon Bowen將這一系列產品的規劃目的總結為三個:快速、靈活應變和方便易用。即高吞吐量同時具有超低時延,能夠為多種工作負載進行加速,并且可以運用于云和本地各種場景。Alveo系列包括U200、U250和U280,區別主要是FPGA中的LUT規模和總線資源。今天,該公司宣布推出了Alveo系列最新的一款加速卡Alveo U50。
輕——輕量級加速
和該系列之前的產品不同,Alveo U50是業界首款輕量級PCIe Gen4自適應計算加速卡,并且面向所有服務器、各種云和邊緣的數據中心應用,包括網絡和存儲加速?!斑@是之前的產品做不到的?!盉owen說。
圖:從賽靈思提供的資料看,U50似乎是U280的迷你版。
Alveo U50支持PCIe Gen4這一最新的服務器總線和CCIX互聯標準,不同于GPU加速器的尺寸,U50要小的多,“GPU加速器的尺寸適合電腦,但不適用于網絡和存儲,”Bowen說,“采用賽靈思UltraScale+架構以及集成超高帶寬的HBM2存儲器技術大大減少了U50的尺寸?!?/div>
亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
采用HBM2這種片上存儲不僅僅是出于體積的考慮,還在于這能提升性能——HBM性能是DDR的10倍。U50內置8GB HBM2,可實現超過400Gbps的數據傳輸速度。PCIe Gen4也是目前最快的總線技術,這些都是存儲加速的要素。在網絡端口方面,U50的QSFP28端口可以實現100Gbps的網絡連接,并支持多種前沿應用,如VMe-oF(NVM Express over Fabrics)、解耦計算存儲和專業金融服務應用。滿足所有這些性能只需要不到75W的功耗,這可以讓很多應用不再為功耗預算而擔心。
在一組針對語音翻譯(深度學習推斷加速)、數據庫分析(數據分析加速)、數據壓縮(計算存儲加速)、電子交易(網絡加速)和金融建模(網格計算)的加速測試中,與GPU和CPU加速相比,U50的表現優異。其中,語音翻譯的時延降低25倍,吞吐量擴大10倍,在翻譯性能方面,和英偉達T4 相比,U50 性能提升高達10倍;在運行TPC-H Query基準測試(數據庫分析)時,相比CPU,U50每小時吞吐量提升4倍,運營成本降低3倍;在數據壓縮上,U50將壓縮/解壓縮吞吐量提高了20倍,實現了更快的Hadoop和大數據分析,同時相比僅CPU節點將每節點成本降低了40%;在電子交易中,U50相比僅CPU的10us延時,能將時延降低20%,交易時間不到500ns;在金融建模時,運行蒙特卡洛模擬,U50的功效相比GPU提升了7倍。
圖:U50在吞吐量,延遲和功效方面實現了10-20倍的改善
總的來說,U50在吞吐量,延遲和功效方面實現了10-20倍的改善?!拔覀兊膽鹇允侵铝τ谧屬愳`思靈活應變的加速技術應用于數據中心的所有領域,具體來說就是計算、網絡和存儲,”Bowen說,“所有的計算工作負載都是這三個領域的一部分,這也是我們看到Alveo可以大展宏圖的地方?!?/div>
重——兩個重要堆棧
計算、網絡和存儲為什么需要加速?因為諸如AlexNet、GoogleNet、DenseNet這些網絡結構都需要不同的硬件架構來實現高吞吐量、低時延和高效率。對于應用而言,加速可以靈活適應不同的需求。而數據中心要優化性能,需要定制數據路徑、定制精度和定制存儲器層級,沒有比可編程的硬件更適合來進行定制化的加速了。不過,對于數據中心開發者而言,FPGA編程是個令人頭痛的事情。
“我們從數據中心的客戶那里聽到的一個最大的抱怨就是FPGA的編程非常困難,”Bowen說,“Alveo提供開放的平臺和開發環境,讓開發者能夠更加便捷地使用,隨著越來越多的開發者到這個平臺上來開發,會有更多的云和相關產品加入,并且能夠實現原來只有在軟件部分才有可能實現的硬件IP的靈活應變能力?!?/div>
對于賽靈思而言,這個開放平臺正在形成一個解決方案的堆棧,好消息是,自去年10月份推出Alveo以來,目前已發布的應用已經是當初的2倍,而其培訓的開發者已經是當初的4倍。
圖:解決方案堆棧
“因為我們是一個非常標準化的產品,所以Kubernetes可以在系統內反映出Alveo插件,開發者也可以把它和docker配合起來,通過對Alveo進行編程而在系統中體現出加速應用?!盉owen解釋道,“所有編排、云管理和應用都和這些免費的生態系統結合,如果沒有這樣一個標準化的產品配置,客戶可能需要花費大量的投資才能夠實現這樣一個功能,這對于一些超大規模數據中心的應用來說是非常有必要的,既可以在云端,也可以用Alveo在本地進行加速,而且是一個非常開放式的框架,可以進行全面的加速?!?/strong>
這個生態就是一個大規模部署堆棧,賽靈思在其中開發了一個標準框架,然后提供Alveo產品,讓開發者像加速軟件那樣給服務器加速——重要的是,通過開發這個標準框架,賽靈思決定了應用場景的加速方式。
圖:大規模部署堆棧
據悉,賽靈思選擇在今天(8月7日)發布Alveo U50,是因為這兩天(8月6-8日),閃存峰會(Flash Memory Summit (FMS) 2019)正在美國加州圣克拉拉會議中心舉辦,賽靈思執行副總裁兼數據中心部總經理Salil Raje將發表有關高速存儲系統加速的的主題演講,該公司同時也會在現場演示這款最新的產品。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
賽靈思
+關注
關注
32文章
1794瀏覽量
130681 -
加速卡
+關注
關注
1文章
48瀏覽量
10892
發布評論請先 登錄
相關推薦
借助全新 AMD Alveo? V80 計算加速卡釋放計算能力
對于大規模數據處理,最佳性能不僅取決于原始計算能力,還取決于高存儲器帶寬。 因此,全新 AMD Alveo? V80 計算加速卡專為具有大型數據集的內存受限型應用而設計,這些應用需要 FPGA 硬件
發表于 05-16 14:09
?97次閱讀
AMD Alveo V80計算加速卡實現量產
AMD公司近日迎來了一個重要的里程碑,其專為大型數據集和內存受限型應用設計的Alveo V80計算加速卡,已正式進入量產出貨階段。這款創新產品針對高性能計算(HPC)、數據分析、金融、網絡安全以及計算存儲等關鍵領域,展現了強大的應用潛力。
英偉達發布最強AI加速卡Blackwell GB200
英偉達在最近的GTC開發者大會上發布了其最新、最強大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構Blackwell,標志著英偉達在AI圖形處理領域邁入了一個新的里程碑。
寧暢參與發布AI加速卡液冷設計白皮書
近日,由寧暢參與起草的《基于標準PCIe接口的人工智能加速卡液冷設計》白皮書正式發布。該技術白皮書由開放計算標準工作委員會(OCTC)歸口,旨在為冷板式人工智能加速卡的設計提供重要指導。
Alveo? MA35D 投入量產,AMD AMA SDK 1.0 發布
2023 年 4 月,我們隆重發布了 AMD Alveo MA35D 媒體加速卡。在美國廣播電視展( NAB )展上,我們展示了最新的加速卡,我們多年以來的潛心研究、精心規劃和勤思苦干
AMD 為超低時延電子交易推出 Alveo UL3524 加速卡
AMD Alveo UL3524 - 新款 AMD Alveo 金融科技加速卡能為交易公司和經紀商提供突破性的納秒級交易執行性能以及 AI 賦能的交易策略 - -?解決方案合作伙伴 Alpha
AMD 推出為超低時延電子交易專屬打造的基于FPGA的加速卡
新款 AMD Alveo 金融科技加速卡能為交易公司和經紀商提供突破性的納秒級交易執行性能以及 AI 賦能的交易策略— 解決方案合作伙伴 Alpha Data、Exegy 和 Hypertec
發表于 10-07 14:43
?151次閱讀
評論