<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

清華開發出超高性能計算芯片:速度比高端GPU提升3000倍,能效提升400萬倍!

旺材芯片 ? 來源:NATURE ? 2023-11-24 17:04 ? 次閱讀

隨著各類大模型和深度神經網絡涌現,如何制造出滿足人工智能發展、兼具大算力和高能效的下一代AI芯片,已成為國際前沿熱點。中國科協發布的2023重大科學問題中“如何實現低能耗人工智能”被排在首位。

2023年10月25日,清華大學團隊在超高性能計算芯片領域取得新突破。相關成果以“All-analog photo-electronic chip for high-speed vision tasks”為題發表在Nature上。這枚芯片基于純模擬光電融合計算架構,在包括ImageNet等智能視覺任務實測中,相同準確率下,比現有高性能GPU算力提升3000倍,能效提升400萬倍。

f09e5e20-7898-11ee-939d-92fbcf53809c.png

圖1 相關論文(來源Nature)

未來已來?光為載體的計算芯片

實現算力飛躍并非易事,特別是當前傳統的芯片架構,受限于電子晶體管大小逼近物理極限。全新計算架構成為破局的關鍵。光計算以其超高的并行度和速度,被認為是未來顛覆性計算架構的最有力競爭方案之一。光計算,顧名思義是將計算載體從電變為光,利用光在芯片中的傳播進行計算。面對以光速計算的誘人前景,數年來海內外知名科研團隊相繼提出多種設計,但要替代現有電子器件實現系統級應用,仍面臨重大瓶頸:一是如何在一枚芯片上集成大規模的計算單元(可控神經元),且約束誤差累計程度;二是實現高速高效的片上非線性;三是為兼容目前以電子信號為主體的信息社會,如何提供光計算與電子信號計算的高效接口。當前常見的模數轉換功耗,較光計算每步乘加運算高出多個數量級,掩蓋了光計算本身的性能優勢,導致光芯片難以在實際應用中體現出優越性。

系統級算力和能效,超現有芯片萬倍

為解決這一國際難題,清華大學團隊創造性地提出了模擬電融合模擬光的計算框架,構建可見光下的大規模多層衍射神經網絡實現視覺特征提取,利用光電流直接進行基于基爾霍夫定律的純模擬電子計算,兩者集成在同一枚芯片框架內,完成了“傳感前 傳感中 近傳感”的新型計算系統。極大地降低了對于高精度ADC的需求,消除傳統計算機視覺處理范式在模數轉換過程中速度、精度與功耗相互制約的物理瓶頸,在一枚芯片上突破大規模集成、高效非線性、高速光電接口三個關鍵瓶頸。

f0a20246-7898-11ee-939d-92fbcf53809c.png

圖2. 光電計算芯片ACCEL的計算原理和芯片架構(來源Nature)

實測表現下,ACCEL芯片的系統級算力達到現有高性能芯片的數千倍。同時系統級能效達74.8 Peta-OPS/W,較現有的高性能GPU、TPU、光計算和模擬電計算架構,提升了兩千到數百萬倍。

在超低功耗下運行的ACCEL將有助于大幅度改善發熱問題,對于芯片的未來設計帶來全方位突破,并為超高速物理觀測提供算力基礎。同時對無人系統、自動駕駛等續航能力要求高的場景帶來重大利好。

f0c45e36-7898-11ee-939d-92fbcf53809c.png

表1. ACCEL和現有高性能芯片的系統級實測性能指標對比 (來源:Nature)非相干光直接計算

更進一步,ACCEL芯片還支持非相干光視覺場景的直接計算,如論文中演示的交通場景實驗。顯著拓展了ACCEL的應用領域,有望顛覆目前自動駕駛、機器人視覺、移動設備等領域先將圖片拍攝并保存在內存中后進行計算的思路,避免傳輸和ADC帶寬限制,在傳感過程中完成計算。

f0cdfc20-7898-11ee-939d-92fbcf53809c.gif

圖3. ACCEL可用于電子設備超低功耗人臉喚醒示意動圖(來源:清華大學)

開辟新路徑:顛覆性架構有望真正落地

清華攻關團隊提出的新型計算架構不僅對于光計算技術的應用部署意義重大,對未來其他高效能計算技術與當前電子信息系統的融合,亦深有啟發。

論文通訊作者之一,清華大學戴瓊海院士介紹道,“采用全新原理研發出計算系統是一座大山,而將新一代計算架構真正落地到現實生活,解決國計民生的重大需求,是攀過高峰后更重要的攻關?!盢ature雜志特邀在Research Briefing發表的該研究專題評述也指出,“或許這項工作的出現,會讓新一代計算架構,比預想中早得多地進入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)”。

清華大學戴瓊海院士、方璐副教授、喬飛副研究員、吳嘉敏助理教授為本文的共同通訊作者;博士生陳一彤、博士生麥麥提·那扎買提、許晗博士為共同一作;孟瑤博士、周天貺助理研究員、博士生李廣普、范靜濤研究員、魏琦副研究員共同參與了這項研究。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 晶體管
    +關注

    關注

    77

    文章

    9157

    瀏覽量

    135933
  • 人工智能
    +關注

    關注

    1781

    文章

    44776

    瀏覽量

    231931
  • 智能視覺
    +關注

    關注

    0

    文章

    94

    瀏覽量

    9101

原文標題:清華開發出超高性能計算芯片:速度比高端GPU提升3000倍,能效提升400萬倍!

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    Tensor Core GPU支持多達18個NVLink連接,每個連接速度可達100 GB/秒,總帶寬達到1.8 TB/秒,是上一代產品的兩,超過PCIe Gen5的14以上。N
    發表于 05-13 17:16

    Energy Micro將32位MCU提高4

    消費電子、汽車電子、醫療電子和工攪拌機業自動化應用正在推動32位微控制器的廣泛采用,32位MCU具有更高的性能,但高性能往往意味著 粉碎機需要消耗更多的功率,因此,低功耗設計和能耗
    發表于 03-16 16:00

    白熾燈光提升20 能否再現輝煌

      白熾燈,最早由托馬斯·愛迪生進行商業開發,曾是全世界產量最大、應用最廣泛的電光源。白熾燈用電流將鎢絲加熱到3000攝氏度左右,達到白熾狀態,利用熱輻射發出可見光。這些被加熱的鎢絲
    發表于 01-18 09:50

    福音來啦:省一萬倍電的被動Wi-Fi

    方式要省一萬倍,比藍牙傳輸要省一千。省一萬倍電的被動Wi-Fi,再也不用擔心手機電量了LoloStock/Shutterstock.com據華盛頓大學Shyam Gollakota等人的研究,他們將
    發表于 03-09 18:02

    FPGA是如何實現30倍速度的云加速的?都加速了哪些東西?

    提升至通用CPU服務器的30以上。同時,與已經深入人心的高性能計算的代表GPU相比,FPGA具有硬件可編程、低功耗、低延時的特性,代表了
    發表于 04-15 16:17

    請問這個放大一萬倍么,輸入正弦信號范圍多少???

    這個放大一萬倍么,輸入正弦信號范圍多少啊.
    發表于 06-06 09:05

    NVIDIA火熱招聘GPU高性能計算架構師

    這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU高性能計算架構師(功能驗證)的崗位,有意向的朋友歡迎發送簡歷到 allelin@nvidia.comWechat
    發表于 09-01 17:22

    [新品發布]全球首個百萬IOPS云盤來了 阿里云推出超高性能云盤ESSD

    提升500%。阿里云發布超高性能ESSD云盤 100IOPS隨機讀寫刷新紀錄1月9日,阿里云正式推出全球首個跨入IOPS百萬時代的云盤——ESSD,單盤IOPS高達100,這是阿里
    發表于 01-17 11:57

     華為云MongoDB彈性伸縮能力提升100

    高性能并非一蹴而就,這與華為云深厚的技術積累息息相關。   10數據重構性能提升,得益于將數據復制功能卸載到分布式共享存儲。分布式存儲采用基于分區的并行復制方式;任意盤或節點故障
    發表于 08-03 13:00

    鴻湖聯基于RK3399芯片的揚帆富設備開發板正式合入OpenHarmony主干

    、H265/H264視頻解碼。多路視頻輸出和輸入,性能更強,速度更快,接口更豐富,普遍適用于互動廣告機、互動數字標牌、智能自助終端、智能零售終端、工控主機、機器人設備等。而RK3399芯片
    發表于 07-21 10:52

    德州大學開發出半導體測量新技術 比以往提升10萬倍

    UT(德州大學,University of Texas)研究人員開發出一種半導體測量新技術,這項技術的靈敏度比以往測量技術提升了10萬倍。 UT電氣與計算機工程專業的研究生Sukrit
    的頭像 發表于 05-14 10:01 ?1351次閱讀

    清華大學團隊在超高性能計算芯片領域取得新突破

    清華大學團隊在超高性能計算芯片領域取得新突破,相關研究發表在Nature上。
    的頭像 發表于 10-29 09:20 ?701次閱讀
    <b class='flag-5'>清華</b>大學團隊在<b class='flag-5'>超高性能</b><b class='flag-5'>計算</b><b class='flag-5'>芯片</b>領域取得新突破

    清華大學開發出超高速光電計算芯片,性能是商用芯片3000倍!

    針對這一難題,清華大學自動化系戴瓊海院士、吳嘉敏助理教授與電子工程系方璐副教授、喬飛副研究員聯合攻關,提出了一種“掙脫”摩爾定律的全新計算架構:光電模擬芯片,算力達到目前高性能商用
    的頭像 發表于 10-31 18:00 ?1031次閱讀
    <b class='flag-5'>清華</b>大學<b class='flag-5'>開發出超高</b>速光電<b class='flag-5'>計算</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>是商用<b class='flag-5'>芯片</b>的<b class='flag-5'>3000</b>倍!

    中國開發芯片,算力提升3000倍!

    據了解ACCEL芯片的光學芯片部分只要采用百納米級別工藝,而電路部分更是可以采用180納米CMOS工藝就能生產這種芯片,用如此落后的工藝卻能將芯片
    的頭像 發表于 11-03 16:29 ?488次閱讀
    中國<b class='flag-5'>開發</b>新<b class='flag-5'>芯片</b>,算力<b class='flag-5'>提升</b><b class='flag-5'>3000</b>倍!

    國際首個全模擬光電智能計算芯片的算力可提升3000

    據團隊介紹,實測結果顯示,該芯片在智能視覺目標識別任務方面的算力可超過目前高性能商用芯片3000倍,為超高性能
    的頭像 發表于 11-08 18:23 ?1113次閱讀
    國際首個全模擬光電智能<b class='flag-5'>計算</b><b class='flag-5'>芯片</b>的算力可<b class='flag-5'>提升</b><b class='flag-5'>3000</b>倍
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>