0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區
會(huì )員中心
創(chuàng )作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內不再提示

AI芯片國內外的發(fā)展現狀

傳感器技術(shù) ? 來(lái)源:未知 ? 作者:李倩 ? 2018-04-11 16:25 ? 次閱讀

如果說(shuō)2016年3月份AlphaGo與李世石的那場(chǎng)人機大戰只在科技界和圍棋界產(chǎn)生較大影響的話(huà),那么2017年5月其與排名第一的世界圍棋冠軍柯潔的對戰則將人工智能技術(shù)推向了公眾視野。阿爾法狗(AlphaGo)是第一個(gè)擊敗人類(lèi)職業(yè)圍棋選手、第一個(gè)戰勝?lài)迨澜绻谲姷娜斯ぶ悄艹绦?,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領(lǐng)銜的團隊開(kāi)發(fā),其主要工作原理是“深度學(xué)習”。

其實(shí)早在2012年,深度學(xué)習技術(shù)就已經(jīng)在學(xué)術(shù)界引起了廣泛地討論。在這一年的ImageNet大規模視覺(jué)識別挑戰賽ILSVRC中,采用5個(gè)卷積層和3個(gè)全連接層的神經(jīng)網(wǎng)絡(luò )結構AlexNet,取得了top-5(15.3%)的歷史最佳錯誤率,而第二名的成績(jì)僅為26.2%。從此以后,就出現了層數更多、結構更為復雜的神經(jīng)網(wǎng)絡(luò )結構,如ResNet、GoogleNet、VGGNet和MaskRCNN等,還有去年比較火的生成式對抗網(wǎng)絡(luò )GAN。

不論是贏(yíng)得視覺(jué)識別挑戰賽的AlexNet,還是擊敗圍棋冠軍柯潔的AlphaGo,它們的實(shí)現都離不開(kāi)現代信息技術(shù)的核心——處理器,不論這個(gè)處理器是傳統的CPU,還是GPU,還是新興的專(zhuān)用加速部件NNPU(NNPU是Neural Network Processing Unit的簡(jiǎn)稱(chēng))。

在計算機體系結構國際頂級會(huì )議ISCA2016上有個(gè)關(guān)于體系結構2030的小型研討會(huì ),名人堂成員UCSB的謝源教授就對1991年以來(lái)在ISCA收錄的論文進(jìn)行了總結,專(zhuān)用加速部件相關(guān)的論文收錄是在2008年開(kāi)始,而在2016年達到了頂峰,超過(guò)了處理器、存儲器以及互聯(lián)結構等三大傳統領(lǐng)域。而在這一年,來(lái)自中國科學(xué)院計算技術(shù)研究所的陳云霽、陳天石研究員課題組提交的《一種神經(jīng)網(wǎng)絡(luò )指令集》論文,更是ISCA2016最高得分論文。

在具體介紹AI芯片國內外之前,看到這里有部分讀者或許會(huì )產(chǎn)生這樣的疑惑:這不都是在說(shuō)神經(jīng)網(wǎng)絡(luò )和深度學(xué)習嗎?那么我覺(jué)得有必要對人工智能和神經(jīng)網(wǎng)絡(luò )的概念進(jìn)行闡述,特別是2017年工信部發(fā)布的《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計劃(2018-2020年)》中,對發(fā)展目標的描述很容易讓人覺(jué)得人工智能就是神經(jīng)網(wǎng)絡(luò ),AI芯片就是神經(jīng)網(wǎng)絡(luò )芯片。

人工智能整體核心基礎能力顯著(zhù)增強,智能傳感器技術(shù)產(chǎn)品實(shí)現突破,設計、代工、封測技術(shù)達到國際水平,神經(jīng)網(wǎng)絡(luò )芯片實(shí)現量產(chǎn)并在重點(diǎn)領(lǐng)域實(shí)現規?;瘧?,開(kāi)源開(kāi)發(fā)平臺初步具備支撐產(chǎn)業(yè)快速發(fā)展的能力。

其實(shí)則不然。人工智能是一個(gè)很老很老的概念,而神經(jīng)網(wǎng)絡(luò )只不過(guò)是人工智能范疇的一個(gè)子集。早在1956年,被譽(yù)為“人工智能之父”的圖靈獎得主約翰·麥卡錫就這樣定義人工智能:創(chuàng )造智能機器的科學(xué)與工程。而在1959年,Arthur Samuel給出了人工智能的一個(gè)子領(lǐng)域機器學(xué)習的定義,即“計算機有能力去學(xué)習,而不是通過(guò)預先準確實(shí)現的代碼”,這也是目前公認的對機器學(xué)習最早最準確的定義。而我們日常所熟知的神經(jīng)網(wǎng)絡(luò )、深度學(xué)習等都屬于機器學(xué)習的范疇,都是受大腦機理啟發(fā)而發(fā)展得來(lái)的。另外一個(gè)比較重要的研究領(lǐng)域就是脈沖神經(jīng)網(wǎng)絡(luò ),國內具有代表的單位和企業(yè)是清華大學(xué)類(lèi)腦計算研究中心和上海西井科技等。

好了,現在終于可以介紹AI芯片國內外的發(fā)展現狀了,當然這些都是我個(gè)人的一點(diǎn)觀(guān)察和愚見(jiàn),管窺之見(jiàn)權當拋磚引玉。

國外技術(shù)寡頭,優(yōu)勢明顯

由于具有得天獨厚的技術(shù)和應用優(yōu)勢,英偉達和谷歌幾乎占據了人工智能處理領(lǐng)域80%的市場(chǎng)份額,而且在谷歌宣布其Cloud TPU開(kāi)放服務(wù)和英偉達推出自動(dòng)駕駛處理器Xavier之后,這一份額占比在2018年有望進(jìn)一步擴大。其他廠(chǎng)商,如英特爾、特斯拉、ARM、IBM以及Cadence等,也在人工智能處理器領(lǐng)域占有一席之地。

當然,上述這些公司的專(zhuān)注領(lǐng)域卻不盡相同。比如英偉達主要專(zhuān)注于GPU和無(wú)人駕駛領(lǐng)域,而谷歌則主要針對云端市場(chǎng),英特爾則主要面向計算機視覺(jué),Cadence則以提供加速神經(jīng)網(wǎng)絡(luò )計算相關(guān)IP為主。如果說(shuō)前述這些公司還主要偏向處理器設計等硬件領(lǐng)域,那么ARM公司則主要偏向軟件,致力于針對機器學(xué)習和人工智能提供高效算法庫。

注:上述表格中所給為截止到2017年各研制單位公開(kāi)可查的最新數據。

1、獨占鰲頭——英偉達

在人工智能領(lǐng)域,英偉達可以說(shuō)是目前涉及面最廣、市場(chǎng)份額最大的公司,旗下產(chǎn)品線(xiàn)遍布自動(dòng)駕駛汽車(chē)、高性能計算、機器人、醫療保健、云計算、游戲視頻等眾多領(lǐng)域。其針對自動(dòng)駕駛汽車(chē)領(lǐng)域的全新人工智能超級計算機Xavier,用NVIDIA首席執行官黃仁勛的話(huà)來(lái)說(shuō)就是“這是我所知道的 SoC 領(lǐng)域非常了不起的嘗試,我們長(cháng)期以來(lái)一直致力于開(kāi)發(fā)芯片?!?/p>

Xavier是一款完整的片上系統(SoC),集成了被稱(chēng)為 Volta 的全新 GPU 架構、定制 8 核 CPU 架構以及新的計算機視覺(jué)加速器。該處理器提供 20 TOPS(萬(wàn)億次運算/秒)的高性能,而功耗僅為 20 瓦。單個(gè) Xavier 人工智能處理器包含 70 億個(gè)晶體管,采用最前沿的 16nm FinFET 加工技術(shù)進(jìn)行制造,能夠取代目前配置了兩個(gè)移動(dòng) SoC 和兩個(gè)獨立 GPU 的 DRIVE PX 2,而功耗僅僅是它的一小部分。

而在2018年拉斯維加斯CES展會(huì )上,NVIDIA又推出了三款基于Xavier的人工智能處理器,包括一款專(zhuān)注于將增強現實(shí)(AR)技術(shù)應用于汽車(chē)的產(chǎn)品、一款進(jìn)一步簡(jiǎn)化車(chē)內人工智能助手構建和部署的DRIVE IX和一款對其現有自主出租車(chē)大腦——Pegasus的修改,進(jìn)一步擴大自己的優(yōu)勢。

2、產(chǎn)學(xué)研的集大成者——谷歌

如果你只是知道谷歌的AlphaGo、無(wú)人駕駛和TPU等這些人工智能相關(guān)的產(chǎn)品,那么你還應該知道這些產(chǎn)品背后的技術(shù)大牛們:谷歌傳奇芯片工程師Jeff Dean、谷歌云計算團隊首席科學(xué)家、斯坦福大學(xué)AI實(shí)驗室主管李飛飛、Alphabet董事長(cháng)John Hennessy和谷歌杰出工程師David Patterson。

時(shí)至今日,摩爾定律遇到了技術(shù)和經(jīng)濟上的雙重瓶頸,處理器性能的增長(cháng)速度越來(lái)越慢,然而社會(huì )對于計算能力的需求增速卻并未減緩,甚至在移動(dòng)應用、大數據、人工智能等新的應用興起后,對于計算能力、計算功耗和計算成本等提出了新的要求。與完全依賴(lài)于通用CPU及其編程模型的傳統軟件編寫(xiě)模式不同,異構計算的整個(gè)系統包含了多種基于特定領(lǐng)域架構(Domain-Specific Architecture, DSA)設計的處理單元,每一個(gè)DSA處理單元都有負責的獨特領(lǐng)域并針對該領(lǐng)域做優(yōu)化,當計算機系統遇到相關(guān)計算時(shí)便由相應的DSA處理器去負責。而谷歌就是異構計算的踐行者,TPU就是異構計算在人工智能應用的一個(gè)很好例子。

2017年發(fā)布的第二代TPU芯片,不僅加深了人工智能在學(xué)習和推理方面的能力,而且谷歌是認真地要將它推向市場(chǎng)。根據谷歌的內部測試,第二代芯片針對機器學(xué)習的訓練速度能比現在市場(chǎng)上的圖形芯片(GPU)節省一半時(shí)間;第二代TPU包括了四個(gè)芯片,每秒可處理180萬(wàn)億次浮點(diǎn)運算;如果將64個(gè)TPU組合到一起,升級為所謂的TPU Pods,則可提供大約11500萬(wàn)億次浮點(diǎn)運算能力。

3、計算機視覺(jué)領(lǐng)域的攪局者——英特爾

英特爾作為世界上最大的計算機芯片制造商,近年來(lái)一直在尋求計算機以外的市場(chǎng),其中人工智能芯片爭奪成為英特爾的核心戰略之一。為了加強在人工智能芯片領(lǐng)域的實(shí)力,不僅以167億美元收購FPGA生產(chǎn)商Altera公司,還以153億美元收購自動(dòng)駕駛技術(shù)公司Mobileye,以及機器視覺(jué)公司Movidius和為自動(dòng)駕駛汽車(chē)芯片提供安全工具的公司Yogitech,背后凸顯這家在PC時(shí)代處于核心位置的巨頭面向未來(lái)的積極轉型。

Myriad X就是英特爾子公司Movidius在2017年推出的視覺(jué)處理器(VPU,vision processing unit),這是一款低功耗的系統芯片(SoC),用于在基于視覺(jué)的設備上加速深度學(xué)習和人工智能——如無(wú)人機、智能相機和VR / AR頭盔。Myriad X是全球第一個(gè)配備專(zhuān)用神經(jīng)網(wǎng)絡(luò )計算引擎的片上系統芯片(SoC),用于加速設備端的深度學(xué)習推理計算。該神經(jīng)網(wǎng)絡(luò )計算引擎是芯片上集成的硬件模塊,專(zhuān)為高速、低功耗且不犧牲精確度地運行基于深度學(xué)習的神經(jīng)網(wǎng)絡(luò )而設計,讓設備能夠實(shí)時(shí)地看到、理解和響應周?chē)h(huán)境。引入該神經(jīng)計算引擎之后,Myriad X架構能夠為基于深度學(xué)習的神經(jīng)網(wǎng)絡(luò )推理提供1TOPS的計算性能。

4、執“能效比”之牛耳——學(xué)術(shù)界

除了工業(yè)界和廠(chǎng)商在人工智能領(lǐng)域不斷推出新產(chǎn)品之外,學(xué)術(shù)界也在持續推進(jìn)人工智能芯片新技術(shù)的發(fā)展。

比利時(shí)魯汶大學(xué)的Bert Moons等在2017年頂級會(huì )議IEEE ISSCC上面提出了能效比高達10.0TOPs/W的針對卷積神經(jīng)網(wǎng)絡(luò )加速的芯片ENVISION,該芯片采用28nm FD-SOI技術(shù)。該芯片包括一個(gè)16位的RISC處理器核,1D-SIMD處理單元進(jìn)行ReLU和Pooling操作,2D-SIMD MAC陣列處理卷積層和全連接層的操作,還有128KB的片上存儲器。

韓國科學(xué)技術(shù)院KAIST的Dongjoo Shin等人在ISSCC2017上提出了一個(gè)針對CNN和RNN結構可配置的加速器單元DNPU,除了包含一個(gè)RISC核之外,還包括了一個(gè)針對卷積層操作的計算陣列CP和一個(gè)針對全連接層RNN-LSTM操作的計算陣列FRP,相比于魯汶大學(xué)的Envision,DNPU支持CNN和RNN結構,能效比高達8.1TOPS/W。該芯片采用了65nm CMOS工藝。

相比較于魯汶大學(xué)和韓國科學(xué)技術(shù)院都針對神經(jīng)網(wǎng)絡(luò )推理部分的計算操作來(lái)說(shuō),普渡大學(xué)的Venkataramani S等人在計算機體系結構頂級會(huì )議ISCA2017上提出了針對大規模神經(jīng)網(wǎng)絡(luò )訓練的人工智能處理器SCALLDEEP。

該論文針對深度神經(jīng)網(wǎng)絡(luò )的訓練部分進(jìn)行針對性?xún)?yōu)化,提出了一個(gè)可擴展服務(wù)器架構,且深入分析了深度神經(jīng)網(wǎng)絡(luò )中卷積層,采樣層,全連接層等在計算密集度和訪(fǎng)存密集度方面的不同,設計了兩種處理器core架構,計算密集型的任務(wù)放在了comHeavy核中,包含大量的2D乘法器和累加器部件,而對于訪(fǎng)存密集型任務(wù)則放在了memHeavy核中,包含大量SPM存儲器和tracker同步單元,既可以作為存儲單元使用,又可以進(jìn)行計算操作,包括ReLU,tanh等。而一個(gè)SCALEDEEP Chip則可以有不同配置下的兩類(lèi)處理器核組成,然后再組成計算簇。

論文中所用的處理平臺包括7032個(gè)處理器tile。論文作者針對深度神經(jīng)網(wǎng)絡(luò )設計了編譯器,完成網(wǎng)絡(luò )映射和代碼生成,同時(shí)設計了設計空間探索的模擬器平臺,可以進(jìn)行性能和功耗的評估,性能則得益于時(shí)鐘精確級的模擬器,功耗評估則從DC中提取模塊的網(wǎng)表級的參數模型。該芯片僅采用了Intel 14nm工藝進(jìn)行了綜合和性能評估,峰值能效比高達485.7GOPS/W。

國內百家爭鳴,各自為政

可以說(shuō),國內各個(gè)單位在人工智能處理器領(lǐng)域的發(fā)展和應用與國外相比依然存在很大的差距。由于我國特殊的環(huán)境和市場(chǎng),國內人工智能處理器的發(fā)展呈現出百花齊放、百家爭鳴的態(tài)勢,這些單位的應用領(lǐng)域遍布股票交易、金融、商品推薦、安防、早教機器人以及無(wú)人駕駛等眾多領(lǐng)域,催生了大量的人工智能芯片創(chuàng )業(yè)公司,如地平線(xiàn)、深鑒科技、中科寒武紀等。盡管如此,國內起步較早的中科寒武紀卻并未如國外大廠(chǎng)一樣形成市場(chǎng)規模,與其他廠(chǎng)商一樣,存在著(zhù)各自為政的散裂發(fā)展現狀。

除了新興創(chuàng )業(yè)公司,國內研究機構如北京大學(xué)、清華大學(xué)、中國科學(xué)院等在人工智能處理器領(lǐng)域都有深入研究;而其他公司如百度和比特大陸等,2017年也有一些成果發(fā)布。

注:上述表格中所給為截止到2017年各研制單位公開(kāi)可查的最新數據。

1、全球AI芯片界首個(gè)獨角獸——寒武紀

2017年8月,國內AI芯片初創(chuàng )公司寒武紀宣布已經(jīng)完成1億美元A輪融資,戰略投資方可謂陣容豪華,阿里巴巴、聯(lián)想、科大訊飛等企業(yè)均參與投資。而其公司也成為全球AI芯片界首個(gè)獨角獸,受到國內外市場(chǎng)廣泛關(guān)注。

寒武紀科技主要負責研發(fā)生產(chǎn)AI芯片,公司最主要的產(chǎn)品為2016年發(fā)布的寒武紀1A處理器(Cambricon-1A),是一款可以深度學(xué)習的神經(jīng)網(wǎng)絡(luò )專(zhuān)用處理器,面向智能手機、無(wú)人機、安防監控、可穿戴設備以及智能駕駛等各類(lèi)終端設備,在運行主流智能算法時(shí)性能功耗比全面超越傳統處理器。目前已經(jīng)研發(fā)出1A、1H等多種型號。與此同時(shí),寒武紀也推出了面向開(kāi)發(fā)者的寒武紀人工智能軟件平臺 Cambricon NeuWare,包含開(kāi)發(fā)、調試和調優(yōu)三大部分。

2、軟硬件協(xié)同發(fā)展的典范——深鑒科技

深鑒科技的聯(lián)合創(chuàng )始人韓松在不同場(chǎng)合曾多次提及軟硬件協(xié)同設計對人工智能處理器的重要性,而其在FPGA領(lǐng)域頂級會(huì )議FPGA2017最佳論文ESE硬件架構就是最好的證明。該項工作聚焦于使用LSTM 進(jìn)行語(yǔ)音識別的場(chǎng)景,結合深度壓縮(Deep Compression)、專(zhuān)用編譯器以及 ESE 專(zhuān)用處理器架構,在中端的 FPGA 上即可取得比 Pascal Titan X GPU 高 3 倍的性能,并將功耗降低 3.5 倍。

在2017年10月的時(shí)候,深鑒科技推出了六款AI產(chǎn)品,分別是人臉檢測識別模組、人臉?lè )治鼋鉀Q方案、視頻結構化解決方案、ARISTOTLE架構平臺,深度學(xué)習SDK DNNDK、雙目深度視覺(jué)套件。而在人工智能芯片方面,公布了最新的芯片計劃,由深鑒科技自主研發(fā)的芯片“聽(tīng)濤”、“觀(guān)?!睂⒂?018年第三季度面市,該芯片采用臺積電28nm工藝,亞里士多德架構,峰值性能 3.7 TOPS/W。

3、對標谷歌TPU——比特大陸算豐

作為比特幣獨角獸的比特大陸,在2015年開(kāi)始涉足人工智能領(lǐng)域,其在2017年發(fā)布的面向AI應用的張量處理器算豐Sophon BM1680,是繼谷歌TPU之后,全球又一款專(zhuān)門(mén)用于張量計算加速的專(zhuān)用芯片(ASIC),適用于CNN / RNN / DNN的訓練和推理。

BM1680單芯片能夠提供2TFlops單精度加速計算能力,芯片由64 NPU構成,特殊設計的NPU調度引擎(Scheduling Engine)可以提供強大的數據吞吐能力,將數據輸入到神經(jīng)元核心(Neuron Processor Cores)。BM1680采用改進(jìn)型脈動(dòng)陣列結構。2018年比特大陸將發(fā)布第2代算豐AI芯片BM1682,計算力將有大幅提升。

4、百家爭鳴——百度、地平線(xiàn)及其他

在2017年的HotChips大會(huì )上,百度發(fā)布了XPU,這是一款256核、基于FPGA的云計算加速芯片,用于百度的人工智能、數據分析、云計算以及無(wú)人駕駛業(yè)務(wù)。在會(huì )上,百度研究員歐陽(yáng)劍表示,百度設計的芯片架構突出多樣性,著(zhù)重于計算密集型、基于規則的任務(wù),同時(shí)確保效率、性能和靈活性的最大化。

歐陽(yáng)劍表示:“FPGA是高效的,可以專(zhuān)注于特定計算任務(wù),但缺乏可編程能力。傳統CPU擅長(cháng)通用計算任務(wù),尤其是基于規則的計算任務(wù),同時(shí)非常靈活。GPU瞄準了并行計算,因此有很強大的性能。XPU則關(guān)注計算密集型、基于規則的多樣化計算任務(wù),希望提高效率和性能,并帶來(lái)類(lèi)似CPU的靈活性。

在2018年百度披露更多關(guān)于XPU的相關(guān)信息。

2017年12月底,人工智能初創(chuàng )企業(yè)地平線(xiàn)發(fā)布了中國首款全球領(lǐng)先的嵌入式人工智能芯片——面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器,還有針對智能駕駛、智能城市和智能商業(yè)三大應用場(chǎng)景的人工智能解決方案?!靶袢?1.0”和“征程 1.0”是完全由地平線(xiàn)自主研發(fā)的人工智能芯片,具有全球領(lǐng)先的性能。

為了解決應用場(chǎng)景中的問(wèn)題,地平線(xiàn)將算法與芯片做了強耦合,用算法來(lái)定義芯片,提升芯片的效率,在高性能的情況下可以保證它的低功耗、低成本。具體芯片參數尚無(wú)公開(kāi)數據。

除了百度和地平線(xiàn),國內研究機構如中國科學(xué)院、北京大學(xué)和清華大學(xué)也有人工智能處理器相關(guān)的成果發(fā)布。

北京大學(xué)聯(lián)合商湯科技等提出一種基于 FPGA 的快速 Winograd 算法,可以大幅降低算法復雜度,改善 FPGA 上的 CNN 性能。論文中的實(shí)驗使用當前最優(yōu)的多種 CNN 架構(如 AlexNet 和 VGG16),從而實(shí)現了 FPGA 加速之下的最優(yōu)性能和能耗。在 Xilinx ZCU102 平臺上達到了卷積層平均處理速度 1006.4 GOP/s,整體 AlexNet 處理速度 854.6 GOP/s,卷積層平均處理速度 3044.7 GOP/s,整體 VGG16 的處理速度 2940.7 GOP/s。

中國科學(xué)院計算機體系結構國家重點(diǎn)實(shí)驗室在頂級會(huì )議HPCA2017上提出了一種基于數據流的神經(jīng)網(wǎng)絡(luò )處理器架構,以便適應特征圖、神經(jīng)元和突觸等不同層級的并行計算,為了實(shí)現這一目標,該團隊對單個(gè)處理單元PE進(jìn)行重新設計,使得操作數可以直接通過(guò)橫向或縱向的總線(xiàn)從片上存儲器獲取,而非傳統PE只能從上至下或從左至右由相鄰單元獲取。該芯片采用了TMSC 65nm工藝,峰值性能為490.7 GOPs/W。

清華大學(xué)微納電子系魏少軍等2017年的VLSI國際研討會(huì )上提出了基于可重構多模態(tài)混合的神經(jīng)計算芯片Thinker。Thinker芯片基于該團隊長(cháng)期積累的可重構計算芯片技術(shù),采用可重構架構和電路技術(shù),突破了神經(jīng)網(wǎng)絡(luò )計算和訪(fǎng)存的瓶頸,實(shí)現了高能效多模態(tài)混合神經(jīng)網(wǎng)絡(luò )計算。Thinker芯片具有高能效的突出優(yōu)點(diǎn),其能量效率相比目前在深度學(xué)習中廣泛使用的GPU提升了三個(gè)數量級。Thinker芯片支持電路級編程和重構,是一個(gè)通用的神經(jīng)網(wǎng)絡(luò )計算平臺,可廣泛應用于機器人、無(wú)人機、智能汽車(chē)、智慧家居、安防監控和消費電子等領(lǐng)域。該芯片采用了TSMC 65nm工藝,片上存儲為348KB,峰值性能為5.09TOPS/W。

5、新架構新技術(shù)——憶阻器

2017年清華大學(xué)微電子所錢(qián)鶴、吳華強課題組在《自然通訊》(Nature Communications)在線(xiàn)發(fā)表了題為“運用電子突觸進(jìn)行人臉?lè )诸?lèi)”(“Face Classification using Electronic Synapses”)的研究成果,將氧化物憶阻器的集成規模提高了一個(gè)數量級,首次實(shí)現了基于1024個(gè)氧化物憶阻器陣列的類(lèi)腦計算。該成果在最基本的單個(gè)憶阻器上實(shí)現了存儲和計算的融合,采用完全不同于傳統“馮·諾依曼架構”的體系,可以使芯片功耗降低到原千分之一以下。憶阻器被認為是最具潛力的電子突觸器件,通過(guò)在器件兩端施加電壓,可以靈活地改變其阻值狀態(tài),從而實(shí)現突觸的可塑性。此外,憶阻器還具有尺寸小、操作功耗低、可大規模集成等優(yōu)勢。因此,基于憶阻器所搭建的類(lèi)腦計算硬件系統具有功耗低和速度快的優(yōu)勢,成為國際研究熱點(diǎn)。

在神經(jīng)形態(tài)處理器方面,最為著(zhù)名的就是IBM在2014年推出的TrueNorth芯片,該芯片包括4096個(gè)核心和540萬(wàn)個(gè)晶體管,功耗70mW,模擬了一百萬(wàn)個(gè)神經(jīng)元和2.56億個(gè)突觸。而在2017年,英特爾也推出一款能模擬大腦工作的自主學(xué)習芯片Loihi,Loihi由128個(gè)計算核心構成,每個(gè)核心集成了1024個(gè)人工神經(jīng)元,整個(gè)芯片擁有超過(guò)個(gè)13萬(wàn)個(gè)神經(jīng)元與1.3億個(gè)突觸連接,與人腦超過(guò)800億個(gè)神經(jīng)元相比,簡(jiǎn)直是小巫見(jiàn)大巫,Loihi的運算規模僅比蝦腦復雜一點(diǎn)點(diǎn)而已。英特爾認為該芯片適用于無(wú)人機與汽車(chē)自動(dòng)駕駛,紅綠燈自適應路面交通狀況,用攝像頭尋找失蹤人口等任務(wù)。

而在神經(jīng)形態(tài)芯片研究領(lǐng)域,清華大學(xué)類(lèi)腦計算研究中心施路平等在2015年就推出了首款類(lèi)腦芯片—“天機芯”,該芯片世界首次將人工神經(jīng)網(wǎng)絡(luò )(Artificial Neural Networks, ANNs)和脈沖神經(jīng)網(wǎng)絡(luò )(Spiking Neural Networks,SNNs)進(jìn)行異構融合,同時(shí)兼顧技術(shù)成熟并被廣泛應用的深度學(xué)習模型與未來(lái)具有巨大前景的計算神經(jīng)科學(xué)模型,可用于諸如圖像處理、語(yǔ)音識別、目標跟蹤等多種應用開(kāi)發(fā)。在類(lèi)腦“自行”車(chē)演示平臺上,集成32個(gè)天機一號芯片,實(shí)現了面向視覺(jué)目標探測、感知、目標追蹤、自適應姿態(tài)控制等任務(wù)的跨模態(tài)類(lèi)腦信息處理實(shí)驗。據悉,基于TSMC 28nm工藝的第二代天機芯片也即將推出,性能將會(huì )得到極大提升。

從ISSCC2018看人工智能芯片發(fā)展趨勢

在剛剛結束的計算機體系結構頂級會(huì )議ISSCC2018,“Digital Systems: Digital Architectures and Systems”分論壇主席Byeong-Gyu Nam對人工智能芯片,特別是深度學(xué)習芯片的發(fā)展趨勢做了概括。深度學(xué)習依然今年大會(huì )最為熱門(mén)的話(huà)題。相比較于去年大多數論文都在討論卷積神經(jīng)網(wǎng)絡(luò )的實(shí)現問(wèn)題,今年則更加關(guān)注兩個(gè)問(wèn)題:其一,如果更高效地實(shí)現卷積神經(jīng)網(wǎng)絡(luò ),特別是針對手持終端等設備;其二,則是關(guān)于全連接的非卷積神經(jīng)網(wǎng)絡(luò ),如RNN和LSTM等。

同時(shí),為了獲得更高的能效比,越來(lái)越多的研究者把精力放在了低精度神經(jīng)網(wǎng)絡(luò )的設計和實(shí)現,如1bit的神經(jīng)網(wǎng)絡(luò )。這些新型技術(shù),使得深度學(xué)習加速器的能效比從去年的幾十TOPS/W提升到了今年的上百TOPS/W。有些研究者也對數字+模擬的混合信號處理實(shí)現方案進(jìn)行了研究。對數據存取具有較高要求的全連接網(wǎng)絡(luò ),有些研究者則借助3-D封裝技術(shù)來(lái)獲得更好的性能。

正如前文所述,在人工智能芯片領(lǐng)域,國外芯片巨頭占據了絕大部分市場(chǎng)份額,不論是在人才聚集還是公司合并等方面,都具有絕對的領(lǐng)先優(yōu)勢。而國內人工智能初創(chuàng )公司則又呈現百家爭鳴、各自為政的紛亂局面;特別是每個(gè)初創(chuàng )企業(yè)的人工智能芯片都具有自己獨特的體系結構和軟件開(kāi)發(fā)套件,既無(wú)法融入英偉達和谷歌建立的生態(tài)圈,又不具備與之抗衡的實(shí)力。

國產(chǎn)人工智能芯片的發(fā)展,一如早年間國產(chǎn)通用處理器和操作系統的發(fā)展,過(guò)份地追求完全獨立、自主可控的怪圈,勢必會(huì )如眾多國產(chǎn)芯片一樣逐漸退出歷史舞臺。借助于X86的完整生態(tài),短短一年之內,兆芯推出的國產(chǎn)自主可控x86處理器,以及聯(lián)想基于兆芯CPU設計生產(chǎn)的國產(chǎn)計算機、服務(wù)器就獲得全國各地黨政辦公人員的高度認可,并在黨政軍辦公、信息化等國家重點(diǎn)系統和工程中已獲批量應用。

當然,投身于X86的生態(tài)圈對于通用桌面處理器和高端服務(wù)器芯片來(lái)說(shuō)無(wú)可厚非,畢竟創(chuàng )造一個(gè)如Wintel一樣的生態(tài)鏈已絕非易事,我們也不可能遇見(jiàn)第二個(gè)喬布斯和蘋(píng)果公司。而在全新的人工智能芯片領(lǐng)域,對眾多國產(chǎn)芯片廠(chǎng)商來(lái)說(shuō),還有很大的發(fā)展空間,針對神經(jīng)網(wǎng)絡(luò )加速器最重要的就是找到一個(gè)具有廣闊前景的應用領(lǐng)域,如華為海思麒麟處理器之于中科寒武紀的NPU;否則還是需要融入一個(gè)合適的生態(tài)圈。另外,目前大多數國產(chǎn)人工智能處理器都針對于神經(jīng)網(wǎng)絡(luò )計算進(jìn)行加速,而能夠提供單芯片解決方案的很少;微控制器領(lǐng)域的發(fā)展,ARM的Cortex-A系列和Cortex-M系列占據主角,但是新興的開(kāi)源指令集架構RISC-V也不容小覷,完全值得眾多國產(chǎn)芯片廠(chǎng)商關(guān)注。

聲明:本文內容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權轉載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習之用,如有內容侵權或者其他違規問(wèn)題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò )

    關(guān)注

    42

    文章

    4593

    瀏覽量

    99387
  • 人工智能
    +關(guān)注

    關(guān)注

    1781

    文章

    44785

    瀏覽量

    231982
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1735

    瀏覽量

    34515

原文標題:AI芯片格局分布

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    國內外LED芯片現狀解讀:技術(shù)差異大

    芯片,是LED的核心部件。目前國內外有很多LED芯片廠(chǎng)家,在技術(shù)對比方面,國外芯片技術(shù)新,國內芯片
    發(fā)表于 05-14 09:44 ?2537次閱讀

    急~~有誰(shuí)知道國內外汽車(chē)噴油器的檢測技術(shù)的發(fā)展狀況

    有大蝦知道國內外汽車(chē)噴油器的檢測技術(shù)的發(fā)展狀況嗎?求介紹、求資料。。
    發(fā)表于 04-19 14:33

    求multisim10國內外概況及發(fā)展趨勢

    誰(shuí)能告訴我仿真軟件multisim10國內外概況及發(fā)展趨勢啊。
    發(fā)表于 10-30 18:16

    誰(shuí)有關(guān)于密碼登錄系統國內外研究現狀的資料啊,

    誰(shuí)有關(guān)于密碼登錄系統國內外研究現狀的資料啊,手頭資料沒(méi)有這方面的介紹,誰(shuí)能幫忙給點(diǎn)資料啊謝謝了
    發(fā)表于 03-11 15:34

    國內外人工智能十大芯片怎么樣?

    數百人多則數千人協(xié)同才能完成。芯片設計詳細過(guò)程可以去我們的姊妹媒體EDN電子技術(shù)設計網(wǎng)或者EETC電子工程專(zhuān)輯網(wǎng)搜索。今天,我們來(lái)縱覽國內外十大AI芯片的情況。手把手教你設計人工智能
    發(fā)表于 09-11 11:52

    國內外5G核心產(chǎn)業(yè)鏈的發(fā)展情況分析

    本文對5G生態(tài)鏈中的五個(gè)產(chǎn)業(yè)進(jìn)行分析,詳細梳理當前國內外5G核心產(chǎn)業(yè)鏈的發(fā)展情況。 5G技術(shù)的快速發(fā)展正在推動(dòng)包括通信、電子元器件、芯片、終端應用等全產(chǎn)業(yè)鏈的升級。從上游基站射頻、基帶
    發(fā)表于 12-22 06:18

    FPGA的發(fā)展現狀如何?

    FPGA的發(fā)展現狀如何?賽靈思推出的領(lǐng)域目標設計平臺如何簡(jiǎn)化設計、縮短開(kāi)發(fā)時(shí)間?
    發(fā)表于 04-08 06:18

    汽車(chē)用基礎電子元器件發(fā)展現狀與趨勢是什么?

    汽車(chē)用基礎電子元器件發(fā)展現狀如何?國內汽車(chē)用基礎電子元器件發(fā)展現狀如何?汽車(chē)用基礎電子元器件發(fā)展趨勢是什么?
    發(fā)表于 05-17 06:27

    國內外失效評定曲線(xiàn)(FAC)的發(fā)展以及現狀

    國內外失效評定曲線(xiàn)(FAC)的發(fā)展以及現狀:由于 壓 力 容器、壓力管道是具有潛在爆炸危險的特殊承壓設備,一旦發(fā)生爆炸或泄漏,就會(huì )造成災難性事故。由于大量的壓力容器或管道
    發(fā)表于 12-18 11:32 ?19次下載

    RFID國內外發(fā)展現狀與趨勢探究

    具體介紹了RFID國內外發(fā)展現狀與趨勢探究,然后做出了總結。
    發(fā)表于 05-30 14:20 ?19次下載

    光伏電池的原理及發(fā)展現狀

    本文闡述了太陽(yáng)能光伏電池的原理, 綜述了國內外光伏發(fā)電技術(shù)的發(fā)展現狀發(fā)展趨勢。
    發(fā)表于 10-18 11:21 ?7653次閱讀
    光伏電池的原理及<b class='flag-5'>發(fā)展現狀</b>

    智能車(chē)輛國內外發(fā)展現狀及趨勢概述

    本報告將自動(dòng)駕駛領(lǐng)域最為關(guān)鍵的傳感器——激光雷達作為中心,通過(guò)調研其所扮演重要角色的領(lǐng)域——自動(dòng)駕駛,以及自動(dòng)駕駛和激光雷達的國內外發(fā)展現狀,深入了解激光雷達的技術(shù)背景。
    的頭像 發(fā)表于 04-12 12:16 ?4.7w次閱讀

    國內外OEM自動(dòng)駕駛操作系統發(fā)展現狀

    在當下“軟件定義”、“數據驅動(dòng)”的大背景下,國內外傳統主機廠(chǎng)已經(jīng)從特斯拉“硬件預埋、OTA升級、軟件收費“模式帶來(lái)的震撼中改變,紛紛開(kāi)始大力投入操作系統的開(kāi)發(fā),尤其是自動(dòng)駕駛操作系統的開(kāi)發(fā)。本文重點(diǎn)分析國內外自動(dòng)駕駛相關(guān)企業(yè)操作系統的發(fā)
    的頭像 發(fā)表于 07-31 10:53 ?3155次閱讀

    深度解讀工控安全技術(shù)發(fā)展現狀與應用趨勢

    本文將分析工控安全技術(shù)發(fā)展現狀,盤(pán)點(diǎn)國內外工控安全主流廠(chǎng)商發(fā)展態(tài)勢,分析我國工控安全市場(chǎng)發(fā)展現狀,展望未來(lái)工控安全技術(shù)的發(fā)展與應用趨勢。
    發(fā)表于 05-25 10:42 ?3259次閱讀
    深度解讀工控安全技術(shù)<b class='flag-5'>發(fā)展現狀</b>與應用趨勢

    STM32國內外發(fā)展現狀

    電子發(fā)燒友網(wǎng)站提供《STM32國內外發(fā)展現狀.docx》資料免費下載
    發(fā)表于 04-08 15:56 ?25次下載
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看