搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學(xué)習在線(xiàn)課程
觀(guān)看技術(shù)視頻
寫(xiě)文章/發(fā)帖/加入社區

會(huì )員中心

創(chuàng )作中心

發(fā)布

創(chuàng )作活動(dòng)

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內不再提示

聯(lián)發(fā)科聯(lián)手英偉達挑戰高通與AMD，游戲、3納米和大模型

2023年5月，聯(lián)發(fā)科與英偉達宣布合作，共同研發(fā)車(chē)載芯片，原本計劃是采用Chiplet形式。

2024年3月，聯(lián)發(fā)科正式發(fā)布新一代Dimensity Auto 座艙平臺，最大亮點(diǎn)是英偉達RTX GPU IP的加入和臺積電3納米的制造工藝。臺積電3納米制造工藝是目前芯片行業(yè)最先進(jìn)的制造工藝，這是汽車(chē)芯片第一次與手機和AI芯片同時(shí)使用最先進(jìn)的制造工藝，但不是Chiplet，推測一來(lái)是3納米的Chiplet制造工藝不夠成熟，二就是Chiplet需要動(dòng)用臺積電先進(jìn)封裝，成本并不比單一die低，甚至可能高2-3倍，汽車(chē)行業(yè)對價(jià)格還是相對比較敏感的。

聯(lián)發(fā)科是一家非常低調的公司，品牌形象營(yíng)造遠不如高通，也極少對外透露信息。

聯(lián)發(fā)科一直被高通擠壓，特別是在GPU和AI方面，聯(lián)發(fā)科引入英偉達的GPU IP來(lái)彌補這一短板。

從聯(lián)發(fā)科官方介紹中，我們不難看出聯(lián)發(fā)科使用的英偉達GPU IP是何種類(lèi)型的IP，因為DLSS3是RTX40系列獨有的功能，也就是說(shuō)聯(lián)發(fā)科使用了英偉達RTX40系列桌面顯卡的IP。

簡(jiǎn)單介紹一下DLSS3

圖片來(lái)源：英偉達

DLSS全稱(chēng)Deep Learning Super Sampling（深度學(xué)習超采樣），主要包括DLAA、插幀和光線(xiàn)重建。插幀即幀生成，它可以生成全新幀，而不僅是像素，從而帶來(lái)驚人的性能提升?；贜VIDIA Ada Lovelace架構的新光流加速器可分析兩幀連續的游戲圖像，并計算幀到幀中物體和元素的運動(dòng)矢量數據，而不使用傳統游戲引擎的運動(dòng)矢量進(jìn)行建模。這極大地減少了AI在渲染諸如粒子、反射、陰影和光照等元素時(shí)的視覺(jué)異常。

通過(guò)綜合游戲中的一對超級分辨率幀，以及引擎和光流運動(dòng)矢量，并將其輸入至卷積神經(jīng)網(wǎng)絡(luò )，就能計算生成出新的一幀，這在實(shí)時(shí)游戲渲染中是首次實(shí)現。將DLSS生成的全新幀與DLSS超級分辨率幀相結合，使DLSS 3能用AI重建八分之七的顯示像素，與沒(méi)有DLSS相比，游戲性能提升了4倍。

由于DLSS生成幀在GPU上作為后處理執行，即使游戲受到CPU性能限制，也能從中獲得游戲性能提升。對于受到CPU限制的游戲，例如物理計算密集型游戲或大型場(chǎng)景游戲，DLSS 3令GeForce RTX 40系列GPU以高達兩倍于CPU可計算的性能渲染游戲。

DLSS 3集成也包括NVIDIA Reflex，可以使GPU和CPU同步，確保最佳響應速度和低系統延遲。

DLSS3的插幀技術(shù)目前還是英偉達獨有，AMD和英特爾沒(méi)有，也就是說(shuō)如果用聯(lián)發(fā)科的芯片運行《賽博朋克2077》這樣的硬件殺手游戲，效果或可以碾壓特斯拉座艙的AMD 分離式GPU。

RTX40系列也有多個(gè)版本，最低的是筆記本電腦用的GTX4050，AD107架構，2560個(gè)CUDA，聯(lián)發(fā)科最大可能用這個(gè)架構。RTX4050的稀疏INT8算力估計有104TOPS，將來(lái)聯(lián)發(fā)科的旗艦芯片或許AI算力大約就是100TOPS，當然了功耗會(huì )有25-35瓦以上，水冷恐怕不可避免。

另一大特色就是3納米工藝，據稱(chēng)目前蘋(píng)果和聯(lián)發(fā)科已經(jīng)包下了臺積電全部的3納米產(chǎn)能，高通拿不到臺積電的3納米產(chǎn)能了，高通打算使用三星的3納米。眾所周知，三星與臺積電差距還是很大的。制造工藝上，聯(lián)發(fā)科與同在臺灣省內的臺積電合作更加順利，聯(lián)發(fā)科的手機芯片也拿到了4納米首發(fā)，領(lǐng)先了高通一步，3納米上基本也可以確定，聯(lián)發(fā)科也是首發(fā)。臺積電第一代3nm工藝是N3B，由臺積電的大客戶(hù)蘋(píng)果率先使用，A17 Pro、M3系列芯片等都是使用的臺積電第一代3nm工藝制程。臺積電第二代3nm工藝是N3E，N3E預計將比N3B應用更廣泛，除了前面提到的聯(lián)發(fā)科天璣9400芯片外，高通驍龍8 Gen4、A18系列芯片也原本計劃采用N3E工藝。臺積電N3E是N3B的增強版，良率更高，成本更低，但密度會(huì )略低于N3B。

聯(lián)發(fā)科這次也是和高通一樣，手機芯片與車(chē)載芯片同步，都采用最先進(jìn)的3納米制造工藝，考慮到3納米高達數億美元的驚人的一次性流片成本，聯(lián)發(fā)科的手機和車(chē)載芯片應該有共通之處。

2023年9月，聯(lián)發(fā)科宣布首款使用臺積電3納米工藝的芯片即將在2024年量產(chǎn)，這就是聯(lián)發(fā)科新旗艦天璣9400。

天璣9300開(kāi)始使用全大核設計，晶體管數量高達227億，比英偉達自動(dòng)駕駛Orin的170億還要多很多。天璣9300的227億晶體管，是真正的遙遙領(lǐng)先：蘋(píng)果A16是160億，A17 Pro是190億，蘋(píng)果M2是200億。即便是蘋(píng)果M3，也“僅”有250億晶體管，而高通好幾代沒(méi)公布晶體管數目了。歷史性的取消小核，CPU由4顆X4超大核和4顆A720大核組成，最高頻的X4有更大的緩存。跳出安卓SoC的視角看，天璣9300的4顆超大核和4顆大核，其實(shí)更接近于蘋(píng)果A系列和英特爾的P核（性能核）、E核（能效核）概念。

天璣首發(fā)LPDDR5T 9600Mbps內存，速度比之前的LPDDR5x 8533Mbps提升12.5%，這是大家以為要等LPDDR6才能達到的頻率（2年前的天璣9000是首發(fā)LPDDR 5x 7500Mbps內存，天璣9200是首發(fā)LPDDR5x 8533Mbps）。

天璣9400采用ARM旗艦Cortex-x5（下圖TCS24就是Cortex-x5，代號黑鷹），這是ARM最強CPU架構。

ARM的路線(xiàn)圖

圖片來(lái)源：ARM

Cortex-x5據說(shuō)將消除Arm設計的CPU內核與蘋(píng)果基于A(yíng)rm指令集自研的CPU內核之間的性能差距。Moor Insights & Strategy CEO Patrick Moorhead指出，ARM全新的Cortex-X系列CPU內核的內部代號為“Blackhawk”，是ARM CEO Rene Haas接下來(lái)的工作重點(diǎn)之一，旨在消除Arm設計的CPU內核與蘋(píng)果基于A(yíng)rm指令集自研的CPU內核之間的性能差距。Moorhead引用ARM說(shuō)法表示，“Blackhawk”核心將會(huì )帶來(lái)巨大的性能提升，是五年來(lái)同比最大的IPC性能提升。

整理：佐思汽研

多年來(lái)ARM一直在擠牙膏，IPC帶寬從2位，緩慢上升，而蘋(píng)果一開(kāi)始就到巔峰的8位，導致安卓性能遠低于蘋(píng)果，X5可能追平蘋(píng)果的8位解碼寬度，也可能直接到10位，超過(guò)蘋(píng)果。

圖片來(lái)源：聯(lián)發(fā)科

很多人以為AI運算和CPU沒(méi)關(guān)系，或者說(shuō)CPU無(wú)法做AI運算，實(shí)際上CPU完全可以做任何類(lèi)型的AI運算，只是數據吞吐能力不如GPU或AI加速器，拋開(kāi)數據吞吐，單純AI運算，CPU是最快的。ARM最新的CPU如Cortex-X3/X4/X5，都能夠運行大模型，目前手機領(lǐng)域或者說(shuō)移動(dòng)領(lǐng)域大模型最常見(jiàn)的是LIama2，這是目前最好的語(yǔ)言類(lèi)開(kāi)源大模型。天璣9400可以做到每秒12-15 tokens。

簡(jiǎn)單介紹一下LIama2，Meta 出品的 Llama 續作 Llama2，一系列模型（7B、13B、70B）均開(kāi)源可免費商用。Llama2在各個(gè)榜單上精度全面超過(guò)Llama1，同時(shí)也超過(guò)目前所有開(kāi)源模型。用于車(chē)載和手機的70億參數的相對較小的模型。

盡管語(yǔ)言類(lèi)大模型LLM訓練方法很直觀(guān)：基于自回歸的transformer模型，在大量預料上做自監督訓練，然后通過(guò)人類(lèi)反饋強化學(xué)習 (RLHF) 等技術(shù)來(lái)與人類(lèi)偏好對齊。但高計算需求限制了LLM 只能由少數玩家來(lái)推動(dòng)發(fā)展?，F有的開(kāi)源大模型，例如BLOOM、Llama1、Falcon，雖然都能基本達到匹配非開(kāi)源大模型（如GPT-3、Chinchilla）的能力，但這些模型都不適合成為非開(kāi)源產(chǎn)品級LLM （比如ChatGPT、BARD、Claude）的替代品，因為這些封閉的產(chǎn)品級LLM經(jīng)過(guò)大量微調，與人類(lèi)的偏好保持一致，大大提高了它們的可用性和安全性。這一步在計算和人工標注中需要大量的成本，而且往往不透明或容易重現，限制了社區的進(jìn)步，以促進(jìn)AI對齊研究。

圖片來(lái)源：網(wǎng)絡(luò )

Meta自己的獎勵模型在基于Llama 2-Chat收集的內部測試集上表現最佳，其中「有用性」獎勵模型在「元有用性」測試集上表現最佳，同樣，「安全性」獎勵模型在「元安全性」測試集上表現最佳?？傮w而言，Meta的獎勵模型優(yōu)于包括GPT-4在內的所有基線(xiàn)模型。有趣的是，盡管GPT-4 沒(méi)有經(jīng)過(guò)直接訓練，也沒(méi)有專(zhuān)門(mén)針對這一獎勵建模任務(wù)，但它的表現卻優(yōu)于其他非元獎勵模型。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權轉載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習之用，如有內容侵權或者其他違規問(wèn)題，請聯(lián)系本站處理。舉報投訴

聯(lián)發(fā)科

聯(lián)發(fā)科

+關(guān)注

關(guān)注
55

文章
2596

瀏覽量
253131
加速器

加速器

+關(guān)注

關(guān)注
2

文章
766

瀏覽量
36750
英偉達

英偉達

+關(guān)注

關(guān)注
22

文章
3483

瀏覽量
88878
車(chē)載芯片

車(chē)載芯片

+關(guān)注

關(guān)注
0

文章
68

瀏覽量
14562
chiplet

chiplet

+關(guān)注

關(guān)注
6

文章
384

瀏覽量
12462

原文標題：聯(lián)發(fā)科聯(lián)手英偉達挑戰高通與AMD，游戲、3納米和大模型

文章出處：【微信號：zuosiqiche，微信公眾號：佐思汽車(chē)研究】歡迎添加關(guān)注！文章轉載請注明出處。

評論

相關(guān)推薦

聯(lián)發(fā)科 XY6833 5G AI 智能模塊

模塊聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年05月24日 11:30:51

聯(lián)發(fā)科 XY6789_雙4G處理器智能模塊

聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年05月22日 12:02:39

聯(lián)發(fā)科 MT6983_天璣9000 5G移動(dòng)芯片

芯片聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年05月21日 09:57:28

聯(lián)發(fā)科 XY6853 5G AI 智能模塊

模塊聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年05月16日 14:41:00

聯(lián)發(fā)科 XY6739 4G 核心板

聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年05月14日 12:01:34

進(jìn)一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

，通過(guò)英偉達高帶寬接口（NV-HBI）將兩個(gè)最大可制造芯片合并為一個(gè)圖形處理器單元，支持10TB/s帶寬，形成高效的通信通道，提升整體性能。配備192GB的HBM3e內存、超過(guò)8TB

發(fā)表于 05-13 17:16

聯(lián)發(fā)科 MT6761 4G 智能模塊之應用方案

聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年04月13日 10:07:09

聯(lián)發(fā)科 MT6739 4G 智能模塊

模塊聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年04月10日 09:48:36

聯(lián)發(fā)科 XY6785 4G 智能模塊

模塊聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年04月09日 09:41:57

聯(lián)發(fā)科 XY8766 4G 智能模塊

模塊聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年04月07日 10:59:35

英偉達AI霸主地位遭巨頭聯(lián)手挑戰，CUDA壟斷遭破局

據最新外媒報道，科技界的巨頭們——高通、谷歌和英特爾等，已經(jīng)聯(lián)手向英偉達發(fā)起了一場(chǎng)挑戰，意圖打破其在CUDA平臺上的壟斷局面。

的頭像

發(fā)表于 03-28 14:39 ?589次閱讀

聯(lián)發(fā)科天璣1200雙5G

芯片聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年03月21日 10:28:02

聯(lián)發(fā)科MT6877（天璣 900）平臺 —— XY6877 5G AI 智能模塊

模塊聯(lián)發(fā)科

jf_87063710

發(fā)布于 :2024年01月12日 09:37:42

聯(lián)發(fā)科 5G AI 智能芯片—XY6877

聯(lián)發(fā)科智能芯片

jf_87063710

發(fā)布于 :2024年01月03日 10:12:51

機構：聯(lián)發(fā)科手機處理器份額達33%

處理器聯(lián)發(fā)科

北京中科同志科技股份有限公司

發(fā)布于 :2023年12月25日 09:13:12

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看