<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

芯耀輝DDR PHY訓練技術簡介

數字芯片實驗室 ? 來源: 數字芯片實驗室 ? 2024-01-05 10:27 ? 次閱讀

DDR接口速率越來越高,每一代產品都在挑戰工藝的極限,對DDR PHY的訓練要求也越來越嚴格。本文從新銳IP企業芯耀輝的角度,談談DDR PHY訓練所面臨的挑戰,介紹芯耀輝DDR PHY訓練的主要過程和優勢,解釋了芯耀輝如何解決DDR PHY訓練中的問題。

引言

DDR接口速率越來越高,每一代產品都在挑戰工藝的極限,對DDR PHY的訓練要求也越來越嚴格。本文從新銳IP企業芯耀輝的角度,談談DDR PHY訓練所面臨的挑戰,介紹芯耀輝DDR PHY訓練的主要過程和優勢,解釋了芯耀輝如何解決DDR PHY訓練中的問題。

DDRPHY訓練簡介

高可靠性是系統級芯片SoC重要的質量和性能要求之一。SoC的復雜在于各個IP模塊都對其產生至關重要的影響。從芯耀輝長期服務客戶的經驗來看,在客戶的SoC設計中,訪問DDR SDRAM是常見的需求,所以DDR PHY則成為了一個非常關鍵的IP,其能否穩定可靠的工作決定了整個SoC芯片的質量和可靠性。

制定DDR協議的固態技術協會(JEDEC)標準組織并沒有在規范中要求動態隨機存取存儲器(DRAM)需要具備調整輸入輸出信號延時的能力,于是通常DDR PHY就承擔起了輸入和輸出兩個方向的延時調整工作,這個調整的過程稱為訓練(training)。訓練是為了使DDR PHY輸出信號能符合固態技術協會標準的要求,DDR PHY通過調節發送端的延遲線(delay line),讓DRAM顆粒能在接收端順利地采樣到控制信號和數據信號;相對應的,在DDR PHY端,通過調整內部接收端的延遲線,讓DDR PHY能順利地采樣到DRAM顆粒的輸出信號。從而在讀寫兩個方向,DDR接口都能穩定可靠地工作。

2f1da904-ab10-11ee-8b88-92fbcf53809c.png

圖1:DDR PHY承擔了輸入和輸出兩個方向的延時調整工作

然而,隨著DDR工作頻率提高,DDR PHY訓練的準確性和精度要求也隨之提高。訓練的準確性和精度決定了DDR系統能否穩定可靠地工作在較高的頻率。

DDRPHY訓練所面臨的挑戰

DDR訓練的種類繁多,每個訓練的結果都不能出錯。同時固態技術協會定義的訓練序列都比較單一,如果只使用這些默認序列的話,訓練結果在實際工作中并不是一個最優值。

目前絕大多數DDR PHY都采用硬件訓練的方式,如果硬件算法有問題,會導致訓練出錯,DDR無法正常穩定地工作,導致整個SoC的失敗。同時,硬件訓練模式很難支持復雜的訓練序列和訓練算法,從而無法得到訓練結果的最優解。

芯耀輝的DDR PHY采用軟硬件結合的固件(firmware)訓練方式跳出了上述DDR PHY訓練模式的固定思維。

芯耀輝DDRPHY在訓練上的優勢

解決寫入均衡(writeleveling)的難題

寫入均衡是為了計算出flyby結構下命令通路和數據通路的走線延遲的差值,在DDR PHY中把這個差值補償到數據通路上,從而最終讓數據通路和命令通路的延遲達到一致。

2f34fc3a-ab10-11ee-8b88-92fbcf53809c.png

圖2:DDR flyby拓撲結構示意圖

在實際的應用中,命令(command)路徑上的延時會超過數據(DQ)路徑的延時。假設路徑差值=命令路徑延時–數據路徑延時,一般路徑差值在0~5個時鐘周期之間??梢园崖窂讲钪捣譃檎麛挡糠趾托挡糠郑▎挝皇?.5個時鐘周期)。

2f393d72-ab10-11ee-8b88-92fbcf53809c.png

圖3:命令路徑延時、數據路徑延時和路徑差值

根據固態技術協會標準(如JESD79-4C)的寫入均衡的要求,DRAM在寫入均衡模式下會用DDR PHY發送過來的DQS沿去采樣CK,并把采樣的值通過DQ返回給DDR PHY。

2f45907c-ab10-11ee-8b88-92fbcf53809c.png

圖4:寫入均衡模式下調整DQS時延的示意圖

通過該訓練,DDR PHY可以計算出命令與數據路徑延時差值的小數部分,卻沒有辦法訓練出命令與數據路徑延時差值的整數部分(把DQS多延遲一個時鐘周期或者少延遲一個時鐘周期,用DQS采樣CK的采樣值是相同的)。

為了解決這個問題,通常會根據版圖設計估算出大概的路徑差值,從而自行得到路徑差值的整數部分,直接配置到DDR PHY的寄存器中。這種做法在頻率比較低、量產一致性比較好的時候問題不大。但在大規模量產的時候,如果平臺之間的不一致性超過一個時鐘周期(LPDDR4最高頻下周期為468ps)的話,上述直接配置整數部分的方法就沒法進行工作了,必然會導致部分芯片無法正常工作。

芯耀輝采用固件的訓練方式,通過DDR寫操作時特殊調節方法,能夠幫助客戶計算出路徑差值整數加小數部分,無需客戶根據版圖設計估算路徑差值范圍。

2f4cdb0c-ab10-11ee-8b88-92fbcf53809c.png

圖5:路徑差值整數部分訓練和小數部分訓練

過濾訓練時DQS的高阻態

讀操作時,DQS信號在前導(preamble)前是高阻態,同時DQS信號的前導部分也不能達到最穩定的狀態,所以需要訓練出讀DQS的gate信號來過濾掉前面的高阻態和前導,恰好得到整個讀突發(Read Burst)操作的有效DQS,這就是讀DQS gate訓練。

芯耀輝采用特定的方法,在訓練的時候,排除不穩定DQS的干擾,用讀DQS的gate信號得到讀突發數據對應的第一個DQS的上升沿位置,從而得到gate的位置。

2f50927e-ab10-11ee-8b88-92fbcf53809c.png

圖6:讀DQS gate訓練

延遲DQS提高讀DQ訓練的準確性

一般在DDR PHY中沒有這個訓練,因為該訓練不是固態技術協會標準要求的,可是在實際應用中,這個訓練卻有著比較重要的意義。

2f5e9b62-ab10-11ee-8b88-92fbcf53809c.png

圖7:LPDDR4突發讀(來源固態技術協會標準JESD209-4B)

讀DQS和讀DQ之間的偏差為tDQSQ,這個值的范圍是0~0.18UI(在高頻下約為0~42ps)。讀訓練的時候,采用延遲DQS的方法,找到DQ的左右窗口,最后把DQS放在DQ窗口的中心點。由于DDR PHY內部的DQS-DQ延遲偏差、封裝的pad延遲偏差、以及PCB走線偏差,雖然DRAM端輸出的tDQSQ為正數(DQ的延遲比DQS大),但在DDR PHY內部看到的tDQSQ卻可能為負數(DDR PHY內部DQS的延遲比DQ大),如圖8上半部分所示。

在這種情況下,即使DQS的延遲為0,DQS也落在DQ的窗口內,PHY內部會通過從0延遲開始增加DQS的延遲來搜索DQ的左右窗口,這樣必然導致最終搜索到的DQ的窗口比實際的窗口要小,讀訓練后的DQS的采樣點不在DQ的正中間,而在偏右的位置,最終讀余量(margin)變小。

芯耀輝通過特定的方法,能讓每個DQ的窗口都在DQS右邊,這樣做讀訓練的時候,可以搜索到DQ的完整窗口,提高了讀訓練的準確性,提升DDR的讀性能。

2f7600a4-ab10-11ee-8b88-92fbcf53809c.png

圖8:Read DQ skew training

用固件的訓練方法獲取讀數據眼圖(Readdataeye)的優化值

讀數據眼圖訓練通過延遲讀DQS的方法,把讀DQS放在DQ窗口的中間。目前最大的問題是固態技術協會標準對讀數據眼圖的讀序列定義的比較簡單,比如對于DDR4,定義的序列是01010101的固定序列。因為高速信號的符號間干擾以及信號反射,在不同的讀序列的情況下DQ窗口是有差異的,所以采用簡單固定的序列并不能很好地覆蓋實際的使用場景,導致訓練結果在實際工作時并不是一個優化值。

芯耀輝采用固件的訓練方法,可以設置不同的范式(pattern),如PRBS范式、特殊設計的掃頻范式等。顯然此類范式能更好地反映數據通道的特性,因為它包含了高頻、中頻、低頻信息,以及長0和長1帶來的碼間串擾等問題,可以獲得較優的訓練結果,從而得到一個能覆蓋實際工作場景的可靠值。

二維訓練模式下優化的參考電壓(Vref)電壓和地址線(CA)延遲

LPDDR3中引入了地址線訓練,DRAM把采樣到的地址信號通過數據通路反饋給DDR PHY,DDR PHY可以通過這個反饋去調節地址線的延遲。在LPDDR4中,還加入了地址線參考電壓的訓練,所以不僅需要調節地址線的延遲,還需要找到一個最優的參考電壓值。傳統使用硬件訓練的方式在面對這種兩個維度的訓練時就會顯得捉襟見肘,同時硬件算法也沒法做得太復雜。

芯耀輝采用固件的二維訓練模式,可以繪制出完整的以地址線延遲為橫坐標和以參考電壓為縱坐標的二維圖像,從而得到較優的參考電壓和對應的地址線延遲。

二維訓練模式下優化的DQ參考電壓和DQ延遲

DDR4的固態技術協會標準中引入了DQ參考電壓,可是對于如何訓練并沒有給出說明和支持,所以大多數DDR PHY并不支持DDR4的DQ參考電壓訓練,只能配置一個固定參考電壓值。

LPDDR4的固態技術協會標準增加了寫DQS-DQ訓練(調整寫DQ相對于寫DQS的相位)和DQ參考電壓訓練協議上的支持。

芯耀輝采用固件的方式,不僅支持了DDR4的DQ參考電壓訓練,同時對于LPDDR4的寫DQS-DQ和DQ參考電壓訓練,也采用了固件的二維訓練模式,繪制出完整的以DQ延遲為橫坐標和以DQ參考電壓為縱坐標的二維圖像,在整個二維圖像中找到較優的DQ參考電壓和對應的DQ延遲。

總結

隨著工藝節點的提升和DDR顆粒技術的演進,DDR的工作頻率越來越高,DDR顆粒的訓練要求也越來越高。同時對于DDR PHY來說,內部的模擬電路(FFE,DFE等)隨著頻率的提升也需要做各種高精度的訓練。芯耀輝采用軟硬結合的智能訓練方法不僅可以支持DDR顆粒的各種必要的復雜訓練,也同時可以支持DDR PHY內部模擬電路的各種訓練。通過不斷優化訓練算法,持續挑戰每一代DDR產品的速率極限。

Reference:軟硬結合的智能DDR PHY訓練技術-電子工程專輯 (eet-china.com)

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • soc
    soc
    +關注

    關注

    38

    文章

    3790

    瀏覽量

    215995
  • PHY
    PHY
    +關注

    關注

    2

    文章

    270

    瀏覽量

    51231
  • DDR接口
    +關注

    關注

    0

    文章

    5

    瀏覽量

    7519
  • 芯耀輝
    +關注

    關注

    2

    文章

    36

    瀏覽量

    9832

原文標題:軟硬結合的智能DDR PHY訓練技術

文章出處:【微信號:數字芯片實驗室,微信公眾號:數字芯片實驗室】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    IP新銳芯耀輝多點破局DDR PHY技術瓶頸

    DDR PHY是DRAM和內存控制器通信的橋梁,它負責把內存控制器發過來的數據轉換成符合DDR協議的信號,并發送到DRAM。
    發表于 04-20 11:37 ?4635次閱讀
    IP新銳芯耀輝多點破局<b class='flag-5'>DDR</b> <b class='flag-5'>PHY</b><b class='flag-5'>技術</b>瓶頸

    電子技術實踐與訓練

    本帖最后由 gk320830 于 2015-3-5 11:42 編輯 電子技術實踐與訓練
    發表于 05-25 17:49

    高薪聘請-Serdes PCS/DDR3/4 PHY

    blocks.2. Design DDR/DDR2/DDR3 memory PHY both for receiver and transmitter.3. Interact wit
    發表于 11-13 14:46

    ADI模擬技術訓練營:放大器初步

    轉發ADI模擬技術訓練營——放大器初步目錄 第一部分:放大器的分類簡介 第二部分:使用放大器的一般性規則 第三部分:選擇放大器入門 第四部分:使用網絡資源 第五部分:數據記錄和報告撰寫 第六部分:實驗和注意事項 附件放大器初步.
    發表于 11-08 09:21

    基于武漢源半導體CW32的無刷電機訓練營正式結營!

    2022年6月16日,由武漢源半導體&嘉立創EDA&創工坊科技(深圳)聯合舉辦的,基于武漢源半導體的CW32F030C8T6制作BLDC無刷電機訓練營正式結營!感謝嘉立創EDA
    發表于 06-21 15:04

    如何跳過SPL中的ddr訓練?

    我正在優化啟動速度,ddr 訓練在 SPL 中需要 360ms,所以我想跳過它。 我厭倦了在 ddr 訓練后注意 ddrphy_trained_csr[] 和 g_cdd_max[],
    發表于 06-01 08:16

    imx8mp ddr訓練卡住了怎么解決?

    PHY training for 3200MTS我將其追溯到“drivers/ddr/imx/phy/ddrphy_utils.c”中的這個函數 static inline void
    發表于 06-08 06:02

    Cadence宣布推出基于臺積電16納米FinFET制程DDR4 PHY IP

    全球電子設計創新領先企業Cadence設計系統公司(NASDAQ: CDNS)今天宣布,立即推出基于臺積電16納米FinFET制程的DDR4 PHY IP(知識產權)。
    發表于 05-21 09:44 ?1826次閱讀

    Cadence公司發布了關于即將發布的DDR5市場版本以及技術的進展

    DDR5控制器和PHY)的商業版本。最近,該公司發布了一些關于即將發布的DDR5市場版本以及這項技術的進展。
    的頭像 發表于 06-08 17:37 ?5286次閱讀

    NVIDIA的Mellanox將采用經驗證的DesignWare DDR5/4 PHY IP核

    DesignWare DDR5/4 PHY IP核提供基于固件的訓練,無需更改硬件即可進行現場升級,從而幫助客戶降低采用新協議的風險?;诠碳?b class='flag-5'>訓練也有助于使用復雜的
    的頭像 發表于 08-28 15:38 ?2034次閱讀

    DDR PHY 與電路板調試

    UltraScale+ MPSoC VCU(H.264/H.265 視頻編解碼器)連用。 因此,調試將不同于 MIG 等傳統 Xilinx DDR 控制器。 DDR PHY 與電路板調試: Zynq UltraScale
    的頭像 發表于 02-08 15:51 ?1497次閱讀

    基于FPGA的DDR3SDRAM控制器設計及實現簡介

    基于FPGA的DDR3SDRAM控制器設計及實現簡介(arm嵌入式開發平臺PB)-該文檔為基于FPGA的DDR3SDRAM控制器設計及實現簡介資料,講解的還不錯,感興趣的可以下載看看…
    發表于 07-30 09:05 ?7次下載
    基于FPGA的<b class='flag-5'>DDR</b>3SDRAM控制器設計及實現<b class='flag-5'>簡介</b>

    FPGA和USB3.0通信-USB3.0 PHY簡介

    實現的情況)才可以,所以目前使用USB3.0時,搭檔FPGA的最優解就是外置USB3.0 PHY片。 USB3.0 PHY簡介 首先我們需要了解PHY具體完成哪些工作以及我利用FPGA
    的頭像 發表于 11-09 09:36 ?7646次閱讀
    FPGA和USB3.0通信-USB3.0 <b class='flag-5'>PHY</b><b class='flag-5'>簡介</b>

    使用DFI的DDR-PHY互操作性

    DDR PHY 接口 (DFI) 用于包括智能手機在內的多種消費電子設備。DFI 是一種接口協議,用于定義在 DRAM 設備之間以及 MC(微控制器)和 PHY 之間傳輸控制信息和數據所需的信號
    的頭像 發表于 05-26 15:27 ?5260次閱讀
    使用DFI的<b class='flag-5'>DDR-PHY</b>互操作性

    DDR phy內存控制器的作用是什么?

    隨著 DFI MC-PHY 接口規范的推進,事情正朝著正確的方向發展。對于不熟悉 DFI 的人來說,這是一個行業標準,它定義了任何通用 MC 和 PHY 之間的接口信號和協議。
    的頭像 發表于 03-19 12:30 ?581次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>