<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

page struct的三種存放方式

隨著硬件能力的提升，系統內存容量變得越來越大。尤其是在服務器上，過T級別的內存容量也已經不罕見了。

如此海量內存給內核帶來了很多挑戰，其中之一就是page struct存放在哪里。

page struct的三種存放方式

在內核中，我們將物理內存按照頁大小進行管理。這樣每個頁就對應一個page struct作為這個頁的管理數據結構。

隨著內存容量的增加，相對應的page struct也就增加。而這部分內存和其他的內存略有不同，因為這部分內存不能給到頁分配器。也就是必須在系統能夠正常運行起來之前就分配好。

在內核中我們可以看到，為了應對這樣的變化進化出了幾個不同的版本。有幸的是，這部分內容我們現在還能在代碼中直接看到，因為這個實現是通過內核配置來區分的。我們通過查找_pfn_to_page的定義就能發現一下幾種memory model：

CONFIG_FLATMEM

CONFIG_SPARSEMEM

CONFIGSPARSEMEMVMEMMAP

接下來讓小編給各位看官一一道來。

1) FLATMEM

在這種情況下，宏_pfn_to_page的定義是：

#define__pfn_to_page(pfn)(mem_map+((pfn)-ARCH_PFN_OFFSET))

而這個mem_map的定義是

structpage*mem_map;

所以在這種情況下，page struct就是一個大數組，所有的人都按照自己的物理地址有序得挨著。

2) SPARSEMEM

雖然第一種方式非常簡單直觀，但是有幾個非常大的缺點：

內存如果有空洞，那么中間可能會有巨大的page struct空間浪費

所有的page struct內存都在一個NUMA節點上，會耗盡某一個節點內存，甚至是分配失敗

且會產生夸NUMA訪問導致性能下降

所以第二種方式就是將內存按照一定粒度，如128M，劃分了section，每個section中有個成員指定了對應的page struct的存儲空間。

這樣就解決了上述的幾個問題：

如果有空洞，那么對應的 page struct就不會占用空間

每個section對應的page struct是屬于本地NUMA的

怎么樣，是不是覺得很完美。這一部分具體的實現可以可以看函數sparse_init()函數。

有了這個基礎知識，我們再來看這種情況下_pfn_to_page的定義：

#define __pfn_to_page(pfn) ({ unsigned long __pfn = (pfn); struct mem_section *__sec = __pfn_to_section(__pfn); __section_mem_map_addr(__sec) + __pfn; })

就是先找到pfn對應的section，然后在section中保存的地址上翻譯出對應pfn的page struct。

既然講到了這里，我們就要對sparsemem中重要的組成部分mem_section多說兩句。

先來一張mem_section的整體圖解：

這是一個 NRSECTIONROOTS x SECTIONSPERROOT的二維數組。其中每一個成員就代表了我們剛才提到的128M內存。

當然最開始它不是這個樣子的。

其實最開始這個數組是一個靜態數組。很明顯這么做帶來的問題是這個數組定義太大太小都不合適。所以后來引進了CONFIGSPARSEMEMEXTREME編譯選項，當設置為y時，這個數組就變成了動態的。

如果上面這個算作是空間上的限制的話，那么接下來就是一個時間上的限制了。

在系統初始化時，每個mem_section都要和相應的內存空間關聯。在老版本上，這個步驟通過對整個數組接待完成。原來的版本上問題不大，因為整個數組的大小還沒有很大。但隨著內存容量的增加，這個數值就變得對系統有影響了。如果系統上確實有這么多內存，那么確實需要初始化也就忍了。但是在內存較小的系統上，哪怕沒有這么多內存，還是要挨個初始化，那就浪費了太多的時間。

commit c4e1be9ec1130fff4d691cdc0e0f9d666009f9aeAuthor: Dave Hansen Date: Thu Jul 6 15:36:44 2017 -0700 mm, sparsemem: break out of loops earl

Dave在這個提交中增加了對系統最大存在內存的跟蹤，來減少不必要的初始化時間。

瞧，內核代碼一開始其實也沒有這么高大上不是。

3) SPARSEMEM_VMEMMAP

最后要講的，也是當前x86系統默認配置的內存模型是SPARSEMEM_VMEMMAP。那為什么要引入這么一個新的模型呢？那自然是sparsemem依然有不足。

細心的朋友可能已經注意到了，前兩種內存模型在做pfn到page struct轉換是有著一些些的差異。為了看得清，我們把這兩個定義再拿過來對比一下：

先看看FLATMEM時的定義：

#define__pfn_to_page(pfn)(mem_map+((pfn)-ARCH_PFN_OFFSET))

再來看看使用SPASEMEM后的定義：

#define __pfn_to_page(pfn) ({ unsigned long __pfn = (pfn); struct mem_section *__sec = __pfn_to_section(__pfn); __section_mem_map_addr(__sec) + __pfn; })

更改后，需要先找到section，然后再從section->memmap的內容中換算出page的地址。

不僅計算的內容多了，更重要的是還有一次訪問內存的操作

可以想象，訪問內存和單純計算之間的速度差異那是巨大的差距。

既然產生了這樣的問題，那有沒有辦法解決呢？其實說來簡單，內核開發者利用了我們常見的一個內存單元來解決這個問題。

頁表

是不是很簡單粗暴？如果我們能夠通過某種方式將page struct線性映射到頁表，這樣我們不就能又通過簡單的計算來換算物理地址和page struct了么？

內核開發者就是這么做的，我們先來看一眼最后那簡潔的代碼：

#define__pfn_to_page(pfn)(vmemmap+(pfn))

經過內核開發這的努力，物理地址到page struct的轉換又變成如此的簡潔。不需要訪問內存，所以速度的問題得到了解決。

但是天下沒有免費的午餐，世界哪有這么美好，魚和熊掌可以兼得的情況或許只有在夢境之中。為了達到如此簡潔的轉化，我們是要付出代價的。為了實現速度上的提升，我們付出了空間的代價。

至此引出了計算機界一個經典的話題：

時間和空間的轉換

話不多說，也不矯情了，我們來看看內核中實現的流程。

既然是利用了頁表進行轉換，那么自然是要構建頁表在做這樣的映射。這個步驟主要由函數vmemmap_populate()來完成，其中還區分了有沒有大頁的情況。我們以普通頁的映射為例，看看這個實現。

int __meminit vmemmap_populate_basepages(unsigned long start, unsigned long end, int node){ unsigned long addr = start; pgd_t *pgd; p4d_t *p4d; pud_t *pud; pmd_t *pmd; pte_t *pte; for (; addr < end; addr += PAGE_SIZE) { pgd = vmemmap_pgd_populate(addr, node); if (!pgd) return -ENOMEM; p4d = vmemmap_p4d_populate(pgd, addr, node); if (!p4d) return -ENOMEM; pud = vmemmap_pud_populate(p4d, addr, node); if (!pud) return -ENOMEM; pmd = vmemmap_pmd_populate(pud, addr, node); if (!pmd) return -ENOMEM; pte = vmemmap_pte_populate(pmd, addr, node); if (!pte) return -ENOMEM; vmemmap_verify(pte, node, addr, addr + PAGE_SIZE); } return 0;}

內核代碼的優美之處就在于，你可能不一定看懂了所有細節，但是從優美的結構上能猜到究竟做了些什么。上面這段代碼的工作就是對每一個頁，按照層級去填充頁表內容。其中具體的細節就不在這里展開了，相信有興趣的同學會自行去探索。

那這么做的代價究竟是多少呢？

以x86為例，每個section是128M，那么每個section的page struct正好是2M，也就是一個大頁。

(128M / 4K) * 64 = (128 * (1 < 20) / (1 < 12)) * 64 = 2M

假如使用大頁做頁表映射，那么每64G才用掉一個4K頁表做映射。

128M * 512 = 64G

所以在使用大頁映射的情況下，這個損耗的級別在百萬分之一。還是能夠容忍的。

好了，我們終于沿著內核發展的歷史重走了一遍安放page struct之路。相信大家在這一路上領略了代碼演進的樂趣，也會對以后自己代碼的設計有了更深的思考。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

服務器

服務器

+關注

關注
12

文章
8294

瀏覽量
83209
數據結構

數據結構

+關注

關注
3

文章
564

瀏覽量
39952
PAGE

PAGE

+關注

關注
0

文章
11

瀏覽量
20124

原文標題：page結構體，何處安放你的靈魂？

文章出處：【微信號：LinuxDev，微信公眾號：Linux閱碼場】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

visual programmer打開的文件格式有.s19, .hex , .sx 三種文件格式有什么區別嗎？

st visual programmer打開的文件格式有.s19, .hex,.sx三種文件格式有什么區別嗎？是不是不同芯片的文件格式不一樣，還是所有的芯片都可以使用這三種文件格式？

發表于 04-28 08:56

運放的三種應用

運放在電路中主要存在三種應用，放大器，濾波器，振蕩器。再這三種應用電路中，運放的兩大特點虛短虛斷仍然成立嗎？在阻尼振蕩器中，工作過程是否按照我描述的這樣，在反相輸入端加一個近似鋸齒波的電流源，正半

發表于 01-26 16:18

介紹三種建模方式

據量大，而是指樣本的完備性。還有就是大數據或者AI被專業學者或者行業工程師所詬病的就是，純粹的數據驅動搞不出所以然出來，需要領域知識（即Domain Knowledge）的協助。此外，還有第三種建模方式就是混合驅動，即基礎物理模型加上數據驅動的

的頭像

發表于 01-23 10:48 ?744次閱讀

嵌入式Linux開發的三種方式

嵌入式Linux開發主要有三種方式：裸機開發、SDK開發和驅動開發。

的頭像

發表于 01-22 14:22 ?401次閱讀

分布式鎖的三種實現方式

分布式鎖的三種實現方式? 分布式鎖是在分布式系統中用于實現對共享資源進行訪問控制的一種機制。分布式鎖的實現需要考慮高可用性、高性能和正確性等方面的問題。在實際應用中，有多種不同的方式可以實現分布式

的頭像

發表于 12-28 10:01 ?446次閱讀

三極管的偏置電壓和三種連接方式

電子發燒友網站提供《三極管的偏置電壓和三種連接方式.zip》資料免費下載

發表于 11-20 14:44 ?0次下載

三極管的偏置電壓和<b class='flag-5'>三種</b>連接<b class='flag-5'>方式</b>

線纜怎么存放更好

線纜存放的正確性對于線纜的保護和安全使用具有至關重要的影響。以下是線纜存放正確的重要性：防止物理損傷：線纜在存放過程中可能會受到擠壓、摩擦、撞擊等物理損傷，導致線纜變形、破損或斷裂。正確的存

發表于 11-14 11:16 ?337次閱讀

地址映像有哪三種方式

為Cache地址，這個變換過程叫作地址變換。地址映像方式通常采用直接映像、全相聯映像、組相聯映像三種： 1-直接映像每個主存地址映像到Cache中的一個指定地址的方式，稱為直接映像方式

發表于 10-31 11:39 ?734次閱讀

快充的三種實現方式是什么？快充對電池的損害程度大嗎？

快充的三種實現方式是什么？快充對電池的損害程度大嗎？快充技術在近年來隨著移動設備的普及而得到廣泛應用。傳統的充電方式需要幾個小時才能完成，但是快充技術大大縮短了充電時間。這種技術被廣泛應用于手機

發表于 10-22 15:08 ?818次閱讀

請問如何用單片機讓三極管出現三種不同的電平狀態？

如何用單片機讓三極管出現三種不同的電平狀態？

發表于 10-10 06:56

非隔離型開關電源的三種工作方式

非隔離型開關電源一般有三種基本工作方式，降壓型、升壓型、極性反轉型三種，而其他的都是這三種形式轉換而來，例如反激式、正激式、推挽式、半橋式、全橋式。

發表于 09-24 11:28 ?1.2w次閱讀

stm32在不同數據在ram存放方式？

比如8位和16位數據32位數據，在ram中怎么存放的

發表于 09-21 06:37

非隔離型開關電源的三種工作方式

非隔離型開關電源的三種工作方式

發表于 09-18 15:31 ?608次閱讀

降低運動控制應用中可聞噪聲的三種出色方式

降低運動控制應用中可聞噪聲的三種出色方式

發表于 08-24 13:37 ?339次閱讀

淺談伺服電機的三種控制方式

伺服電機控制方式有脈沖、模擬量和通訊控制這三種，在不同的應用場景下，該如何確定選擇伺服電機控制方式？

發表于 07-26 09:22 ?1215次閱讀

Linux閱碼場
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot EtherCAT原理介紹及應用實例
Hot btrfs:Linux中也終于有了一個可以和ZFS相媲美的文件系統

New 系統中的latency是如何產生的
New PCIe配置優化：提升系統性能的關鍵步驟

精選推薦
更多

文章

資料

帖子

EMC大揭秘 PCB設計必備指南

凡億PCB
1天前

584 閱讀

華為PCBA檢查規范設計總結

凡億PCB
1天前

685 閱讀

第一批人機戀的“AI前任”已經死了

腦極體
1天前

763 閱讀

手把手教你在orcad中設置CIS元器件數據庫，提高工作效率

硬件花園
1天前

922 閱讀

鴻蒙ArkTS聲明式開發：跨平臺支持列表【組件內容填充方式】

jf_46214456
2天前

533 閱讀

智能汽車安全氣囊控制系統的設計

abdkjshd
108 KB

10積分

53下載

fix_docker_ip固定docker容器的IP

五斤麻辣油
6.62 MB

免費

0下載

GitHub VSC在瀏覽器中使用VS Code操作GitHub倉庫

顏立歆
0.23 MB

免費

0下載

inaka-sheldon Erlang拼寫檢查器

劉豐標
1.45 MB

免費

0下載

Aria2GUI集成aria2c的可視化下載客戶端

王斌
2.91 MB

2積分

1下載

無線鼠標主板，可以自己照著做嗎？

angel725
1天前

254 閱讀

【Vision Board創客營連載體驗】基于Vision Board的垃圾分類

大菠蘿Alpha
1天前

109 閱讀

【Vision Board創客營連載體驗】使用 Vision Board 做一個 UVC Camera

ouxiaolong
2天前

108 閱讀

【Vision Board創客營連載體驗】TinyMaix進行手寫數字識別

ouxiaolong
2天前

436 閱讀

【Vision Board創客營連載體驗】RA8D1-Vision Board使用7寸屏設置為RGB666大端模式模式成功顯示攝像頭圖案

donatello1996
3天前

409 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看