<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

Linux讀寫鎖邏輯解析—Linux為何會引入讀寫鎖？

一、Linux為何會引入讀寫鎖？

除了mutex，在linux內核中，還有一個經常用到的睡眠鎖就是rw semaphore（后文簡稱為rwsem），它到底和mutex有什么不同呢？為何會有rw semaphore？無他，僅僅是為了增加內核的并發，從而增加性能而已。Mutex嚴格的限制只有一個thread可以進入臨界區，但是實際應用中，有些場景對共享資源的訪問可以嚴格區分讀和寫的，并且是讀多寫少，這時候，其實多個讀的thread同時進入臨界區是OK的，使用mutex則限制一個線程進入臨界區，從而導致性能的下降。

本文會描述linux5.15.81中讀寫鎖的數據結構和邏輯過程。

二、如何抽象讀寫鎖的數據結構？

下圖可以抽象rwsem相關的數據結構：

一個rwsem對象需要記錄兩種數據：

1、讀寫鎖的狀態信息

2、和該讀寫鎖相關的任務信息

我們先看看讀寫鎖的狀態。讀寫鎖狀態字需要分別記錄讀鎖和寫鎖的狀態：由于多個reader可以同時處于臨界區，所以對于reader-owned的場景，讀鎖狀態變成了一個counter，來記錄臨界區內reader的數量，counter等于0表示讀鎖為空鎖狀態。對于writer，其行為和互斥鎖一致，因此其寫鎖狀態和mutex一樣，仍然使用一個bit表示。

和讀寫相關的任務有兩類，一類是已經持鎖的線程（即在臨界區的線程），另外一類是無法持鎖而需要等待的任務。對于writer持鎖情況，由于排他性，我們很清楚的知道是哪個task持鎖，那么一個task struct指針就足夠了記錄owner了。然而對于讀側可以多個reader進入臨界區，那么owner們需要組成一個隊列才可以記錄每一個臨界區的reader。

不過在實際的rwsem實現中，由于跟蹤owner們開銷比較大，因此也是用一個task struct指針指向其一。具體linux代碼是這樣處理的：reader進入的時候會設置owner task，但是離開讀臨界區并不會清除task指針。這樣，實際上對于讀，owner task應該表示該任務曾經擁有該鎖，并不表示是目前持鎖的owner task，也有可能已經離開臨界區，甚至該任務已經銷毀。

如果持鎖失敗，無法進入臨界區，我們有兩種選擇：

1、樂觀自旋

2、掛入等待隊列

兩種選擇各有優點和缺點，總結如下：

在5.15的內核中，只有在write持鎖路徑上有樂觀自旋的操作，reader路徑沒有，只有偷鎖的操作。當樂觀自旋失敗后就會掛入等待隊列，阻塞當前線程。（樂觀自旋功能有一個很有意思的發展過程，從開始支持writer的樂觀自旋，到支持全場景的樂觀自旋，然后又回到最初，有興趣可以查閱內核的patch了解詳情）

在了解了rwsem的基本概念之后，我們一起來看看struct rw_semaphore數據結構，其成員描述如下：

由于是sleep lock，我們需要把等待的任務掛入隊列。在內核中，struct rwsem_waiter用來抽象等待rwsem的任務，其成員描述如下：

三、Rwsem外部接口API為何？

Rwsem模塊的外部接口API如下：

四、嘗試獲取讀鎖

和down_read不一樣，down_read_trylock只是嘗試獲取讀鎖，如果成功，那么自然是好的，直接返回1，如果失敗，也不會阻塞，只是返回0就可以了。代碼主邏輯在__down_read_trylock函數中，如下：

A、tmp的初始值設定為RWSEM_UNLOCKED_VALUE（0值），因此第一次循環是為當前是空鎖而做的優化：如果當前的sem->count等于0，那么給sem->count賦值RWSEM_READER_BIAS，標記持鎖成功，然后設定owner返回1即可。

B、如果快速獲取空鎖不成功，這時候tmp已經賦值（等于sem->count），不再是0值了。通過對當前sem->count的值可以判斷是否是可以進入臨界區。持讀鎖失敗的情況包括：

如果判斷可以進入讀臨界區（臨界區僅有reader并且沒有writer等待的場景），那么重新進入循環，如果sem->count保持不變，那么可以持鎖成功，給進入臨界區的reader數目加一，并設置owner task和reader持鎖標記（non-spinnable比特保持不變）。如果這期間有其他線程插入修改了count值，那么需要再次判斷是否能持讀鎖，重復上面的循環。如果判斷不可以進入臨界區，退出循環，持鎖失敗。

五、獲取讀鎖

Reader獲取讀鎖的代碼主要在__down_read_common函數中，如下：

1、快速路徑

rwsem_read_trylock是快速路徑，代碼如下：

A、reader直接會給sem->count加RWSEM_READER_BIAS來增加讀臨界區的線程個數，當然這有可能失敗，那么就進入慢速路徑（需要回退錯誤增加讀臨界區線程數量）。如果恰好能夠進入臨界區，那么就直接設定owner返回即可。注意：這里*cntp保存了atomic add之后的新值。rwsem_down_read_slowpath會使用這個新值作為參數。

B、當reader的數量過多（以至于都溢出了）的時候，需要禁止樂觀自旋。

C、這里是持鎖成功的路徑。RWSEM_READ_FAILED_MASK上一節已經解釋，這里不再贅述。這里需要注意的是rwsem_set_reader_owned函數中flag的設定，由于reader進入臨界區，因此RWSEM_READER_OWNED也需要設定。RWSEM_RD_NONSPINNABLE標記保持不變。

在快速路徑中，有兩種常見的情況會持鎖成功：一種是空鎖，另外一種是沒有任何waiter等待的純reader并發。

2、慢速路徑

如果快速路徑持鎖失敗，那么進入慢速路徑。慢速路徑代碼比較長，我們分段解析。首先是防止等待隊列中waiter任務餓死的代碼：

如果當前的鎖被reader持有（至少有一個reader在臨界區），那么不再樂觀偷鎖而是直接進行掛等待隊列的操作。為何怎么做呢？因為需要在餓死waiter和reader吞吐量上進行平衡。一方面，連續的reader持續偷鎖的話會餓死等待隊列上的任務。另外，在喚醒路徑上，被喚醒的top reader會順便將隊列中的若干（不大于256個）reader也同時喚醒，以便增加rwsem的吞吐量。所以這里的reader直接掛入隊列，累計多個reader以便可以批量喚醒。

Reader偷鎖的場景主要發生在喚醒top waiter的過程中，這時候臨界區沒有線程，被喚醒的reader或者writer也沒有持鎖（writer需要被調度到CPU上執行之后才會試圖持鎖，高負載的場景下，鎖被偷的概率比較大，reader是喚醒后立刻持鎖，被偷的幾率小一點）。具體樂觀偷鎖（optimistic lock stealing）的代碼如下：

A、所謂偷鎖就是不樂觀自旋（要有排隊），不管先來后到，直接獲取鎖。允許偷鎖的場景是這樣的：臨界區沒有writer持鎖，也沒有設置handoff，正在喚醒top waiter的過程中，并且有任務在等待隊列的情況。這時候進入慢速路徑的reader可以先于top waiter喚醒之前把鎖偷走。需要特別說明的是：這時候reader counter已經加一，還是盡量讓reader偷鎖成功，否則還需要回退。

B、當前線程獲得了讀鎖，需要設置owner，畢竟它是臨界區的新客

C、如果偷鎖成功并且它是臨界區第一個reader，那么它還會把等待隊列中的reader都喚醒（前提是top waiter不是writer），帶領大家一起往前沖（這里會打破FIFO的順序，懲罰了隊列中的writer）。具體是通過rwsem_mark_wake來標記喚醒的reader，然后通過wake_up_q將reader喚醒并進入讀臨界區。為了減低對等待中的writer線程的影響，這時候對reader的并發是受限的，最多可以喚醒MAX_READERS_WAKEUP個reader。

如果偷鎖不成功，當前的reader還是需要進入阻塞狀態：

A、準備好掛入等待隊列的rwsem waiter數據，需要特別說明的是這里的timeout時間：目前手機平臺的HZ設置的是250，也就是說在觸發handoff機制之前waiter需要至少在隊列中等待一個tick（4ms）的時間。這里的timeout是指handoff timeout，為了防止偷鎖或者自旋導致等待隊列中的top waiter有一個長時間的持鎖延遲。在timeout時間內，樂觀偷鎖或者自旋可以順利進行，但是一旦超時就會設定handoff標記，樂觀偷鎖或者自旋被禁止，鎖的所有權需要遞交給等待隊列中的top waiter。

B、如果目前等待隊列為空，那么要做一些額外的處理。例如入隊之前肯定給安排上RWSEM_FLAG_WAITERS這個標記。

C、當然，在入隊之前還要垂死掙扎一下（等待隊列為空的時候邏輯簡單一些，不需要喚醒隊列上的wait），看看是不是當前有機可乘，如果是這樣，那么就順勢而為，直接持鎖成功，而且counter都已經準備好了，前面已經加一了。

D、等待隊列非空的時候，邏輯稍微負載一點。調用rwsem_add_waiter函數即可以把當前任務掛入等待隊列尾部。這時候也需要把之前武斷增加的counter給修正回來了（adjustment初始化為-RWSEM_READER_BIAS）。如果是第一個waiter，也順便設置了RWSEM_FLAG_WAITERS標記。

在當前線程進入阻塞之前，我們需要進行試圖持鎖的動作（上面是空隊列場景檢查，這里的邏輯稍微復雜一點，由于已經入隊，這里需要調用rwsem_mark_wake函數來完成阻塞后喚醒的動作），畢竟這時候可能恰好owner離開臨界區，變成空鎖。

A、如果這時候發現鎖的owner恰好都離開了臨界區，那么我們是需要執行喚醒top waiter操作的，喚醒之前需要清除禁止樂觀自旋的標記，畢竟目前臨界區沒有任何線程。

B、除了上面說的場景需要喚醒，在reader持鎖并且我們是隊列中的第一個waiter的時候，也需要喚醒的動作（喚醒自己）。

阻塞部分的代碼邏輯如下：

A、在rwsem_mark_wake函數中我們會喚醒reader并將其等待對象的task成員（waiter.task）設置為NULL。因此，這里如果發現waiter.task等于NULL，那么說明是該線程被正常喚醒，那么從阻塞狀態返回，持鎖成功。

B、如果在該線程阻塞的時候，有其他任務發送信號給該線程，那么就持鎖失敗退出。如果已經被喚醒，同時又收到信號，這時候需要首先完成喚醒，持鎖成功，然后在其他的合適點再處理該信號。當然，大部分的rwsem都是D狀態，也就不需要處理信號了。

C、進入阻塞狀態，讓調度器選擇next task

六、釋放讀鎖

釋放讀鎖的代碼邏輯主要在__up_read函數中，如下：

需要強調的是：這里僅僅是減去了讀臨界區的counter計數，并沒有清除owner中的task pointer。此外，當等待隊列有waiter并且沒有writer或者reader在臨界區的時候，我們會調用rwsem_wake來喚醒等待隊列的線程。因為臨界區已經沒有線程，所以需要清除nonspinable標記。喚醒的動作主要是通過rwsem_mark_wake和wake_up_q來完成的，wake_up_q比較簡單，我們就不贅述了，主要看看rwsem_mark_wake的邏輯。

我們首先給出wake type的解釋：

在RWSEM_WAKE_READERS場景中，多個reader被喚醒，并且當前很可能是空鎖狀態，為了防止writer搶鎖，因此會先讓top waiter持有讀鎖，然后慢慢處理后續。RWSEM_WAKE_READ_OWNED則沒有這個顧慮，因為喚醒者已經持有讀鎖。

在釋放讀鎖的場景中，rwsem_mark_wake使用的是RWSEM_WAKE_ANY參數，具體的代碼如下：

這段代碼是處理top waiter是writer的邏輯。這時候，如果wake type是RWSEM_WAKE_ANY，即不關心喚醒的是reader還是writer，只要喚醒等待隊列頭部的waiter就好。如果top waiter是writer，我們只需要將這個writer喚醒即可，不需要修改鎖的狀態，出隊等操作，這些都是在喚醒之后完成。如果wake type是其他兩種類型（都是喚醒reader的），那么就直接返回。也就是說在rwsem_mark_wake想要喚醒reader的場景中，如果top waiter是writer，那么將不會喚醒任何reader線程。如果top waiter是reader的話，那么基本上是需要喚醒一組reader了。

A、執行到這里，我們需要喚醒等待隊列頭部的若干reader線程去持鎖。由于writer有可能會在這個階段偷鎖，因此，這里我們會先讓top waiter（reader）持鎖，然后再慢慢去計算到底需要喚醒多少個reader并將其喚醒。如果當前線程已經持有了讀鎖（wake type的類型是RWSEM_WAKE_READ_OWNED），則不需要提前持鎖，直接越過這部分的邏輯即可。

B、如果的確發生了writer通過樂觀自旋偷鎖，那么我們需要檢查設置handoff的條件。如果reader被writer阻塞太久，那么我們設定handoff標記，要求rwsem的writer停止通過樂觀自旋偷鎖，將鎖的所有權轉交給top waiter（reader）

C、上面已經向rwsem的count增加reader計數，這里把owner也設定上（flag也同步安排，這里non-spinnable bit保持不變）。隨后top waiter的reader會喚醒若干隊列中的non top reader，但是它們都不配擁有名字。

讀鎖已經安排的妥妥的了，下面就是慢慢喚醒等待隊列的reader了。我們通過兩步來完成喚醒：

1、將等待隊列中的reader摘下放入到一個單獨的列表中（wlist），同時對reader進行計數。后續這個計數會寫入rwsem 的reader counte域。

2、對于wlist中的每一個waiter對象（reader任務），清除waiter->task并將它們放入wake_q以便稍后被喚醒。

我們先看第一輪計算喚醒reader個數的計數：

A、對于rwsem，其公平性是區分讀寫的。對于讀，如果top waiter是reader，那么所有的reader都可以進入臨界區，不管reader在隊列中的順序。對于writer，我們要確保其公平性，我們要按照writer在隊列中的順序依次持鎖。根據上面的原則，我們會略過隊列中的writer，將盡量多的reader喚醒并進入臨界區

B、喚醒數量不能大于256，否則會餓死writer

C、根據喚醒的reader數量計算count調整值

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

LINUX內核

LINUX內核

+關注

關注
1

文章
312

瀏覽量
21419
ARM架構

ARM架構

+關注

關注
14

文章
168

瀏覽量
36027
FIFO電路

FIFO電路

+關注

關注
1

文章
4

瀏覽量
4883
MSB

MSB

+關注

關注
0

文章
13

瀏覽量
8219

評論

相關推薦

Linux讀寫鎖邏輯解析—嘗試獲取寫鎖

Rwsem的count成員還有一些bit用來標記當前讀寫鎖狀態（waiter bit和handoff bit），也需要根據情況進行調整

的頭像

發表于 12-04 11:12 ?333次閱讀

<b class='flag-5'>Linux</b><b class='flag-5'>讀寫</b>鎖<b class='flag-5'>邏輯</b><b class='flag-5'>解析</b>—嘗試獲取寫鎖

Linux高級編程---互斥鎖

在Linux系統里，有很多鎖的應用，包括互斥鎖，文件鎖，讀寫鎖等等，信號量其實也應該是

發表于 01-13 10:07

每天進步一點點——Linux編程中的文件鎖之flock

。為了防止出現這種情況，Linux提供了flock(對整個文件加鎖)、fcntl(對整個文件區域加鎖)兩個函數來做進程間的文件同步。同時也可以使用信號量來完成所需的同步，但通常使用文件鎖會更好一些，因為

發表于 06-21 14:22

如何解決linux在讀寫SD卡過程中拔出SD卡系統會重啟的問題？

寫了一個測試應用，將SD卡的文件A讀出，寫入到SD卡的文件B，循環這個操作。在這個過程中插拔SD卡，系統容易出現重啟現象，想請教一下如何解決linux在讀寫SD卡過程中拔出SD卡系統會重啟的問題

發表于 06-05 23:27

在linux下實現事件，主要采用條件鎖的方式實現

在linux下實現事件，主要采用條件鎖的方式實現，源碼如下：首先是event.h文件，實現event類

發表于 07-04 08:11

降低 80% 的讀寫響應延遲！我們測評了 etcd 3.4 新特性（內含讀寫發展史）

的 expensive read（后文會介紹該概念）請求，這對 etcd 讀寫會造成巨大的壓力。更為嚴重的是，如果客戶端中存在失敗重試邏輯或客戶端數目較多，

發表于 09-23 15:09

Linux內核同步機制的自旋鎖原理是什么？

自旋鎖是專為防止多處理器并發而引入的一種鎖，它在內核中大量應用于中斷處理等部分(對于單處理器來說，防止中斷處理中的并發可簡單采用關閉中斷的方式，即在標志寄存器中關閉/打開中斷標志位，不需要自旋

發表于 03-31 08:06

Lock體系結構和讀寫鎖機制解析

中，如何實現ABC的順序打印問題，基本思路就是基于線程的等待通知機制，但是實現方式很多，上述只是其中一種方式。二、讀寫鎖機制1、基礎API簡介重入鎖的排它特性決定了性能會產生瓶頸，為了

發表于 01-05 17:53

嵌入式linux讀寫can簡單示例

嵌入式linux讀寫can簡單示例

發表于 11-04 07:01

如何對RK3399 Linux系統的磁盤進行讀寫測試呢

如何對RK3399 Linux系統的磁盤進行讀寫測試呢？

發表于 03-04 11:37

linux下使用IIC總線讀寫EEPROM的實現程序

1，本文給出了 linux 下使用 IIC 總線讀寫 EEPROM 的實現程序。 2 本文給出了在編程中遇到的幾種非常隱蔽的錯誤的解決方法。 3，本文的讀寫程序非常通用

發表于 01-06 11:05 ?17次下載

基于ARM和Linux的超高頻讀寫器設計

本文設計并實現了一種基于ARMS3C2410微處理器和Linux操作系統的超高頻讀寫器，主要內容有：（1）分析了射頻識別技術的發展歷程和前景，以嵌入式技術為研究背景，結合軟硬件開發平臺，給出

發表于 08-30 10:39 ?6次下載

嵌入式linux應用讀寫i2c示例

這里分享一個嵌入式linux讀寫24c02的i2c程序ioctl函數的使用:原型：struct ioctl(struct file *file,unsigned int cmd,unsigned

發表于 11-01 16:57 ?11次下載

嵌入式linux讀寫can收發簡單示例基于socket can

嵌入式linux讀寫can簡單示例

發表于 11-01 17:07 ?14次下載

嵌入式Linux磁盤（硬盤、SD卡）讀寫性能測試

，linux下命令dd使用指定的輸入和輸出塊大小來拷貝文件，它每次從輸入讀取指定大小的一個塊寫到獨立的輸出塊去，通過這種方法來測試讀寫速度。測試環境硬件：嵌入式ARM系統：Linux ...

發表于 11-02 09:21 ?9次下載

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
4小時前

398 閱讀

如何移植FFmpeg

ElfBoard
2天前

492 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

631 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

651 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

773 閱讀

磁盤陣列技術原理

陶瓷肥貓
1.79 MB

免費

0下載

PicHome素材庫搜索與展示工具

郭中
30.17 MB

免費

1下載

Solo Java開源博客系統

h1654155275.5916
9.18 MB

免費

3下載

UJCMS Java內容管理系統（cms）

楊勇
30.81 MB

免費

1下載

CXProvincesMapView中國省份地圖控件

莫聯雪
0.00 MB

免費

0下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
2天前

613 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
2天前

285 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
2天前

805 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
3天前

831 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
3天前

1320 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看