<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

socket是什么以及socket的原理和內核實現

小林coding ? 來源:小白debug ? 2023-06-26 14:14 ? 次閱讀

我相信大家剛開始學socket的時候,都跟我一樣。

云里霧里的,對socket的概念很模糊。

這篇文章我打算從一個初學者的角度開始聊起,讓大家了解下我眼里的socket是什么以及socket的原理和內核實現。

socket的概念

故事要從一個插頭說起。

插頭與插座

當我將插頭插入插座,那看起來就像是將兩者連起來了。

風扇與電力系統建立"連接"

而插座的英文,又叫socket。

巧了,我們程序員網絡編程時也會用到一個叫socket的東西。

其實兩者非常相似。通過socket,我們可以與某臺機子建立"連接",建立"連接"的過程,就像是將插口插入插槽一樣。

大概概念是了解了,但我相信各位對socket其實還是很模糊。

我們從大家最熟悉的使用場景開始說起。

socket的使用場景

我們想要將數據從A電腦的某個進程發到B電腦的某個進程。

這時候我們需要選擇將數據發過去的方式,如果需要確保數據要能發給對方,那就選可靠的TCP協議,如果數據丟了也沒關系,看天意,那就選擇不可靠的UDP協議。

初學者毫無疑問,首選TCP。

TCP是什么

那這時候就需要用socket進行編程。

于是第一步就是創建個關于TCP的socket。就像下面這樣。

sock_fd=socket(AF_INET,SOCK_STREAM,IPPROTO_TCP);

這個方法會返回socket_fd,它是socket文件的句柄,是個數字,相當于socket的身份證號。

得到了socket_fd之后,對于服務端,就可以依次執行bind(),listen(),accept()方法,然后坐等客戶端的連接請求。

對于客戶端,得到socket_fd之后,你就可以執行connect()方法向服務端發起建立連接的請求,此時就會發生TCP三次握手。

689f3c92-13df-11ee-962d-dac502259ad0.gif

握手建立連接流程

連接建立完成后,客戶端可以執行send()方法發送消息,服務端可以執行recv()方法接收消息,反過來,服務器也可以執行send(),客戶端執行recv()方法。

到這里為止,就是我們大部分程序員最熟悉的使用場景。

socket的設計

現在,socket我們見過,也用過,但對大部分程序員來說,它是個黑盒。

那既然是黑盒,我們索性假設我們忘了socket。重新設計一個內核網絡傳輸功能。

網絡傳輸,從操作上來看,無非就是,發數據和遠端之間互相收發數據。也就是對應著寫數據讀數據。

讀寫收發

但顯然,事情沒那么簡單。

這里還有兩個問題。

第一個是,接收端和發送端可能不止一個,因此我們需要一些信息做下區分,這個大家肯定很熟悉,可以用IP和端口。IP用來定位是哪臺電腦,端口用來定位是這臺電腦上的哪個進程。

第二個是,發送端和接收端的傳輸方式有很多區別,可以是可靠的TCP協議,也可以是不可靠的UDP協議,甚至還需要支持基于icmp協議的ping命令。

sock是什么

寫過代碼的都知道,為了支持這些功能,我們需要定義一個數據結構去支持這些功能。

這個數據結構,叫sock。

為了解決上面的第一個問題,我們可以在sock里加入IP和端口字段。

68d34a28-13df-11ee-962d-dac502259ad0.png

sock加入IP和端口字段

而第二個問題,我們會發現這些協議雖然各不相同,但還是有一些功能相似的地方,比如收發數據時的一些邏輯完全可以復用。按面向對象編程的思想,我們可以將不同的協議當成是不同的對象類(或結構體),將公共的部分提取出來,通過"繼承"的方式,復用功能。

基于各種sock實現網絡傳輸功能

于是,我們將功能重新劃分下,定義了一些數據結構。

68df6f60-13df-11ee-962d-dac502259ad0.png

繼承sock的各類sock

sock是最基礎的結構,維護一些任何協議都有可能會用到的收發數據緩沖區。

inet_sock特指用了網絡傳輸功能的sock,在sock的基礎上還加入了TTL,端口,IP地址這些跟網絡傳輸相關的字段信息。說到這里大家就懵了,難道還有不是用網絡傳輸的?有,比如Unix domain socket,用于本機進程之間的通信,直接讀寫文件,不需要經過網絡協議棧。這是個非常有用的東西,我以后一定講講(畫餅)。

inet_connection_sock是指面向連接的sock,在inet_sock的基礎上加入面向連接的協議里相關字段,比如accept隊列,數據包分片大小,握手失敗重試次數等。雖然我們現在提到面向連接的協議就是指TCP,但設計上linux需要支持擴展其他面向連接的新協議,

tcp_sock就是正兒八經的tcp協議專用的sock結構了,在inet_connection_sock基礎上還加入了tcp特有的滑動窗口、擁塞避免等功能。同樣udp協議也會有一個專用的數據結構,叫udp_sock。

好了,現在有了這套數據結構,我們將它們跟硬件網卡對接一下,就實現了網絡傳輸的功能。

提供socket層

可以想象得到,這里面的代碼肯定非常復雜,同時還操作了網卡硬件,需要比較高的操作系統權限,再考慮到性能和安全,于是決定將它放在操作系統內核里。

既然網絡傳輸功能做在內核里,那用戶空間的應用程序想要用這部分功能的話,該怎么辦呢?

這個好辦,本著不重復造輪子的原則,我們將這部分功能抽象成一個個簡單的接口。以后別人只需要調用這些接口,就可以驅動我們寫好的這一大堆復雜的數據結構去發送數據。

那么問題來了,怎么樣將這部分功能暴露出去呢?讓其他程序員更方便的使用呢?

既然跟遠端服務端進程收發數據可以抽象為“讀和寫”,操作文件也可以抽象為"讀和寫",正好有句話叫,"linux里一切皆是文件",那我們索性,將內核的sock封裝成文件就好了。創建sock的同時也創建一個文件,文件有個句柄fd,說白了就是個文件系統里的身份證號碼,通過它可以唯一確定是哪個sock。

這個文件句柄fd其實就是sock_fd = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP)里的sock_fd。

將句柄暴露給用戶,之后用戶就可以像操作文件句柄那樣去操作這個sock句柄。在用戶空間里操作這個句柄,文件系統就會將操作指向內核sock結構。

是的,操作這個特殊的文件就相當于操作內核里對應的sock。

68f90786-13df-11ee-962d-dac502259ad0.png

通過文件找到sock

有了sock_fd句柄之后,我們就需要提供一些接口方法,讓用戶更方便的實現特定的網絡編程功能。這些接口,我們列了一下,發現需要有send(),recv(),bind(),listen(),connect()這些。到這里,我們的內核網絡傳輸功能就算設計完成了。

現在是不是眼熟了,上面這些接口方法其實就是socket提供出來的接口。

所以說,socket其實就是個代碼庫 or 接口層,它介于內核和應用程序之間,提供了一些高度封裝過的接口,讓我們去使用內核網絡傳輸功能。

690a4046-13df-11ee-962d-dac502259ad0.png

基于sock實現網絡傳輸功能

到這里,我們應該明白了。我們平時寫的應用程序里代碼里雖然用了socket實現了收發數據包的功能,但其實真正執行網絡通信功能的,不是應用程序,而是linux內核。相當于應用程序通過socket提供的接口,將網絡傳輸的這部分工作外包給了linux內核。

這聽起來像不像我們最熟悉的前后端分離的服務架構,雖然這么說不太嚴謹,但看上去linux就像是被分成了應用程序和內核兩個服務。內核就像是后端,暴露了好多個api接口,其中一類就是socket的send()和recv()這些方法。應用程序就像是前端,負責調用內核提供的接口來實現想要的功能。

692b0326-13df-11ee-962d-dac502259ad0.png

進程通過socket調用內核功能

看到這里,我擔心大家會有點混亂,來做個小的總結。

在操作系統內核空間里,實現網絡傳輸功能的結構是sock,基于不同的協議和應用場景,會被泛化為各種類型的xx_sock,它們結合硬件,共同實現了網絡傳輸功能。為了將這部分功能暴露給用戶空間的應用程序使用,于是引入了socket層,同時將sock嵌入到文件系統的框架里,sock就變成了一個特殊的文件,用戶就可以在用戶空間使用文件句柄,也就是socket_fd來操作內核sock的網絡傳輸能力。

這個socket_fd是一個int類型的數字?,F在回去看socket的中文翻譯,套接字,將它理解為一用于連的數,是不是就覺得特別合理了。

網絡分層與基于sock實現網絡傳輸功能

socket如何實現網絡通信

上面關于怎么實現網絡通信功能這一塊一筆帶過了。

現在我們來聊聊。

這套sock的結構其實非常復雜。我們以最常用的TCP協議為例,簡單了解下它是怎么實現網絡傳輸功能的。

我將它分為兩階段,分別是建立連接數據傳輸。

建立連接

對于TCP,要傳數據,就得先在客戶端和服務端中間建立連接。

在客戶端,代碼執行socket提供的connect(sockfd, "ip:port")方法時,會通過sockfd句柄找到對應的文件,再根據文件里的信息指向內核的sock結構。通過這個sock結構主動發起三次握手。

69592102-13df-11ee-962d-dac502259ad0.png

TCP三次握手

在服務端握手次數還沒達到"三次"的連接,叫半連接,完成好三次握手的連接,叫全連接。它們分別會用半連接隊列全連接隊列來存放,這兩個隊列會在你執行listen()方法的時候創建好。當服務端執行accept()方法時,就會從全連接隊列里拿出一條全連接。

69733024-13df-11ee-962d-dac502259ad0.png

半連接隊列和全連接隊列

至此,連接就算準備好了,之后,就可以開始傳輸數據。

雖然都叫隊列,但半連接隊列其實是個hash表,而全連接隊列其實是個鏈表。

那么問題來了,為什么半連接隊列要設計成哈希表而全連接隊列是個鏈表?這個在我在我之前寫的《沒有accept,能建立TCP連接嗎?》已經提到過,不再重復。

數據傳輸

為了實現發送和接收數據的功能,sock結構體里帶了一個發送緩沖區和一個接收緩沖區,說是緩沖區,但其實就是個鏈表,上面掛著一個個準備要發送或接收的數據。

當應用執行send()方法發送數據時,同樣也會通過sock_fd句柄找到對應的文件,根據文件指向的sock結構,找到這個sock結構里帶的發送緩沖區,將數據會放到發送緩沖區,然后結束流程,內核看心情決定什么時候將這份數據發送出去。

接收數據流程也類似,當數據送到linux內核后,數據不是立馬給到應用程序的,而是先放在接收緩沖區中,數據靜靜躺著,卑微的等待應用程序什么時候執行recv()方法來拿一下。就像我的文章,躺在你的推文列表里,卑微的等一個點贊關注轉發三連。懂?

698cd60a-13df-11ee-962d-dac502259ad0.png

sock的發送和接收緩沖區

IP和端口其實不在sock下,而在inet_sock下,上面這么畫只是為了簡化。。。

那么問題來了,發送數據是應用程序主動發起,這個大家都沒問題。

那接收數據呢?數據從遠端發過來了,怎么通知并給到應用程序呢?

這就需要用到等待隊列。

699b0ef0-13df-11ee-962d-dac502259ad0.png

sock內的等待隊列

當你的應用進程執行recv()方法嘗試獲?。ㄗ枞麍鼍跋拢┙邮站彌_區的數據時。

?如果有數據,那正好,取走就好了。這點沒啥疑問。

?但如果沒數據,就會將自己的進程信息注冊到這個sock用的等待隊列里,然后進程休眠。如果這時候有數據從遠端發過來了,數據進入到接收緩沖區時,內核就會取出sock的等待隊列里的進程,喚醒進程來取數據。

69abf06c-13df-11ee-962d-dac502259ad0.png

recv時無數據進程進入等待隊列

有時候,你會看到多個進程通過fork的方式,listen了同一個socket_fd。在內核,它們都是同一個sock,多個進程執行listen()之后,都嗷嗷等待連接進來,所以都會將自身的進程信息注冊到這個socket_fd對應的內核sock的等待隊列中。如果這時真來了一個連接,是該喚醒等待隊列里的哪個進程來接收連接呢?這個問題的答案比較有趣。

?在linux 2.6以前,會喚醒等待隊列里的所有進程。但最后其實只有一個進程會處理這個連接請求,其他進程又重新進入休眠,這些被喚醒了又無事可做最后只能重新回去休眠的進程會消耗一定的資源。就好像你在廣東的街頭,想問路,叫一聲靚仔,幾十個人同時回頭,但你其實只需要其中一個靚仔告訴你路該怎么走。你這種一不小心動這靚仔的場景,在計算機領域中,就叫驚群效應。

?在linux 2.6之后,只會喚醒等待隊列里的其中一個進程。是的,socket監聽的驚群效應問題被修復了。

69c78278-13df-11ee-962d-dac502259ad0.png

驚群效應

看到這里,問題又來了。

服務端 listen 的時候,那么多數據到一個 socket 怎么區分多個客戶端的?

以TCP為例,服務端執行listen方法后,會等待客戶端發送數據來??蛻舳税l來的數據包上會有源IP地址和端口,以及目的IP地址和端口,這四個元素構成一個四元組,可以用于唯一標記一個客戶端。

其實說四元組并不嚴謹,因為過程中還有很多其他信息,也可以說是五元組。。。但大概理解就好,就這樣吧。。。

69d75554-13df-11ee-962d-dac502259ad0.png

四元組

服務端會創建一個新的內核sock,并用四元組生成一個hash key,將它放入到一個hash表中。

69e8f1ce-13df-11ee-962d-dac502259ad0.png

四元組映射成hash鍵

下次再有消息進來的時候,通過消息自帶的四元組生成hash key再到這個hash表里重新取出對應的sock就好了。所以說服務端是通過四元組來區分多個客戶端的。

6a00aaa8-13df-11ee-962d-dac502259ad0.png

多個hash_key對應多個客戶端

sock怎么實現"繼承"

最后遺留一個問題。

大家都知道linux內核是C語言實現的,而C語言沒有類也沒有繼承的特性,是怎么做到"繼承"的效果的呢?

在C語言里,結構體里的內存是連續的,將要繼承的"父類",放到結構體的第一位,就像下面這樣。

structtcp_sock{
/*inet_connection_sockhastobethefirstmemberoftcp_sock*/
structinet_connection_sockinet_conn;
//其他字段
}

structinet_connection_sock{
/*inet_sockhastobethefirstmember!*/
structinet_sockicsk_inet;
//其他字段
}

然后我們就可以通過結構體名的長度來強行截取內存,這樣就能轉換結構體,從而實現類似"繼承"的效果。

//sock轉為tcp_sock
staticinlinestructtcp_sock*tcp_sk(conststructsock*sk)
{
return(structtcp_sock*)sk;
}
6a0bebc0-13df-11ee-962d-dac502259ad0.png

內存布局

總結

?socket中文套接字,我理解為一用于連的數。并不一定準確,歡迎評論。

? sock在內核,socket_fd在用戶空間,socket層介于內核和用戶空間之間。

?在操作系統內核空間里,實現網絡傳輸功能的結構是sock,基于不同的協議和應用場景,會被泛化為各種類型的xx_sock,它們結合硬件,共同實現了網絡傳輸功能。為了將這部分功能暴露給用戶空間的應用程序使用,于是引入了socket層,同時將sock嵌入到文件系統的框架里,sock就變成了一個特殊的文件,用戶就可以在用戶空間使用文件句柄,也就是socket_fd來操作內核sock的網絡傳輸能力。

?服務端可以通過四元組來區分多個客戶端。

?內核通過c語言"結構體里的內存是連續的"這一特點實現了類似繼承的效果。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Socket
    +關注

    關注

    0

    文章

    178

    瀏覽量

    34476
  • TCP協議
    +關注

    關注

    1

    文章

    83

    瀏覽量

    12013
  • UDP通信
    +關注

    關注

    0

    文章

    21

    瀏覽量

    1849

原文標題:socket 到底是什么?

文章出處:【微信號:小林coding,微信公眾號:小林coding】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    鴻蒙開發實戰:【網絡管理-Socket連接】

    Socket在網絡通信方面的應用,展示了Socket在兩端設備的連接驗證、聊天通信方面的應用。
    的頭像 發表于 03-19 22:04 ?477次閱讀
    鴻蒙開發實戰:【網絡管理-<b class='flag-5'>Socket</b>連接】

    求助,請問使用AT_SOCKET是否可以使用WEBNET組件實現網頁服務器?

    在AT_SOCKET文檔中看到這樣一段話: 從 AT 組件的 at/at_socket/at_socket.h 中可以看到 AT 組件實現的 sal 的一部分函數,從這些函數命令也
    發表于 02-19 06:36

    HarmonyOS 網絡管理開發 —Socket 連接

    簡介 Socket 連接主要是通過 Socket 進行數據傳輸,支持 TCP/UDP/TLS 協議。 基本概念 ? ● Socket:套接字,就是對網絡中不同主機上的應用進程之間進行雙向通信的端點
    的頭像 發表于 02-18 09:20 ?605次閱讀

    什么是Socket連接?Socket的工作原理 它與TCP連接有什么關系?

    什么是Socket連接?Socket的工作原理 它與TCP連接有什么關系? Socket連接是一種網絡連接,用于在計算機網絡中的兩個節點之間傳輸數據。它是一種全雙工、可靠的通信方法,可以實現
    的頭像 發表于 01-22 16:10 ?747次閱讀

    物聯網LWIP之socket編程

    Socket的位置,作為用戶層與其他層的交互媒介。LWIP實現Socket需要操作系統的幫助,如下圖所示。二,Socket編程的基礎知識1.大端模式,小端模式(1)大端模式
    的頭像 發表于 01-18 08:00 ?688次閱讀
    物聯網LWIP之<b class='flag-5'>socket</b>編程

    常見的socket三種類型

    字(Datagram Socket)和原始套接字(Raw Socket)。 一、流套接字(Stream Socket): 流套接字是最常用的一種Socket類型。它基于TCP協議(傳輸
    的頭像 發表于 12-08 11:18 ?1899次閱讀

    提高性能的 socket 選項

    在開發 socket 應用程序時,首要任務通常是確??煽啃圆M足一些特定的需求。利用本文中給出的 4 個提示,您就可以從頭開始為實現最佳性能來設計并開發 socket 程序。本文內容包括對于
    的頭像 發表于 11-13 11:02 ?331次閱讀

    socket、端口、進程的關系

    特定的TCP端口。 而 socket 呢,是網絡編程中的概念,對TCP/IP協議進行了抽象和實現,并為應用層提供接口。這里的應用A,可以是FTP應用,它屬于用戶進程,通過socket內核
    的頭像 發表于 11-10 15:02 ?360次閱讀
    <b class='flag-5'>socket</b>、端口、進程的關系

    Socket 網絡編程框架介紹

    Socket 網絡編程框架 Socket(套接字)是一個網絡編程概念,描述了一個通信端點(Endpoint),用于建立網絡連接(Connection)并傳輸數據。 Linux Kernel 提供
    的頭像 發表于 11-09 14:19 ?445次閱讀
    <b class='flag-5'>Socket</b> 網絡編程框架介紹

    Socket緩存如何影響TCP的性能

    一直以來我們都知道socket的緩存會對tcp性能產生影響,也有無數文章告訴我們應該調大socke緩存。但是究竟調多大?什么時候調?有哪些手段調?具體影響究竟如何?這些問題似乎也沒有人真正說明
    的頭像 發表于 11-09 10:13 ?337次閱讀

    如何提高TCP Socket讀寫操作的性能

    一、引言 1.1、TCP Socket在網絡通信中的重要性 TCP Socket在網絡通信中的重要性體現在其提供了可靠的數據傳輸、連接性、多路復用等特性,是實現各種網絡應用的基礎,同時具有廣泛
    的頭像 發表于 11-08 16:45 ?471次閱讀

    C#編寫socket客戶端案例

    C#編寫socketDemo,socket做服務器和做客戶端例子
    發表于 10-25 15:10 ?0次下載

    FreeRTOS內核實現與應用開發實戰指南

    本書是野火嵌入式教學叢書“RTOS 內核實現與應用開發實戰指南的”FreeRTOS 版本,其中機械工業出版社出版的《RT-Thread 內核實現與應用開發實戰指南—基于 STM32》是該書的姐妹篇
    發表于 09-28 08:05

    基于MM32F3270以太網Client_Socket使用

    基于MM32F3270以太網Client_Socket使用
    的頭像 發表于 09-27 15:37 ?398次閱讀
    基于MM32F3270以太網Client_<b class='flag-5'>Socket</b>使用

    wiznet創建socket失敗的原因?

    每次創建socket時,總是要報socket(0) is not closed(0x22)., 持續幾次后才創建成功,而且我在初始化時在wiz_socket_init中增加了關閉每個socke
    發表于 09-03 11:02
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>