TCP 的那些事兒(上)
TCP是一個巨復(fù)雜的協(xié)議,因為他要解決很多問題,而這些問題又帶出了很多子問題和陰暗面。所以學(xué)習(xí)TCP本身是個比較痛苦的過程,但對于學(xué)習(xí)的過程卻能讓人有很多收獲。關(guān)于TCP這個協(xié)議的細(xì)節(jié),我還是推薦你去看W.Richard Stevens的《TCP/IP 詳解 卷1:協(xié)議》(當(dāng)然,你也可以去讀一下RFC793以及后面N多的RFC)。另外,本文我會使用英文術(shù)語,這樣方便你通過這些英文關(guān)鍵詞來查找相關(guān)的技術(shù)文檔。
之所以想寫這篇文章,目的有三個,
一個是想鍛煉一下自己是否可以用簡單的篇幅把這么復(fù)雜的TCP協(xié)議描清楚的能力。
另一個是覺得現(xiàn)在的好多程序員基本上不會認(rèn)認(rèn)真真地讀本書,喜歡快餐文化,所以,希望這篇快餐文章可以讓你對TCP這個古典技術(shù)有所了解,并能體會到軟件設(shè)計中的種種難處。并且你可以從中有一些軟件設(shè)計上的收獲。
最重要的希望這些基礎(chǔ)知識可以讓你搞清很多以前一些似是而非的東西,并且你能意識到基礎(chǔ)的重要。
所以,本文不會面面俱到,只是對TCP協(xié)議、算法和原理的科普。
我本來只想寫一個篇幅的文章的,但是TCP真TMD的復(fù)雜,比C++復(fù)雜多了,這30多年來,各種優(yōu)化變種爭論和修改。所以,寫著寫著就發(fā)現(xiàn)只有砍成兩篇。
上篇中,主要向你介紹TCP協(xié)議的定義和丟包時的重傳機制。
下篇中,重點介紹TCP的流迭、擁塞處理。
廢話少說,首先,我們需要知道TCP在網(wǎng)絡(luò)OSI的七層模型中的第四層——Transport層,IP在第三層——Network層,ARP在第二層——Data Link層,在第二層上的數(shù)據(jù),我們叫Frame,在第三層上的數(shù)據(jù)叫Packet,第四層的數(shù)據(jù)叫Segment。
首先,我們需要知道,我們程序的數(shù)據(jù)首先會打到TCP的Segment中,然后TCP的Segment會打到IP的Packet中,然后再打到以太網(wǎng)Ethernet的Frame中,傳到對端后,各個層解析自己的協(xié)議,然后把數(shù)據(jù)交給更高層的協(xié)議處理。
TCP頭格式
接下來,我們來看一下TCP頭的格式
TCP頭格式(圖片來源)
你需要注意這么幾點:
TCP的包是沒有IP地址的,那是IP層上的事。但是有源端口和目標(biāo)端口。
一個TCP連接需要四個元組來表示是同一個連接(src_ip, src_port, dst_ip, dst_port)準(zhǔn)確說是五元組,還有一個是協(xié)議。但因為這里只是說TCP協(xié)議,所以,這里我只說四元組。
注意上圖中的四個非常重要的東西:
Sequence Number是包的序號,用來解決網(wǎng)絡(luò)包亂序(reordering)問題。
Acknowledgement Number就是ACK——用于確認(rèn)收到,用來解決不丟包的問題。
Window又叫AdverTIsed-Window,也就是著名的滑動窗口(Sliding Window),用于解決流控的。
TCP Flag ,也就是包的類型,主要是用于操控TCP的狀態(tài)機的。
關(guān)于其它的東西,可以參看下面的圖示
TCP的狀態(tài)機
其實,網(wǎng)絡(luò)上的傳輸是沒有連接的,包括TCP也是一樣的。而TCP所謂的“連接”,其實只不過是在通訊的雙方維護一個“連接狀態(tài)”,讓它看上去好像有連接一樣。所以,TCP的狀態(tài)變換是非常重要的。
下面是:“TCP協(xié)議的狀態(tài)機”(圖片來源) 和 “TCP建鏈接”、“TCP斷鏈接”、“傳數(shù)據(jù)” 的對照圖,我把兩個圖并排放在一起,這樣方便在你對照著看。另外,下面這兩個圖非常非常的重要,你一定要記牢。(吐個槽:看到這樣復(fù)雜的狀態(tài)機,就知道這個協(xié)議有多復(fù)雜,復(fù)雜的東西總是有很多坑爹的事情,所以TCP協(xié)議其實也挺坑爹的)
很多人會問,為什么建鏈接要3次握手,斷鏈接需要4次揮手?
對于建鏈接的3次握手,主要是要初始化Sequence Number 的初始值。通信的雙方要互相通知對方自己的初始化的Sequence Number(縮寫為ISN:Inital Sequence Number)——所以叫SYN,全稱Synchronize Sequence Numbers。也就上圖中的 x 和 y。這個號要作為以后的數(shù)據(jù)通信的序號,以保證應(yīng)用層接收到的數(shù)據(jù)不會因為網(wǎng)絡(luò)上的傳輸?shù)膯栴}而亂序(TCP會用這個序號來拼接數(shù)據(jù))。