打開(kāi)線程?|?進(jìn)程?|?協(xié)程的大門
太多太多一系列的問(wèn)題伴隨到學(xué)習(xí),工作的各個(gè)階段,這些問(wèn)題確實(shí)不怎么好回答,除非你真的理解到它的底層原理,否則很容易就把自己套進(jìn)去,那么今天我們一起來(lái)看看這些問(wèn)題都是怎么產(chǎn)生的,為什么總是會(huì)問(wèn)這些題,開(kāi)始吧
前言
進(jìn)程和線程
進(jìn)程,平時(shí)我們打開(kāi)一個(gè)播放器,開(kāi)一個(gè)記事本,這些都是應(yīng)用程序,一個(gè)軟件的執(zhí)行副本,這就是進(jìn)程。從操作系統(tǒng)層面而言,進(jìn)程是分配資源的基本單位,線程在很長(zhǎng)時(shí)間被稱為輕量級(jí)的進(jìn)程,是程序執(zhí)行的基本單位。這樣看來(lái)一個(gè)分配資源的基本單位,一個(gè)是程序執(zhí)行的基本單元。以前面試的時(shí)候,我經(jīng)常也就這樣背給面試官了,當(dāng)自己成為了面試官才發(fā)現(xiàn)這些孩子答案為啥都是這個(gè),原來(lái)網(wǎng)上大部分的資料也就說(shuō)了這些呢,直接這樣死記硬背當(dāng)然不行,讓我們回到最初的計(jì)算機(jī)時(shí)代。最初的計(jì)算機(jī)時(shí)代是什么樣子呢那個(gè)時(shí)代呀,程序員會(huì)將寫(xiě)好的程序放入閃存中,然后插入到機(jī)器里,通過(guò)電能推動(dòng)芯片計(jì)算,那么芯片從閃存中取出指令,然后執(zhí)行下一條執(zhí)行,一旦閃存中的執(zhí)行執(zhí)行完了,計(jì)算機(jī)就要關(guān)機(jī)了這在早期叫做單任務(wù)模型,也叫做作業(yè)(Job)。隨著人們的需求越來(lái)越多,生活的多元化,慢慢出現(xiàn)了辦公,聊天,游戲等,這個(gè)時(shí)候不得不在同一臺(tái)計(jì)算機(jī)中來(lái)回的切換,人們就想要不通過(guò)線程和進(jìn)程來(lái)處理這個(gè)問(wèn)題
那是怎么處理的方式?比如說(shuō)一個(gè)游戲,啟動(dòng)后為一個(gè)進(jìn)程,但是一個(gè)游戲場(chǎng)面的呈現(xiàn)需要圖形的渲染,聯(lián)網(wǎng),這些操作不能相互的阻塞,如果阻塞了,卡起就很難受,總覺(jué)得這游戲怎么這么 low,我們希望它們能同時(shí)的運(yùn)行,所以將其各個(gè)部分設(shè)計(jì)為線程,這就出現(xiàn)了一個(gè)進(jìn)程有多個(gè)線程
既然一個(gè)進(jìn)程有多個(gè)線程,這個(gè)資源分配如何處理?啟動(dòng)一個(gè)游戲,首先需要存儲(chǔ)這些游戲參數(shù),所以需要內(nèi)存資源,當(dāng)進(jìn)行攻擊等動(dòng)作時(shí)候,發(fā)出的各種動(dòng)作指令需要計(jì)算,所以需要計(jì)算資源 CPU,還需要需要存儲(chǔ)一些文件,所以還需要文件資源。由于早期的 OS 沒(méi)有線程的概念,所以讓各個(gè)進(jìn)程采用分時(shí)的技術(shù)交替執(zhí)行,通過(guò)管道等技術(shù)讓各個(gè)進(jìn)程進(jìn)行通信。這樣看上去比較完美了,啟動(dòng)一個(gè)游戲后出來(lái)這么多進(jìn)程,那么能不能啟動(dòng)游戲后,在這個(gè)進(jìn)程下面安排一種技術(shù),讓其僅僅分配 CPU 資源呢,這就出現(xiàn)了線程
這個(gè)線程如何分配的?線程概念被提出來(lái)以后,因?yàn)橹环峙淞薈PU 計(jì)算資源,所以也叫做輕量級(jí)的進(jìn)程。通過(guò)操作系統(tǒng)來(lái)調(diào)度線程,也就是說(shuō)操作系統(tǒng)創(chuàng)建進(jìn)程后,“牽個(gè)線”,進(jìn)程的入口程序被放在主線程中,看起來(lái)就感覺(jué)是操作系統(tǒng)在調(diào)度進(jìn)程,實(shí)際上調(diào)度的是進(jìn)程中線程,這種被操作系統(tǒng)直接調(diào)度的線程叫做內(nèi)核級(jí)線程。既然有內(nèi)核級(jí)別線程,當(dāng)然有用戶級(jí)線程,相當(dāng)于操作系統(tǒng)調(diào)度線程,主線程通過(guò)程序的方式實(shí)現(xiàn)子線程,這就是用戶級(jí)線程,典型的即 Linux 中的 Phread API。既然說(shuō)到內(nèi)核態(tài)和用戶態(tài),我們來(lái)看看兩者有什么作用
用戶態(tài)線程它完全是在用戶空間創(chuàng)建,對(duì)于操作系統(tǒng)而言是不知情的,用戶級(jí)線程的優(yōu)勢(shì)如下:
- 切換成本低:用戶空間自己維護(hù),不用走操作系統(tǒng)的調(diào)度
- 管理開(kāi)銷小:創(chuàng)建和銷毀不用系統(tǒng)調(diào)用,系統(tǒng)調(diào)用所造成的上下文切換下文會(huì)講解
用戶態(tài)線程有什么缺點(diǎn)
- 與內(nèi)核溝通成本大:因?yàn)檫@種線程大部分時(shí)間在用戶空間,如果進(jìn)行 IO 操作,很難利用內(nèi)核的優(yōu)勢(shì),且需要頻繁的用戶態(tài)和內(nèi)核態(tài)的切換
- 線程之間的協(xié)作麻煩:想象兩個(gè)線程 A 和 B需要通信,通信通常會(huì)涉及到 IO 操作,IO 操作涉及到系統(tǒng)調(diào)用,系統(tǒng)調(diào)用又要發(fā)生用戶態(tài)和內(nèi)核套的切換成本,難
- 操作系統(tǒng)無(wú)法針對(duì)線程的調(diào)度進(jìn)行優(yōu)化:如果一個(gè)進(jìn)程的用戶態(tài)線程阻塞了操作系統(tǒng)無(wú)法及時(shí)的發(fā)現(xiàn)和處理阻塞問(wèn)題,它不會(huì)切換其他線程從而造成浪費(fèi)
內(nèi)核態(tài)線程內(nèi)核態(tài)線程執(zhí)行在內(nèi)核態(tài),一般通過(guò)系統(tǒng)調(diào)用創(chuàng)造一個(gè)內(nèi)核級(jí)線程,那么有哪些優(yōu)點(diǎn)?
- 操作系統(tǒng)級(jí)優(yōu)化:內(nèi)核中的線程即使執(zhí)行 IO 操作也不需要進(jìn)行系統(tǒng)調(diào)用,一個(gè)內(nèi)核阻塞可以讓其他立即執(zhí)行
- 充分利用多核優(yōu)勢(shì):內(nèi)核權(quán)限足夠高,可以在多個(gè) CPU 核心執(zhí)行內(nèi)核線程
內(nèi)核級(jí)線程有什么缺點(diǎn)?
- 創(chuàng)建成本比較高:創(chuàng)建的時(shí)候需要使用系統(tǒng)調(diào)用即切換到內(nèi)核態(tài)
- 切換成本高:切換的時(shí)候需要進(jìn)行內(nèi)核操作
- 擴(kuò)展性差:因?yàn)橐粋€(gè)內(nèi)核管理,坑位有限,不可能數(shù)量太多
用戶態(tài)線程和內(nèi)核態(tài)線程的映射關(guān)系是怎樣的呢上面談到用戶態(tài)線程和內(nèi)核態(tài)線程都有缺點(diǎn),用戶態(tài)線程創(chuàng)建成本低,不可以利用多核,而內(nèi)核態(tài)線程創(chuàng)建成本高,雖可以利用多核,但是切換速度慢。所以,通常都會(huì)在內(nèi)核中預(yù)留一些線程并反復(fù)使用這些線程,至此出現(xiàn)了以下幾種映射關(guān)系
用戶態(tài)和內(nèi)核態(tài)映射之一--多對(duì)一內(nèi)核線程的創(chuàng)建成本既然高,那么我們就是多個(gè)用戶態(tài)進(jìn)程的多線程復(fù)用一個(gè)內(nèi)核態(tài)線程,可是這樣線程不能并發(fā),所以此模型用戶很少
用戶態(tài)和內(nèi)核態(tài)映射之二--一對(duì)一讓每個(gè)用戶態(tài)線程分配一個(gè)單獨(dú)的內(nèi)核態(tài)線程,每個(gè)用戶態(tài)線程通過(guò)系統(tǒng)調(diào)用創(chuàng)建一個(gè)綁定的內(nèi)核線程,這種模型能夠并發(fā)執(zhí)行,充分利用多核的優(yōu)勢(shì),出名的 Windows NT即采用這種模型,但是如果線程比較多,對(duì)內(nèi)核的壓力就太大
用戶態(tài)和內(nèi)核態(tài)映射之三--多對(duì)多即 n 個(gè)用戶態(tài)線程對(duì)應(yīng) m 個(gè)內(nèi)核態(tài)線程。m通常小于等于n,m通常設(shè)置為核數(shù),這種多對(duì)多的關(guān)系減少了內(nèi)核線程且完成了并發(fā),Linux即采用的這種模型一臺(tái)計(jì)算機(jī)會(huì)啟動(dòng)很多進(jìn)程,其數(shù)量當(dāng)然是大于 CPU 數(shù)量,只好讓 CPU 輪流的分配給它們,讓我們產(chǎn)生了多任務(wù)同時(shí)執(zhí)行的錯(cuò)覺(jué),那有沒(méi)有想過(guò)這些任務(wù)執(zhí)行之前,CPU都會(huì)干啥?CPU 既然要執(zhí)行它,勢(shì)必會(huì)去了解從哪里加載它,又從哪里開(kāi)始運(yùn)行,也就是說(shuō),需要系統(tǒng)提前將它們?cè)O(shè)置好 CPU 寄存器和程序計(jì)數(shù)器
眼中的寄存器和程序計(jì)數(shù)器是什么?它雖小不過(guò)威力卻很大,速度很快的內(nèi)存。而程序計(jì)數(shù)器用來(lái)記錄正在執(zhí)行指令的位置,這些CPU需要依賴的環(huán)境即 CPU 的上下文。上下文知道了,那么 CPU 的切換是不是就很好理解將前一個(gè)任務(wù)的 CPU 上下文保存下來(lái),加載新任務(wù)的上下文到寄存器和程序計(jì)數(shù)器中,然后跳轉(zhuǎn)到程序計(jì)數(shù)器所指向的位置。根據(jù)任務(wù)的不同又分為進(jìn)程的上下文和線程的上下文
進(jìn)程的上下文進(jìn)程在用戶空間運(yùn)行的時(shí)候叫做用戶態(tài),陷入到內(nèi)核空間叫做進(jìn)程的內(nèi)核態(tài),如果用戶態(tài)的進(jìn)程想轉(zhuǎn)變到內(nèi)核態(tài),則可以通過(guò)系統(tǒng)調(diào)用的方式完成。進(jìn)程由內(nèi)核調(diào)度,進(jìn)程的切換發(fā)生在內(nèi)核態(tài)
進(jìn)程的上下文包含哪些數(shù)據(jù)?既然進(jìn)程的切換發(fā)生在內(nèi)核態(tài),那么進(jìn)程的上下文不僅僅包括虛擬內(nèi)存,棧,全局變量等用戶空間資源,還包括了內(nèi)核堆棧,寄存器等內(nèi)核空間的狀態(tài)這里的保存上下文和恢復(fù)上下文也不是說(shuō)免費(fèi)的,需要內(nèi)核在 CPU 上運(yùn)行才能完成
線程上下文切換看到這里,你肯定可以脫口而出兩者的區(qū)別在于線程是調(diào)度的基本單位,而進(jìn)程是資源擁有的基本單位。講白了,內(nèi)核的任務(wù)調(diào)度實(shí)際上調(diào)度的是線程,進(jìn)程只是為線程提供虛擬內(nèi)存,全局變量等資源,所以這樣理解可能更好:
- 進(jìn)程如果只有一個(gè)線程,那么認(rèn)為進(jìn)程就是線程
- 如果進(jìn)程有多個(gè)線程,那么多個(gè)線程會(huì)共享相同的虛擬內(nèi)存和全局變量等資源,上下文的切換不會(huì)影響這些資源
- 線程擁有自己的私有數(shù)據(jù)比如棧和寄存器,上下文切換的時(shí)候需要提前保存
- 兩個(gè)線程不屬于同一個(gè)進(jìn)程,那么資源不共享,所以切換過(guò)程就會(huì)涉及到進(jìn)程的上下文切換
- 第二種情況即兩個(gè)線程屬于同一個(gè)進(jìn)程。因?yàn)楣蚕硖摂M內(nèi)存,所以切換的時(shí)候這些資源保持不動(dòng),只需要切換線程的私有數(shù)據(jù)等不共享的數(shù)據(jù)
那么系統(tǒng)調(diào)用又是怎么執(zhí)行的?真的是一環(huán)接一環(huán),是不是像極了面試,是的,我們對(duì)面試官的每一次回答都應(yīng)該盡全力的讓面試官上鉤,問(wèn)自己所能回答的問(wèn)題不是。如果用戶態(tài)的程序要執(zhí)行系統(tǒng)調(diào)用,則需要切換到內(nèi)核態(tài)執(zhí)行,這個(gè)過(guò)程如下圖所示,一圖勝千言既然分為了用戶態(tài)和內(nèi)核態(tài),兩者權(quán)限級(jí)別不盡相同,用戶態(tài)的程序發(fā)起系統(tǒng)調(diào)用,因?yàn)樯婕暗綑?quán)限問(wèn)題,不得不牽扯到特權(quán)指令,所以就會(huì)通過(guò)中斷的方式執(zhí)行,即上圖的 Trap。發(fā)生中斷以后,內(nèi)核程序就開(kāi)始執(zhí)行,處理完成又要觸發(fā) Trap,切換到用戶態(tài)的工作,這里又涉及到了中斷,我們這篇就先簡(jiǎn)單了解下中斷
中斷做了什么?我們以平時(shí)經(jīng)常接觸的鍵盤(pán)為例,當(dāng)我們敲下鍵盤(pán),主板收到按鍵后通知 CPU ,CPU 此時(shí)可能在忙處理其他程序,需要先中斷當(dāng)前執(zhí)行的程序,然后將 PC 指針跳轉(zhuǎn)到固定的位置,這就是一次中斷的簡(jiǎn)單描述可是我們不同的組合按鍵對(duì)應(yīng)不同的事件,所以需要根據(jù)中斷類型判斷 PC 指針到底跳轉(zhuǎn)到哪兒,中斷類型的不同,PC 指針?biāo)鶊?zhí)行的位置也就不同,因此進(jìn)行了分類,這個(gè)類型呢我們稱為中斷識(shí)別碼。CPU 通過(guò) PC 指針知道需要跳轉(zhuǎn)到哪個(gè)地址進(jìn)行處理,這個(gè)地址叫做 中斷向量表舉個(gè)例子,使用編號(hào) 8 表示按鍵中斷類型A的識(shí)別碼,編號(hào) 9 表示中斷類型 B 的識(shí)別碼。當(dāng)中斷發(fā)生的時(shí)候,對(duì)于CPU而言,是需要知道到底讓 PC 指針指向哪個(gè)地址,這個(gè)地址就是中斷向量假設(shè)我們?cè)O(shè)置了 255 個(gè)中斷,編號(hào)為 0 - 255,在 32 位機(jī)器中差不多需要 1k 的內(nèi)存地址存儲(chǔ)中斷向量,這里的 1k 空間就是中斷向量表。因此,當(dāng) CPU 接收到中斷,根據(jù)中斷類型操作 PC 指針,找到中斷向量,修改中斷向量,插入指令實(shí)現(xiàn)跳轉(zhuǎn)功能
進(jìn)程和線程都出現(xiàn)了,那么怎么調(diào)度?計(jì)算機(jī)資源有限,太多的進(jìn)程消耗機(jī)器自然受不住,我們?nèi)艘惨粯?,胃也有限嘛,一頓不吃餓得慌,可是吃多了也會(huì)走路腳顫抖不是,所以聰明的計(jì)算機(jī)也會(huì)想辦法來(lái)處理這個(gè)問(wèn)題。兩手一揮,既然我們的 CPU 的核數(shù)有限,要不咋們給每個(gè)進(jìn)程分配一個(gè)時(shí)間片,排隊(duì)一個(gè)個(gè)執(zhí)行,超出給定的時(shí)間就直接讓另一個(gè)進(jìn)程執(zhí)行如何
那時(shí)間片怎么分配?假設(shè)此時(shí)有三個(gè)進(jìn)程,進(jìn)程1只需要 2 個(gè)時(shí)間片,進(jìn)程2需要1個(gè)時(shí)間片,進(jìn)程3需要3個(gè)時(shí)間片。進(jìn)程1執(zhí)行到一半的時(shí)候,累了,不想執(zhí)行了,休息會(huì)(掛起),進(jìn)程2執(zhí)行,進(jìn)程2一梭子就執(zhí)行完了,進(jìn)程3等不及了馬上執(zhí)行,執(zhí)行三分之一后,進(jìn)程1開(kāi)始執(zhí)行,這樣循環(huán)根據(jù)時(shí)間片的執(zhí)行方式即分時(shí)技術(shù)
剛才有說(shuō)到進(jìn)程的狀態(tài),那么有哪些狀態(tài)?一個(gè)進(jìn)程的周期一般會(huì)分為下面三種狀態(tài)
- 就緒狀態(tài):進(jìn)程創(chuàng)建好了會(huì)開(kāi)始排隊(duì),這個(gè)時(shí)候叫做“就緒狀態(tài)”
- 運(yùn)行狀態(tài):當(dāng)一切準(zhǔn)備就緒,天時(shí)地利人和后開(kāi)始執(zhí)行,此時(shí)為“運(yùn)行狀態(tài)”
- 如果將時(shí)間片用完了會(huì)再次變?yōu)榫途w狀態(tài)
為什么需要阻塞狀態(tài)我們想想,有的時(shí)候計(jì)算機(jī)會(huì)因?yàn)楦鞣N原因不能響應(yīng)我們的請(qǐng)求,可能是因?yàn)榈却疟P(pán),可能因?yàn)榈却蛴C(jī),畢竟不會(huì)總是的及時(shí)的滿足我們的需求,所以它這個(gè)時(shí)候通過(guò)中斷告訴 CPU ,CPU 通過(guò)執(zhí)行中斷處理程序,將控制權(quán)給操作系統(tǒng),操作系統(tǒng)隨后將阻塞的進(jìn)程狀態(tài)修改為就緒狀態(tài),安排重新排隊(duì),再加上因?yàn)檫M(jìn)程進(jìn)入阻塞狀態(tài)無(wú)事可做,但是又不能干癟癟的讓他去排隊(duì)(因?yàn)樾枰却袛啵赃M(jìn)入到阻塞狀態(tài)。下面對(duì)以上所說(shuō)的三種狀態(tài)進(jìn)行一個(gè)小結(jié)
- 就緒狀態(tài)( Ready ):可運(yùn)行,只不過(guò)其他進(jìn)程在運(yùn)行暫時(shí)停止
- 運(yùn)行( Running):此時(shí)進(jìn)程占用 CPU
- 阻塞狀態(tài)( blo ck ): 此時(shí)可能因?yàn)榈却嚓P(guān)事件(請(qǐng)求 IO/等待 IO 完成等) 而停止運(yùn)行,此時(shí)即使把 CPU 控制權(quán)給它,仍然無(wú)法運(yùn)行
- 創(chuàng)建狀態(tài) ( New ):進(jìn)程剛被創(chuàng)建還沒(méi)有提交時(shí)的狀態(tài),主要功能為分配和建立進(jìn)程控制塊等初始化工作。創(chuàng)建進(jìn)程有兩個(gè)階段,第一個(gè)階段為為新的進(jìn)程創(chuàng)建必要的管理信息。第二個(gè)階段為讓進(jìn)程進(jìn)入就緒狀態(tài)
- 終止?fàn)顟B(tài) ( Exit ):進(jìn)程退出的狀態(tài),即回收除了進(jìn)程控制塊以外的資源。也分為兩個(gè)階段,第一個(gè)階段為等待操作系統(tǒng)進(jìn)行善后處理,第二個(gè)階段為釋放主存
- Null---->創(chuàng)建狀態(tài):最初創(chuàng)建的第一個(gè)狀態(tài)
- 創(chuàng)建狀態(tài)----->就緒狀態(tài):進(jìn)行一些列的初始化稱為就緒狀態(tài)
- 就緒狀態(tài)----->運(yùn)行狀態(tài):當(dāng)操作系統(tǒng)調(diào)度就緒狀態(tài)的進(jìn)程并分配給 CPU 變?yōu)檫\(yùn)行狀態(tài)
- 運(yùn)行狀態(tài)------>結(jié)束狀態(tài):當(dāng)進(jìn)程完成相應(yīng)任務(wù)或出錯(cuò)則被操作系統(tǒng)結(jié)束的狀態(tài)
- 運(yùn)行狀態(tài)------>阻塞狀態(tài):運(yùn)行狀態(tài)的進(jìn)程由于時(shí)間片用完,操作系統(tǒng)將進(jìn)程更改為就緒狀態(tài)
- 阻塞狀態(tài)------->就緒狀態(tài):阻塞狀態(tài)的進(jìn)程等待某事件結(jié)束進(jìn)入就緒狀態(tài)
- 掛起是一種行為,而阻塞是進(jìn)程的狀態(tài)
- 導(dǎo)致進(jìn)程掛起的原因通常是因?yàn)閮?nèi)存不足或者用戶的請(qǐng)求,進(jìn)程的修改等,而進(jìn)程的阻塞是進(jìn)程正在等待某個(gè)事件發(fā)生,可能是等待資源或響應(yīng)
- 掛起對(duì)應(yīng)的是行為的激活,將外存中的進(jìn)程掉入內(nèi)存中,而處于阻塞狀態(tài)的進(jìn)程需要等待其他進(jìn)程或系統(tǒng)喚醒
- 掛起屬于被動(dòng)行為,進(jìn)程被迫從內(nèi)存轉(zhuǎn)移到外存,而進(jìn)入阻塞為主動(dòng)的行為
進(jìn)程與線程的底層原理
上面我們了解了進(jìn)程,線程的由來(lái)以及狀態(tài)變遷,但是顯然不能讓我自如的了解進(jìn)程和線程,至于其如何在內(nèi)存表示等問(wèn)題還是比較空虛的,所以我們繼續(xù)往下看進(jìn)程和線程在內(nèi)存中如何表示在整個(gè)設(shè)計(jì)過(guò)程中,涉及了兩張表,分別是進(jìn)程表和線程表。其中進(jìn)程表會(huì)記錄進(jìn)程在內(nèi)存的位置,PID是多少,以及當(dāng)前什么狀態(tài),內(nèi)存給它分配了多大使用空間以及屬于哪個(gè)用戶,假設(shè)沒(méi)有這張表,操作系統(tǒng)就不知道有哪些進(jìn)程,也就更不清楚怎么去調(diào)度,就仿佛失去XXX,不知道了方向尤其需要注意進(jìn)程表這樣幾個(gè)部分
- 資源信息
- 內(nèi)存布局
- 棧:系統(tǒng)自動(dòng)分配釋放,平時(shí)經(jīng)常使用的函數(shù)參數(shù)值,局部變量,返回地址等就在此
- 堆:存放動(dòng)態(tài)分配的數(shù)據(jù),通常由開(kāi)發(fā)人員自行管理,如果開(kāi)發(fā)人員使用后不釋放,那么程序結(jié)束后可能會(huì)被操作系統(tǒng)收回
- 數(shù)據(jù)段:存放的是全局變量和靜態(tài)變量。其中初始化數(shù)據(jù)段(.data)存放顯示初始化的全局變量和靜態(tài)變量,未初始化數(shù)據(jù)段,此段通常也被稱為BSS段(.bss),存放未進(jìn)行顯示初始化的全局變量和靜態(tài)變量。
- 描述信息
兩者映射的關(guān)系如何去表示可以想像在內(nèi)核中有一個(gè)線程池,給予用戶空間使用,每次用戶級(jí)線程把程序計(jì)數(shù)器等傳遞過(guò)去,執(zhí)行結(jié)束后,內(nèi)核線程不銷毀,等待下一個(gè)任務(wù),從這里可以看出創(chuàng)建進(jìn)程開(kāi)銷大、成本高;創(chuàng)建線程開(kāi)銷小,成本低。
這么多進(jìn)程難道共用內(nèi)存?操作系統(tǒng)太多的進(jìn)程,為了讓他們各司其職,互不干擾,考慮為他們分配完全隔離的內(nèi)存區(qū)域,即使程序內(nèi)部讀取相同的內(nèi)存地址,但實(shí)際上他們的物理地址也不一樣。就仿佛我在 X 座的 501 和你在 Y 座的501一樣卻不是一個(gè)房子,這就是地址空間所以在正常的情況下 A 進(jìn)程不能訪問(wèn) B 進(jìn)程的內(nèi)存,除非你植入一個(gè)木馬,惡意操作 B 進(jìn)程的內(nèi)存或者通過(guò)我們后面說(shuō)的進(jìn)程間通信的方式進(jìn)行訪問(wèn)
那進(jìn)程線程怎么切換的呢?操作系統(tǒng)的大量進(jìn)程需要來(lái)回的切換,保持有借有還再借不難的傳統(tǒng)美德,每次切換之前需要先記錄下當(dāng)前寄存器值的內(nèi)存地址,方便下次回到原位置繼續(xù)執(zhí)行?;謴?fù)執(zhí)行的時(shí)候就從內(nèi)存中讀取,然后恢復(fù)狀態(tài)執(zhí)行即可為了詳細(xì)的讓大家理解這個(gè)過(guò)程,我將其拆分為下面幾個(gè)步驟
- 操作系統(tǒng)感知到有個(gè)進(jìn)程需要切換,先發(fā)出一個(gè)中斷信號(hào)給 CPU ,讓其停止當(dāng)前進(jìn)程
- CPU 收到中斷信號(hào)后,正在執(zhí)行的進(jìn)程會(huì)停止,好心的操作系統(tǒng)會(huì)想辦法先保存當(dāng)前的狀態(tài)
- 操作系統(tǒng)接管中斷后,執(zhí)行一段匯編程序幫助寄存器之前進(jìn)程的狀態(tài)
- 當(dāng)操作系統(tǒng)保存好狀態(tài)后就會(huì)執(zhí)行調(diào)度程序,讓其決定下一個(gè)將要執(zhí)行的進(jìn)程
- 最后操作系統(tǒng)會(huì)執(zhí)行下一個(gè)進(jìn)程
中斷以后如何恢復(fù)之前進(jìn)程運(yùn)行呢上面說(shuō)到操作系統(tǒng)會(huì)執(zhí)行一段代碼幫助進(jìn)程恢復(fù)狀態(tài),其實(shí)現(xiàn)方式中,有一種方式即通過(guò)棧的先進(jìn)后出的數(shù)據(jù)結(jié)構(gòu),所以對(duì)吧,大學(xué)中的基礎(chǔ)課程真的好重要。進(jìn)程(線程)中斷后,操作系統(tǒng)負(fù)責(zé)壓棧關(guān)鍵數(shù)據(jù)(比如寄存器)?;謴?fù)執(zhí)行時(shí),操作系統(tǒng)負(fù)責(zé)出棧和恢復(fù)寄存器的值。
協(xié)程
第一次接觸協(xié)程是一次自動(dòng)駕駛項(xiàng)目中,一起干活的同事說(shuō)這個(gè)庫(kù)底層使用了協(xié)程,我一臉懵逼,?。繑y程?準(zhǔn)備收拾行李回家了?半天想過(guò)來(lái)了,其有個(gè)底層庫(kù)使用了協(xié)程,當(dāng)時(shí)還一臉懵逼,進(jìn)程,線程就已經(jīng)夠折騰人了,怎么又來(lái)個(gè)協(xié)程,當(dāng)時(shí)想著到時(shí)候面試官是不是又多了問(wèn)問(wèn)題的思路- 什么是協(xié)程
- 協(xié)程和進(jìn)程,線程的區(qū)別是什么
- 協(xié)程有什么優(yōu)缺點(diǎn)
為什么需要協(xié)程?我們?cè)趫?zhí)行多任務(wù)的時(shí)候通常采用多線程的方式并發(fā)執(zhí)行。我們以最近非?;馃岬碾娚檀黉N茅臺(tái)為例,不管茅臺(tái)是在緩存中還是后端的數(shù)據(jù),最開(kāi)始的用戶也就是10個(gè),每當(dāng)收到10條付款信息就開(kāi)啟10個(gè)線程去查詢數(shù)據(jù)庫(kù),此時(shí)用戶量少,馬上就可返回,第二天增加到100人,使用100個(gè)線程去查詢,感覺(jué)確實(shí)效果不錯(cuò),加大促銷力度,當(dāng)同時(shí)出現(xiàn)1000個(gè)人的時(shí)候感覺(jué)到有點(diǎn)吃力了1000-10000,看了前面的內(nèi)容應(yīng)該清楚創(chuàng)建銷毀線程還是挺費(fèi)資源的,假設(shè)每個(gè)線程占用 4M內(nèi)存空間,那么10000個(gè)線程大概需要消耗 39G 內(nèi)存,可是服務(wù)器也就 8G 內(nèi)存。此時(shí)的方案要么增加服務(wù)器要么提升代碼效率。多個(gè)線程在進(jìn)行作業(yè)的時(shí)候,難免會(huì)遇到某個(gè)線程等待 IO 的情況,此時(shí)會(huì)阻塞當(dāng)前線程切換到其他線程,使得其他線程照常執(zhí)行,線程少的時(shí)候沒(méi)什么問(wèn)題,當(dāng)線程數(shù)量變多就會(huì)出現(xiàn)問(wèn)題,線程數(shù)量的增加不僅占用非常多的內(nèi)存空間且過(guò)多的線程的切換也會(huì)占用大量的系統(tǒng)時(shí)間
此時(shí)就可以通過(guò)協(xié)程的方式解決這個(gè)問(wèn)題協(xié)程運(yùn)行在線程之上,協(xié)程執(zhí)行完成后,可以選擇主動(dòng)讓出,讓另一個(gè)協(xié)程運(yùn)行在當(dāng)前線程之上。即協(xié)程并沒(méi)有增加線程的數(shù)量,而是在線程的基礎(chǔ)上通過(guò)分時(shí)復(fù)用的方式運(yùn)行多個(gè)協(xié)程,還有關(guān)鍵一點(diǎn)是它的切換發(fā)生在用戶態(tài),所有也不存在用戶態(tài)到內(nèi)核態(tài)的切換,代價(jià)更低類比上面,我們只需要啟動(dòng) 100 個(gè)線程,然后每個(gè)線程跑100個(gè)協(xié)程就可以完成上述同時(shí)處理10000個(gè)任務(wù)
那么協(xié)程在使用的過(guò)程中需要主要哪些內(nèi)容呢剛說(shuō)協(xié)程運(yùn)行于線程之上,如果線程等待 IO 的時(shí)候阻塞了,這時(shí)候會(huì)出現(xiàn)什么情況?其實(shí)操作系統(tǒng)主要關(guān)心線程,協(xié)程調(diào)用阻塞IO的時(shí)候,操作系統(tǒng)會(huì)讓進(jìn)程處于阻塞狀態(tài),此時(shí)當(dāng)前的協(xié)程和綁定在線程之上的協(xié)程都會(huì)陷入阻塞而得不到調(diào)度,這樣就很難受了因此協(xié)程中,不能調(diào)用導(dǎo)致線程阻塞的操作,即協(xié)程最好了異步 IO 結(jié)合起來(lái)才能發(fā)揮最大的威力
怎么處理在協(xié)程中調(diào)用阻塞IO的操作呢
- 比較簡(jiǎn)答的思路是當(dāng)調(diào)用阻塞 IO 的時(shí)候,重新啟動(dòng)一個(gè)線程去執(zhí)行這個(gè)操作,等執(zhí)行完成后,協(xié)程再去讀取結(jié)果,這是不是和多線程很像
- 將系統(tǒng) IO 進(jìn)行封裝,改為異步調(diào)用的方式,此時(shí)需要大量的工作,所以需要寄生于編程語(yǔ)言的原生支持