不知從幾何起,可能是大三那年的操作系統(tǒng)考試,也可能是剛經(jīng)歷完的秋招,這些概念總是迷迷糊糊,可能自己回答的和其他人的答復(fù)也差不多,并沒有什么亮點,通常都會以:「我們換個題」的方式結(jié)束,有時候也挺尷尬的。我們不妨看看這樣幾個題應(yīng)該怎么去回答
-
進程和線程是什么
-
進程和線程有什么區(qū)別
-
為什么有了進程又出現(xiàn)線程
-
內(nèi)核態(tài)和用戶態(tài)有啥不同
-
協(xié)程有什么特點
太多太多一系列的問題伴隨到學(xué)習(xí),工作的各個階段,這些問題確實不怎么好回答,除非你真的理解到它的底層原理,否則很容易就把自己套進去,那么今天我們一起來看看這些問題都是怎么產(chǎn)生的,為什么總是會問這些題,開始吧
前言

進程和線程
進程,平時我們打開一個播放器,開一個記事本,這些都是應(yīng)用程序,一個軟件的執(zhí)行副本,這就是進程。從操作系統(tǒng)層面而言,進程是分配資源的基本單位,線程在很長時間被稱為輕量級的進程,是程序執(zhí)行的基本單位。
這樣看來一個分配資源的基本單位,一個是程序執(zhí)行的基本單元。以前面試的時候,我經(jīng)常也就這樣背給面試官了,當(dāng)自己成為了面試官才發(fā)現(xiàn)這些孩子答案為啥都是這個,原來網(wǎng)上大部分的資料也就說了這些呢,直接這樣死記硬背當(dāng)然不行,讓我們回到最初的計算機時代。
最初的計算機時代是什么樣子呢
那個時代呀,程序員會將寫好的程序放入閃存中,然后插入到機器里,通過電能推動芯片計算,那么芯片從閃存中取出指令,然后執(zhí)行下一條執(zhí)行,一旦閃存中的執(zhí)行執(zhí)行完了,計算機就要關(guān)機了

這在早期叫做單任務(wù)模型,也叫做作業(yè)(Job)。隨著人們的需求越來越多,生活的多元化,慢慢出現(xiàn)了辦公,聊天,游戲等,這個時候不得不在同一臺計算機中來回的切換,人們就想要不通過線程和進程來處理這個問題
那是怎么處理的方式?
比如說一個游戲,啟動后為一個進程,但是一個游戲場面的呈現(xiàn)需要圖形的渲染,聯(lián)網(wǎng),這些操作不能相互的阻塞,如果阻塞了,卡起就很難受,總覺得這游戲怎么這么 low,我們希望它們能同時的運行,所以將其各個部分設(shè)計為線程,這就出現(xiàn)了一個進程有多個線程
既然一個進程有多個線程,這個資源分配如何處理?
啟動一個游戲,首先需要存儲這些游戲參數(shù),所以需要內(nèi)存資源,當(dāng)進行攻擊等動作時候,發(fā)出的各種動作指令需要計算,所以需要計算資源 CPU,還需要需要存儲一些文件,所以還需要文件資源。由于早期的 OS 沒有線程的概念,所以讓各個進程采用分時的技術(shù)交替執(zhí)行,通過管道等技術(shù)讓各個進程進行通信。
這樣看上去比較完美了,啟動一個游戲后出來這么多進程,那么能不能啟動游戲后,在這個進程下面安排一種技術(shù),讓其僅僅分配 CPU 資源呢,這就出現(xiàn)了線程
這個線程如何分配的?
線程概念被提出來以后,因為只分配了CPU 計算資源,所以也叫做輕量級的進程。通過操作系統(tǒng)來調(diào)度線程,也就是說操作系統(tǒng)創(chuàng)建進程后,“牽個線”,進程的入口程序被放在主線程中,看起來就感覺是操作系統(tǒng)在調(diào)度進程,實際上調(diào)度的是進程中線程,這種被操作系統(tǒng)直接調(diào)度的線程叫做內(nèi)核級線程。
既然有內(nèi)核級別線程,當(dāng)然有用戶級線程,相當(dāng)于操作系統(tǒng)調(diào)度線程,主線程通過程序的方式實現(xiàn)子線程,這就是用戶級線程,典型的即 Linux 中的 Phread API。既然說到內(nèi)核態(tài)和用戶態(tài),我們來看看兩者有什么作用
用戶態(tài)線程
它完全是在用戶空間創(chuàng)建,對于操作系統(tǒng)而言是不知情的,用戶級線程的優(yōu)勢如下:
-
切換成本低:用戶空間自己維護,不用走操作系統(tǒng)的調(diào)度
-
管理開銷小:創(chuàng)建和銷毀不用系統(tǒng)調(diào)用,系統(tǒng)調(diào)用所造成的上下文切換下文會講解
用戶態(tài)線程有什么缺點
-
與內(nèi)核溝通成本大:因為這種線程大部分時間在用戶空間,如果進行 IO 操作,很難利用內(nèi)核的優(yōu)勢,且需要頻繁的用戶態(tài)和內(nèi)核態(tài)的切換
-
線程之間的協(xié)作麻煩:想象兩個線程 A 和 B需要通信,通信通常會涉及到 IO 操作,IO 操作涉及到系統(tǒng)調(diào)用,系統(tǒng)調(diào)用又要發(fā)生用戶態(tài)和內(nèi)核套的切換成本,難
-
操作系統(tǒng)無法針對線程的調(diào)度進行優(yōu)化:如果一個進程的用戶態(tài)線程阻塞了操作系統(tǒng)無法及時的發(fā)現(xiàn)和處理阻塞問題,它不會切換其他線程從而造成浪費
內(nèi)核態(tài)線程
內(nèi)核態(tài)線程執(zhí)行在內(nèi)核態(tài),一般通過系統(tǒng)調(diào)用創(chuàng)造一個內(nèi)核級線程,那么有哪些優(yōu)點?
-
操作系統(tǒng)級優(yōu)化:內(nèi)核中的線程即使執(zhí)行 IO 操作也不需要進行系統(tǒng)調(diào)用,一個內(nèi)核阻塞可以讓其他立即執(zhí)行
-
充分利用多核優(yōu)勢:內(nèi)核權(quán)限足夠高,可以在多個 CPU 核心執(zhí)行內(nèi)核線程
內(nèi)核級線程有什么缺點?
-
創(chuàng)建成本比較高:創(chuàng)建的時候需要使用系統(tǒng)調(diào)用即切換到內(nèi)核態(tài)
-
切換成本高:切換的時候需要進行內(nèi)核操作
-
擴展性差:因為一個內(nèi)核管理,坑位有限,不可能數(shù)量太多
用戶態(tài)線程和內(nèi)核態(tài)線程的映射關(guān)系是怎樣的呢
上面談到用戶態(tài)線程和內(nèi)核態(tài)線程都有缺點,用戶態(tài)線程創(chuàng)建成本低,不可以利用多核,而內(nèi)核態(tài)線程創(chuàng)建成本高,雖可以利用多核,但是切換速度慢。所以,通常都會在內(nèi)核中預(yù)留一些線程并反復(fù)使用這些線程,至此出現(xiàn)了以下幾種映射關(guān)系
用戶態(tài)和內(nèi)核態(tài)映射之一--多對一
內(nèi)核線程的創(chuàng)建成本既然高,那么我們就是多個用戶態(tài)進程的多線程復(fù)用一個內(nèi)核態(tài)線程,可是這樣線程不能并發(fā),所以此模型用戶很少
用戶態(tài)和內(nèi)核態(tài)映射之二--一對一
讓每個用戶態(tài)線程分配一個單獨的內(nèi)核態(tài)線程,每個用戶態(tài)線程通過系統(tǒng)調(diào)用創(chuàng)建一個綁定的內(nèi)核線程,這種模型能夠并發(fā)執(zhí)行,充分利用多核的優(yōu)勢,出名的 Windows NT即采用這種模型,但是如果線程比較多,對內(nèi)核的壓力就太大

用戶態(tài)和內(nèi)核態(tài)映射之三--多對多
即 n 個用戶態(tài)線程對應(yīng) m 個內(nèi)核態(tài)線程。m通常小于等于n,m通常設(shè)置為核數(shù),這種多對多的關(guān)系減少了內(nèi)核線程且完成了并發(fā),Linux即采用的這種模型

一臺計算機會啟動很多進程,其數(shù)量當(dāng)然是大于 CPU 數(shù)量,只好讓 CPU 輪流的分配給它們,讓我們產(chǎn)生了多任務(wù)同時執(zhí)行的錯覺,那有沒有想過這些任務(wù)執(zhí)行之前,CPU都會干啥?
CPU 既然要執(zhí)行它,勢必會去了解從哪里加載它,又從哪里開始運行,也就是說,需要系統(tǒng)提前將它們設(shè)置好 CPU 寄存器和程序計數(shù)器
眼中的寄存器和程序計數(shù)器是什么?
它雖小不過威力卻很大,速度很快的內(nèi)存。而程序計數(shù)器用來記錄正在執(zhí)行指令的位置,這些CPU需要依賴的環(huán)境即 CPU 的上下文。上下文知道了,那么 CPU 的切換是不是就很好理解
將前一個任務(wù)的 CPU 上下文保存下來,加載新任務(wù)的上下文到寄存器和程序計數(shù)器中,然后跳轉(zhuǎn)到程序計數(shù)器所指向的位置。根據(jù)任務(wù)的不同又分為進程的上下文和線程的上下文
進程的上下文
進程在用戶空間運行的時候叫做用戶態(tài),陷入到內(nèi)核空間叫做進程的內(nèi)核態(tài),如果用戶態(tài)的進程想轉(zhuǎn)變到內(nèi)核態(tài),則可以通過系統(tǒng)調(diào)用的方式完成。進程由內(nèi)核調(diào)度,進程的切換發(fā)生在內(nèi)核態(tài)
進程的上下文包含哪些數(shù)據(jù)?
既然進程的切換發(fā)生在內(nèi)核態(tài),那么進程的上下文不僅僅包括虛擬內(nèi)存,棧,全局變量等用戶空間資源,還包括了內(nèi)核堆棧,寄存器等內(nèi)核空間的狀態(tài)
這里的保存上下文和恢復(fù)上下文也不是說免費的,需要內(nèi)核在 CPU 上運行才能完成

線程上下文切換
看到這里,你肯定可以脫口而出兩者的區(qū)別在于線程是調(diào)度的基本單位,而進程是資源擁有的基本單位。講白了,內(nèi)核的任務(wù)調(diào)度實際上調(diào)度的是線程,進程只是為線程提供虛擬內(nèi)存,全局變量等資源,所以這樣理解可能更好:
-
進程如果只有一個線程,那么認(rèn)為進程就是線程
-
如果進程有多個線程,那么多個線程會共享相同的虛擬內(nèi)存和全局變量等資源,上下文的切換不會影響這些資源
-
線程擁有自己的私有數(shù)據(jù)比如棧和寄存器,上下文切換的時候需要提前保存
綜上,線程的上下文切換將分為兩個部分
-
兩個線程不屬于同一個進程,那么資源不共享,所以切換過程就會涉及到進程的上下文切換
-
第二種情況即兩個線程屬于同一個進程。因為共享虛擬內(nèi)存,所以切換的時候這些資源保持不動,只需要切換線程的私有數(shù)據(jù)等不共享的數(shù)據(jù)
這也從側(cè)面表明了,進程內(nèi)的線程切換比多進程間的切換會節(jié)省不少資源,這也是多線程逐漸替代多進程的一個優(yōu)勢
那么系統(tǒng)調(diào)用又是怎么執(zhí)行的?
真的是一環(huán)接一環(huán),是不是像極了面試,是的,我們對面試官的每一次回答都應(yīng)該盡全力的讓面試官上鉤,問自己所能回答的問題不是。
如果用戶態(tài)的程序要執(zhí)行系統(tǒng)調(diào)用,則需要切換到內(nèi)核態(tài)執(zhí)行,這個過程如下圖所示,一圖勝千言

既然分為了用戶態(tài)和內(nèi)核態(tài),兩者權(quán)限級別不盡相同,用戶態(tài)的程序發(fā)起系統(tǒng)調(diào)用,因為涉及到權(quán)限問題,不得不牽扯到特權(quán)指令,所以就會通過中斷的方式執(zhí)行,即上圖的 Trap。
發(fā)生中斷以后,內(nèi)核程序就開始執(zhí)行,處理完成又要觸發(fā) Trap,切換到用戶態(tài)的工作,這里又涉及到了中斷,我們這篇就先簡單了解下中斷
中斷做了什么?
我們以平時經(jīng)常接觸的鍵盤為例,當(dāng)我們敲下鍵盤,主板收到按鍵后通知 CPU ,CPU 此時可能在忙處理其他程序,需要先中斷當(dāng)前執(zhí)行的程序,然后將 PC 指針跳轉(zhuǎn)到固定的位置,這就是一次中斷的簡單描述
可是我們不同的組合按鍵對應(yīng)不同的事件,所以需要根據(jù)中斷類型判斷 PC 指針到底跳轉(zhuǎn)到哪兒,中斷類型的不同,PC 指針?biāo)鶊?zhí)行的位置也就不同,因此進行了分類,這個類型呢我們稱為中斷識別碼。CPU 通過 PC 指針知道需要跳轉(zhuǎn)到哪個地址進行處理,這個地址叫做 中斷向量表
舉個例子,使用編號 8 表示按鍵中斷類型A的識別碼,編號 9 表示中斷類型 B 的識別碼。當(dāng)中斷發(fā)生的時候,對于CPU而言,是需要知道到底讓 PC 指針指向哪個地址,這個地址就是中斷向量
假設(shè)我們設(shè)置了 255 個中斷,編號為 0 - 255,在 32 位機器中差不多需要 1k 的內(nèi)存地址存儲中斷向量,這里的 1k 空間就是中斷向量表。
因此,當(dāng) CPU 接收到中斷,根據(jù)中斷類型操作 PC 指針,找到中斷向量,修改中斷向量,插入指令實現(xiàn)跳轉(zhuǎn)功能
進程和線程都出現(xiàn)了,那么怎么調(diào)度?
計算機資源有限,太多的進程消耗機器自然受不住,我們?nèi)艘惨粯?,胃也有限嘛,一頓不吃餓得慌,可是吃多了也會走路腳顫抖不是,所以聰明的計算機也會想辦法來處理這個問題。兩手一揮,既然我們的 CPU 的核數(shù)有限,要不咋們給每個進程分配一個時間片,排隊一個個執(zhí)行,超出給定的時間就直接讓另一個進程執(zhí)行如何
那時間片怎么分配?
假設(shè)此時有三個進程,進程1只需要 2 個時間片,進程2需要1個時間片,進程3需要3個時間片。進程1執(zhí)行到一半的時候,累了,不想執(zhí)行了,休息會(掛起),進程2執(zhí)行,進程2一梭子就執(zhí)行完了,進程3等不及了馬上執(zhí)行,執(zhí)行三分之一后,進程1開始執(zhí)行,這樣循環(huán)根據(jù)時間片的執(zhí)行方式即分時技術(shù)

剛才有說到進程的狀態(tài),那么有哪些狀態(tài)?
一個進程的周期一般會分為下面三種狀態(tài)
-
就緒狀態(tài):進程創(chuàng)建好了會開始排隊,這個時候叫做“就緒狀態(tài)”
-
運行狀態(tài):當(dāng)一切準(zhǔn)備就緒,天時地利人和后開始執(zhí)行,此時為“運行狀態(tài)”
-
如果將時間片用完了會再次變?yōu)榫途w狀態(tài)

如果進程因為等待某個進程的完成,此時會進入阻塞狀態(tài)

為什么需要阻塞狀態(tài)
我們想想,有的時候計算機會因為各種原因不能響應(yīng)我們的請求,可能是因為等待磁盤,可能因為等待打印機,畢竟不會總是的及時的滿足我們的需求,所以它這個時候通過中斷告訴 CPU ,CPU 通過執(zhí)行中斷處理程序,將控制權(quán)給操作系統(tǒng),操作系統(tǒng)隨后將阻塞的進程狀態(tài)修改為就緒狀態(tài),安排重新排隊,再加上因為進程進入阻塞狀態(tài)無事可做,但是又不能干癟癟的讓他去排隊(因為需要等待中斷),所以進入到阻塞狀態(tài)。
下面對以上所說的三種狀態(tài)進行一個小結(jié)
-
就緒狀態(tài)( Ready ):可運行,只不過其他進程在運行暫時停止
-
運行( Running):此時進程占用 CPU
-
阻塞狀態(tài)( blo ck ): 此時可能因為等待相關(guān)事件(請求 IO/等待 IO 完成等) 而停止運行,此時即使把 CPU 控制權(quán)給它,仍然無法運行
其實,進程還有兩種基本狀態(tài)
-
創(chuàng)建狀態(tài) ( New ):進程剛被創(chuàng)建還沒有提交時的狀態(tài),主要功能為分配和建立進程控制塊等初始化工作。創(chuàng)建進程有兩個階段,第一個階段為為新的進程創(chuàng)建必要的管理信息。第二個階段為讓進程進入就緒狀態(tài)
-
終止?fàn)顟B(tài) ( Exit ):進程退出的狀態(tài),即回收除了進程控制塊以外的資源。也分為兩個階段,第一個階段為等待操作系統(tǒng)進行善后處理,第二個階段為釋放主存
所以一共就包含了五個狀態(tài),為了更加直觀,其變遷圖如下

-
Null---->創(chuàng)建狀態(tài):最初創(chuàng)建的第一個狀態(tài)
-
創(chuàng)建狀態(tài)----->就緒狀態(tài):進行一些列的初始化稱為就緒狀態(tài)
-
就緒狀態(tài)----->運行狀態(tài):當(dāng)操作系統(tǒng)調(diào)度就緒狀態(tài)的進程并分配給 CPU 變?yōu)檫\行狀態(tài)
-
運行狀態(tài)------>結(jié)束狀態(tài):當(dāng)進程完成相應(yīng)任務(wù)或出錯則被操作系統(tǒng)結(jié)束的狀態(tài)
-
運行狀態(tài)------>阻塞狀態(tài):運行狀態(tài)的進程由于時間片用完,操作系統(tǒng)將進程更改為就緒狀態(tài)
-
阻塞狀態(tài)------->就緒狀態(tài):阻塞狀態(tài)的進程等待某事件結(jié)束進入就緒狀態(tài)
其實不是賣光子,實際上還有兩種狀態(tài),分別是就緒掛起和阻塞掛起,那我們看看那這兩者有啥不一樣
-
掛起是一種行為,而阻塞是進程的狀態(tài)
-
導(dǎo)致進程掛起的原因通常是因為內(nèi)存不足或者用戶的請求,進程的修改等,而進程的阻塞是進程正在等待某個事件發(fā)生,可能是等待資源或響應(yīng)
-
掛起對應(yīng)的是行為的激活,將外存中的進程掉入內(nèi)存中,而處于阻塞狀態(tài)的進程需要等待其他進程或系統(tǒng)喚醒
-
掛起屬于被動行為,進程被迫從內(nèi)存轉(zhuǎn)移到外存,而進入阻塞為主動的行為
綜上,現(xiàn)在咋們的進程圖就變?yōu)榱似叻N狀態(tài),如下

進程與線程的底層原理
上面我們了解了進程,線程的由來以及狀態(tài)變遷,但是顯然不能讓我自如的了解進程和線程,至于其如何在內(nèi)存表示等問題還是比較空虛的,所以我們繼續(xù)往下看
進程和線程在內(nèi)存中如何表示
在整個設(shè)計過程中,涉及了兩張表,分別是進程表和線程表。其中進程表會記錄進程在內(nèi)存的位置,PID是多少,以及當(dāng)前什么狀態(tài),內(nèi)存給它分配了多大使用空間以及屬于哪個用戶,假設(shè)沒有這張表,操作系統(tǒng)就不知道有哪些進程,也就更不清楚怎么去調(diào)度,就仿佛失去XXX,不知道了方向

尤其需要注意進程表這樣幾個部分
-
資源信息
資源信息會記錄這個進程有哪些資源,比如進程和虛擬內(nèi)存怎么映射,擁有哪些文件等
-
內(nèi)存布局
內(nèi)存的知識點太多,如果在這里寫文章將會非常的長,所以打算單獨使用一篇文章寫。
在 Linux 中,操作系統(tǒng)采用虛擬內(nèi)存管理技術(shù),使得進程都擁有獨立的虛擬內(nèi)存空間,理由也比較直接,物理內(nèi)存不夠用且不安全(用戶不能直接訪問物理內(nèi)存),使用虛擬內(nèi)存不但更安全且可以使用比物理內(nèi)存更大的地址空間。
另外,在 32 位的操作系統(tǒng)中,4GB 的進程地址空間分為兩個部分,用戶空間和內(nèi)核空間,用戶空間為 0~3G,內(nèi)核地址空間占據(jù) 3~4G,用戶不能直接操作內(nèi)核空間虛擬地址,只有通過系統(tǒng)調(diào)用的方式訪問內(nèi)核空間。
操作系統(tǒng)會告訴進程如何使用內(nèi)存,大概分為哪些區(qū)域以及每個區(qū)域做什么。簡單描述下下圖各個段的作用。
-
棧:系統(tǒng)自動分配釋放,平時經(jīng)常使用的函數(shù)參數(shù)值,局部變量,返回地址等就在此
-
堆:存放動態(tài)分配的數(shù)據(jù),通常由開發(fā)人員自行管理,如果開發(fā)人員使用后不釋放,那么程序結(jié)束后可能會被操作系統(tǒng)收回
-
數(shù)據(jù)段:存放的是全局變量和靜態(tài)變量。其中初始化數(shù)據(jù)段(.data)存放顯示初始化的全局變量和靜態(tài)變量,未初始化數(shù)據(jù)段,此段通常也被稱為BSS段(.bss),存放未進行顯示初始化的全局變量和靜態(tài)變量。

-
描述信息
描述信息包含進程的唯一識別號,進程的名稱以及用戶等
除了給進程安排一張表以外,給線程也安排了一張表,這就是線程表。線程表也包含了一個 ID,這 ID 叫做 ThreadID,同時也會記錄自己在不同階段的狀態(tài),比如阻塞,運行,就緒。由于多個線程會共用 CPU 且需要不停的切換,所以需要記錄程序計數(shù)器和寄存器的值。
說到了用戶級的線程和內(nèi)核級的線程,兩者又是怎么個親密關(guān)系
兩者映射的關(guān)系如何去表示
可以想像在內(nèi)核中有一個線程池,給予用戶空間使用,每次用戶級線程把程序計數(shù)器等傳遞過去,執(zhí)行結(jié)束后,內(nèi)核線程不銷毀,等待下一個任務(wù),從這里可以看出創(chuàng)建進程開銷大、成本高;創(chuàng)建線程開銷小,成本低。
這么多進程難道共用內(nèi)存?
操作系統(tǒng)太多的進程,為了讓他們各司其職,互不干擾,考慮為他們分配完全隔離的內(nèi)存區(qū)域,即使程序內(nèi)部讀取相同的內(nèi)存地址,但實際上他們的物理地址也不一樣。就仿佛我在 X 座的 501 和你在 Y 座的501一樣卻不是一個房子,這就是地址空間
所以在正常的情況下 A 進程不能訪問 B 進程的內(nèi)存,除非你植入一個木馬,惡意操作 B 進程的內(nèi)存或者通過我們后面說的進程間通信的方式進行訪問
那進程線程怎么切換的呢?
操作系統(tǒng)的大量進程需要來回的切換,保持有借有還再借不難的傳統(tǒng)美德,每次切換之前需要先記錄下當(dāng)前寄存器值的內(nèi)存地址,方便下次回到原位置繼續(xù)執(zhí)行?;謴?fù)執(zhí)行的時候就從內(nèi)存中讀取,然后恢復(fù)狀態(tài)執(zhí)行即可

為了詳細的讓大家理解這個過程,我將其拆分為下面幾個步驟
-
操作系統(tǒng)感知到有個進程需要切換,先發(fā)出一個中斷信號給 CPU ,讓其停止當(dāng)前進程
-
CPU 收到中斷信號后,正在執(zhí)行的進程會停止,好心的操作系統(tǒng)會想辦法先保存當(dāng)前的狀態(tài)
-
操作系統(tǒng)接管中斷后,執(zhí)行一段匯編程序幫助寄存器之前進程的狀態(tài)
-
當(dāng)操作系統(tǒng)保存好狀態(tài)后就會執(zhí)行調(diào)度程序,讓其決定下一個將要執(zhí)行的進程
-
最后操作系統(tǒng)會執(zhí)行下一個進程

中斷以后如何恢復(fù)之前進程運行呢
上面說到操作系統(tǒng)會執(zhí)行一段代碼幫助進程恢復(fù)狀態(tài),其實現(xiàn)方式中,有一種方式即通過棧的先進后出的數(shù)據(jù)結(jié)構(gòu),所以對吧,大學(xué)中的基礎(chǔ)課程真的好重要。
進程(線程)中斷后,操作系統(tǒng)負責(zé)壓棧關(guān)鍵數(shù)據(jù)(比如寄存器)?;謴?fù)執(zhí)行時,操作系統(tǒng)負責(zé)出棧和恢復(fù)寄存器的值。
協(xié)程
第一次接觸協(xié)程是一次自動駕駛項目中,一起干活的同事說這個庫底層使用了協(xié)程,我一臉懵逼,???攜程?準(zhǔn)備收拾行李回家了?半天想過來了,其有個底層庫使用了協(xié)程,當(dāng)時還一臉懵逼,進程,線程就已經(jīng)夠折騰人了,怎么又來個協(xié)程,當(dāng)時想著到時候面試官是不是又多了問問題的思路
-
什么是協(xié)程
-
協(xié)程和進程,線程的區(qū)別是什么
-
協(xié)程有什么優(yōu)缺點
你們說頭不禿怎么破?行嘛,為了生活,不,喜愛計算機,止不住學(xué)習(xí)的步伐,下面我們看看這個東西是什么
為什么需要協(xié)程?
我們在執(zhí)行多任務(wù)的時候通常采用多線程的方式并發(fā)執(zhí)行。我們以最近非?;馃岬碾娚檀黉N茅臺為例,不管茅臺是在緩存中還是后端的數(shù)據(jù),最開始的用戶也就是10個,每當(dāng)收到10條付款信息就開啟10個線程去查詢數(shù)據(jù)庫,此時用戶量少,馬上就可返回,第二天增加到100人,使用100個線程去查詢,感覺確實效果不錯,加大促銷力度,當(dāng)同時出現(xiàn)1000個人的時候感覺到有點吃力了

1000-10000,看了前面的內(nèi)容應(yīng)該清楚創(chuàng)建銷毀線程還是挺費資源的,假設(shè)每個線程占用 4M內(nèi)存空間,那么10000個線程大概需要消耗 39G 內(nèi)存,可是服務(wù)器也就 8G 內(nèi)存。
此時的方案要么增加服務(wù)器要么提升代碼效率。多個線程在進行作業(yè)的時候,難免會遇到某個線程等待 IO 的情況,此時會阻塞當(dāng)前線程切換到其他線程,使得其他線程照常執(zhí)行,線程少的時候沒什么問題,當(dāng)線程數(shù)量變多就會出現(xiàn)問題,線程數(shù)量的增加不僅占用非常多的內(nèi)存空間且過多的線程的切換也會占用大量的系統(tǒng)時間

此時就可以通過協(xié)程的方式解決這個問題
協(xié)程運行在線程之上,協(xié)程執(zhí)行完成后,可以選擇主動讓出,讓另一個協(xié)程運行在當(dāng)前線程之上。即協(xié)程并沒有增加線程的數(shù)量,而是在線程的基礎(chǔ)上通過分時復(fù)用的方式運行多個協(xié)程,還有關(guān)鍵一點是它的切換發(fā)生在用戶態(tài),所有也不存在用戶態(tài)到內(nèi)核態(tài)的切換,代價更低

類比上面,我們只需要啟動 100 個線程,然后每個線程跑100個協(xié)程就可以完成上述同時處理10000個任務(wù)
那么協(xié)程在使用的過程中需要主要哪些內(nèi)容呢
剛說協(xié)程運行于線程之上,如果線程等待 IO 的時候阻塞了,這時候會出現(xiàn)什么情況?其實操作系統(tǒng)主要關(guān)心線程,協(xié)程調(diào)用阻塞IO的時候,操作系統(tǒng)會讓進程處于阻塞狀態(tài),此時當(dāng)前的協(xié)程和綁定在線程之上的協(xié)程都會陷入阻塞而得不到調(diào)度,這樣就很難受了
因此協(xié)程中,不能調(diào)用導(dǎo)致線程阻塞的操作,即協(xié)程最好了異步 IO 結(jié)合起來才能發(fā)揮最大的威力
怎么處理在協(xié)程中調(diào)用阻塞IO的操作呢
-
比較簡答的思路是當(dāng)調(diào)用阻塞 IO 的時候,重新啟動一個線程去執(zhí)行這個操作,等執(zhí)行完成后,協(xié)程再去讀取結(jié)果,這是不是和多線程很像
-
將系統(tǒng) IO 進行封裝,改為異步調(diào)用的方式,此時需要大量的工作,所以需要寄生于編程語言的原生支持
所以對于計算密集型的任務(wù)不太建議使用協(xié)程,計算機密集型的任務(wù)需要大量的線程切換,線程切換涉及太多的資源交換
總結(jié)
線程進程涉及的知識點好復(fù)雜,本文包含了線程,進程是什么,兩者的區(qū)別,內(nèi)核級線程與用戶態(tài)線程,線程進程的上下文切換,系統(tǒng)調(diào)用的過程等一系列知識點,并沒有對進程的調(diào)度等做詳細的介紹,自己還需要多多補充知識。
不知不覺中這篇文章從素材的確認(rèn),關(guān)鍵字的過濾,上下文的銜接,畫圖,算下來差不多兩周,不過在這個過程確實學(xué)習(xí)了不少新的知識點。
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!