當前位置:首頁 > 公眾號精選 > CPP開發(fā)者
[導讀]一、前言這篇文章來聊聊大名鼎鼎的GDB,它的豪門背景咱就不提了,和它的兄弟GCC一樣是含著金鑰匙出生的,在GNU的家族中的地位不可撼動。相信每位嵌入式開發(fā)工程師都使用過gdb來調(diào)試程序,如果你說沒有用過,那只能說明你的開發(fā)經(jīng)歷還不夠坎坷,還需要繼續(xù)被BUG吊打。我們都知道,在使用...

一、前言

這篇文章來聊聊大名鼎鼎的GDB,它的豪門背景咱就不提了,和它的兄弟GCC一樣是含著金鑰匙出生的,在GNU的家族中的地位不可撼動。相信每位嵌入式開發(fā)工程師都使用過gdb來調(diào)試程序,如果你說沒有用過,那只能說明你的開發(fā)經(jīng)歷還不夠坎坷,還需要繼續(xù)被 BUG吊打。

我們都知道,在使用gcc編譯時,可以使用-g選項在可執(zhí)行文件中嵌入更多的調(diào)試信息,那么具體嵌入了哪些調(diào)試信息?這些調(diào)試信息是如何與二進制的指令之間進行相互交互?在調(diào)試的時候,調(diào)試信息中是如何獲取函數(shù)調(diào)用棧中的上下文信息?

針對上面這些疑惑,道哥用兩篇文章把這些底層最深處的問題徹底描述清楚,讓你一次看過癮。

第一篇文章,就是當前這一篇,主要內(nèi)容是介紹GDB的底層調(diào)試原理,我們來看一下GDB是通過什么機制來控制被調(diào)試程序的執(zhí)行順序。

第二篇文章,我們選擇一個體積小巧、五臟俱全的LUA語言來進行剖析,從源代碼分析到函數(shù)調(diào)用棧,從指令集到調(diào)試庫的修改,一網(wǎng)打盡。

內(nèi)容比較多,看完本文需要的時間可能長一些,為了您的健康,不建議在處于蹲姿的時候閱讀這篇文章。

二、GDB調(diào)試模型

GDB調(diào)試包括2個程序:gdb程序和被調(diào)試程序。根據(jù)這2個程序是否運行在同一臺電腦中,可以把GDB的調(diào)試模型分為2種:

  1. 本地調(diào)試
  2. 遠程調(diào)試
本地調(diào)試:調(diào)試程序和被調(diào)試程序運行在同一臺電腦中。

遠程調(diào)試:調(diào)試程序運行在一臺電腦中,被調(diào)試程序運行在另一臺電腦中。

關(guān)于可視化調(diào)試程序并不是重點,它只是一個用來封裝GDB的外殼而已。我們既可以用黑乎乎的終端窗口來手動輸入調(diào)試命令;也可以選擇集成開發(fā)環(huán)境(IDE),這個IDE中已經(jīng)嵌入了器調(diào)試,這樣就可以使用各種button來代替手動輸入調(diào)試命令了。

與本地調(diào)試相比,遠程調(diào)試中多了一個GdbServer程序,它和目標程序都是運行在目標機中,可能是一臺x86電腦或者是一個ARM板子。圖中的紅線表示GDB與GdbServer之間通過網(wǎng)絡(luò)或者串口進行通訊。既然是通訊,那么肯定需要一套通訊協(xié)議:RSP協(xié)議,全稱是:GDB Remote Serial Protocol(GDB遠程通信協(xié)議)。

關(guān)于通訊協(xié)議的具體格式和內(nèi)容,我們不需要關(guān)心,只需要知道:它們都是字符串,有固定的開始字符('$')和結(jié)束字符('#'),最后還有兩個十六進制的ASCII字符作為校驗和,了解這么多就足夠了。至于更多的細節(jié),如果實在閑的XX可以瞄幾眼,其實這些協(xié)議,就像社會中各種奇葩的規(guī)定一樣,都是一幫磚家在廁所里想出來的。

在第二篇講解LUA的文章中,我們會實現(xiàn)一個類似的遠程調(diào)試原型。其中的通信協(xié)議也是字符串,直接把 HTTP 協(xié)議進行簡化之后就拿過來使用了,十分清晰、方便。

三、GDB調(diào)試指令

為了完整性,這里把部分GDB調(diào)試指令貼一下,有感性認識即可。

另外,這里沒有列舉所有的指令,列出的指令都是常用的,比較容易理解。在講解LUA的時候,我們會選擇其中的某些指令進行詳細的對比,包括底層的實現(xiàn)機制。

每一個調(diào)試指令都有很多的命令選項,例如斷點相關(guān)的就包括:設(shè)置斷點、刪除斷點、條件斷點、臨時停用啟用等等。這篇文章的重點是理解gdb底層的調(diào)試機制,所以應(yīng)用層的這些指令的使用方法就不再列出了,網(wǎng)絡(luò)上的資源很多。

四、GDB與被調(diào)試程序之間的關(guān)系

為了方便描述,先寫一個最最簡單的C程序:

#include
int main(int argc, char *argv[]){ int a = 1; int b = 2; int c = a b; printf("c = %d \n", c); return 0;}
編譯命令:

$ gcc -g test.c -o test

我們對可執(zhí)行程序 test 進行調(diào)試,輸入命令:

$ gdb ./test

輸出如下:

在最后一行可以看到光標在閃爍,這是gdb程序在等著我們給它下達調(diào)試命令呢。

當上面這個黑乎乎的終端窗口在執(zhí)行g(shù)db ./test的時候,在操作系統(tǒng)里發(fā)生了很多復雜的事情:

系統(tǒng)首先會啟動gdb進程,這個進程會調(diào)用系統(tǒng)函數(shù)fork()來創(chuàng)建一個子進程,這個子進程做兩件事情:

  1. 調(diào)用系統(tǒng)函數(shù)ptrace(PTRACE_TRACEME,[其他參數(shù)]);
  2. 通過execc來加載、執(zhí)行可執(zhí)行程序test,那么test程序就在這個子進程中開始執(zhí)行了。
補充一點:文中有時稱之程序,有時稱之進程。“程序”描述的是一個靜態(tài)的概念,就是一堆數(shù)據(jù)躺著硬盤上,而“進程”描述的是動態(tài)的過程,是這個程序被讀取、加載到內(nèi)存上之后,在操作系統(tǒng)中有一個任務(wù)控制塊(一個數(shù)據(jù)結(jié)構(gòu)),專門用來管理這個進程的。

鋪墊了半天,終于輪到主角登場了,那就是系統(tǒng)調(diào)用函數(shù)ptrace(其中的參數(shù)后面會解釋),正是在它的幫助下,gdb才擁有了強大的調(diào)試能力。函數(shù)原型是:

#include long?ptrace(enum?__ptrace_request?request,?pid_t?pid,?void?*addr,?void?*data);我們先來看一下 man 中對這個函數(shù)的簡介:

tracer就是調(diào)試程序,可以理解為gdb程序;tracee就是被調(diào)試程序,對應(yīng)于圖中的目標程序test。一般喜歡用-er和-ee來表示主動和被動的關(guān)系,例如:employer就是雇主(老板),employee就是苦逼的被雇傭者(打工人)。

ptrace系統(tǒng)函數(shù)是Linux內(nèi)核提供的一個用于進程跟蹤的系統(tǒng)調(diào)用,通過它,一個進程(gdb)可以讀寫另外一個進程(test)的指令空間、數(shù)據(jù)空間、堆棧和寄存器的值。而且gdb進程接管了test進程的所有信號,也就是說系統(tǒng)向test進程發(fā)送的所有信號,都被gdb進程接收到,這樣一來,test進程的執(zhí)行就被gdb控制了,從而達到調(diào)試的目的。

也就是說,如果沒有g(shù)db調(diào)試,操作系統(tǒng)與目標進程之間是直接交互的;如果使用gdb來調(diào)試程序,那么操作系統(tǒng)發(fā)送給目標進程的信號就會被gdb截獲,gdb根據(jù)信號的屬性來決定:在繼續(xù)運行目標程序時是否把當前截獲的信號轉(zhuǎn)交給目標程序,如此一來,目標程序就在gdb發(fā)來的信號指揮下進行相應(yīng)的動作。

五、GDB如何調(diào)試已經(jīng)執(zhí)行的服務(wù)進程

是否有小伙伴會提出這樣一個疑問:上面被調(diào)試的程序test是從頭開始執(zhí)行的,是否可以用gdb來調(diào)試一個已經(jīng)處于執(zhí)行中的服務(wù)進程呢?答曰:可以。這就涉及到ptrace系統(tǒng)函數(shù)的第一個參數(shù)了,這個參數(shù)是一個枚舉類型的值,其中重要的是2個:PTRACE_TRACEME和PTRACE_ATTACH<。

在上面的講解中,子進程在調(diào)用ptrace系統(tǒng)函數(shù)時使用的參數(shù)是PTRACE_TRACEME,注意橙色文字:是子進程調(diào)用ptrace,相當于子進程對操作系統(tǒng)說:gdb進程是我的爸爸,以后你有任何想發(fā)給我的信號,請直接發(fā)給gdb進程吧!

如果想對一個已經(jīng)執(zhí)行的進程B進行調(diào)試,那么就要在gdb這個父進程中調(diào)用ptrace(PTRACE_ATTACH,[其他參數(shù)]),此時,gdb進程會attach(綁定)到已經(jīng)執(zhí)行的進程B,gdb把進程B收養(yǎng)成為自己的子進程,而子進程B的行為等同于它進行了一次 PTRACE_TRACEME操作。此時gdb進程會發(fā)送SIGSTO信號給子進程B,子進程B接收到SIGSTOP信號后,就會暫停執(zhí)行進入TASK_STOPED狀態(tài),表示自己準備好被調(diào)試了。

所以,不論是調(diào)試一個新程序,還是調(diào)試一個已經(jīng)處于執(zhí)行中狀態(tài)的服務(wù)程序,通過ptrace系統(tǒng)調(diào)用,最終的結(jié)果都是:gdb程序是父進程,被調(diào)試程序是子進程,子進程的所有信號都被父進程gdb來接管,并且父進程gdb可查看、修改子進程的內(nèi)部信息,包括:堆棧、寄存器等。

關(guān)于綁定,有幾個限制需要了解一下:不予許自我綁定,不允許多次綁定到同一個進程,不允許綁定1號進程。

六、偷窺GDB如何實現(xiàn)斷點指令

大道理已經(jīng)講完了,這里我們通過設(shè)置斷點(break)這個調(diào)試指令,來偷窺一下 gdb 內(nèi)部的調(diào)試機制。還是以上面的代碼為例子,這里再重新貼一下代碼:

#include
int main(int argc, char *argv[]){ int a = 1; int b = 2; int c = a b; printf("c = %d \n", c); return 0;}
來看一下編譯出來的反匯編代碼是什么樣的,編譯指令:

gcc -S test.c; cat test.S)

這里只貼了一部分反匯編代碼,只要能說明底層的原理就達到我們的目的了。

上面說到,在執(zhí)行g(shù)db ./test之后,gdb就會fork出一個子進程,這個子進程首先調(diào)用ptrace然后執(zhí)test程序,這樣就準備好調(diào)試環(huán)境了。

我們把源碼和匯編代碼放在一起,方便理解:

在調(diào)試窗口輸入設(shè)置斷點指令“break 5”,此時gdb做2件事情:

  1. 對第5行源碼所對應(yīng)的第10行匯編代碼存儲到斷點鏈表中
  2. 在匯編代碼的第10行,插入中斷指令I(lǐng)NT3,也就是說:匯編代碼中的第10行被替換為INT3
然后,在調(diào)試窗口繼續(xù)輸入執(zhí)行指令“run”(一直執(zhí)行,直到遇到斷點就暫停),匯編代碼中PC指針(一個內(nèi)部指針,指向即將執(zhí)行的那行代碼)執(zhí)行第10行時,發(fā)現(xiàn)是INT3指令,于是操作系統(tǒng)就發(fā)送一個SIGTRAP信號給test進程。

此刻,第10行匯編代碼被執(zhí)行過了,PC指針就指向第11行了。

上面已經(jīng)說過,操作系統(tǒng)發(fā)給test的任何信號,都被gdb接管了,也就是說gdb會首先接收到這SIGTRAP個信號,gdb發(fā)現(xiàn)當前匯編代碼執(zhí)行的是第10行,于是到斷點鏈表中查找,發(fā)現(xiàn)鏈表中存儲了第10行的代碼,說明第10行被設(shè)置了斷點。于是gdb又做了2個操作:

  1. 把匯編代碼中的第10行"INT3"替換為斷點鏈表中原來的代碼。
? 2.?把 PC 指針回退一步,也即是設(shè)置為指向第10 行。


然后,gdb繼續(xù)等待用戶的調(diào)試指令。

此刻,就相當于下一條執(zhí)行的指令是匯編代碼中的第10行,也就是源碼中的第5行。從我們調(diào)試者角度看,就是被調(diào)試程序在第5行斷點處暫停了下來,此時我們可以繼續(xù)輸入其他調(diào)試指令來debug,比如:查看變量值、查看堆棧信息、修改局部變量的值等等。

七、偷窺GDB如何實現(xiàn)單步指令next

還是以剛才的源代碼和匯編代碼為例,假設(shè)此時程序停止在源碼的第6行,即匯編代碼的第11行:

在調(diào)試窗口輸入單步執(zhí)行指令next,我們的目的是執(zhí)行一行代碼,也就是把源碼中第6行代碼執(zhí)行完,然后停止在第7行。gdb在接收到next執(zhí)行時,會計算出第7行源碼,應(yīng)該對應(yīng)到匯編代碼的第14行,于是gdb就控制匯編代碼中的PC指針一直執(zhí)行,直到第13行執(zhí)行結(jié)束,也就是PC指向第14行時,就停止下來,然后繼續(xù)等待用戶輸入調(diào)試指令。

八、總結(jié)

通過break和next這2個調(diào)試指令,我們已經(jīng)明白了gdb中是如何處理調(diào)試指令。當然,gdb中的調(diào)試指令還有很多,包括更復雜的獲取堆棧信息、修改變量的值等等,有興趣的小伙伴可以繼續(xù)深入跟蹤。

后面我在寫LUA語言中的調(diào)試庫時,會更深入、詳細的討論這個問題,畢竟LUA語言更小巧、簡單。我也會把LUA代碼中如何設(shè)置PC指針的代碼部分給小伙伴演示一下,這樣我們對于一門編程語言的內(nèi)部實現(xiàn)就會有更好的理解和掌握,也可能會錄制一個視頻,這樣就能更好的講解LUA語言中的內(nèi)部細節(jié)。


- EOF -

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉