從語法上來說C語言并不復(fù)雜, 但編寫優(yōu)質(zhì)可靠的嵌入式C程序并非易事,不僅需要熟知硬件特性和缺陷,還需要對編譯原理和計算機技術(shù)知識有著一定的了解。
本文以嵌入式實踐為基礎(chǔ),再結(jié)合相關(guān)資料, 闡述嵌入式需要了解的C語言知識和重點,希望每個讀到這篇文章的人都能有所收獲。
關(guān)鍵字
關(guān)鍵字是C語言中具有特殊功能的保留標示符,按照功能可分為
1). 數(shù)據(jù)類型(常用char, short, int, long, unsigned, float, double)
2). 運算和表達式( =, +, -, *, while, do-while, if, goto, switch-case)
3). 數(shù)據(jù)存儲(auto, static, extern,const, register,volatile,restricted),
4). 結(jié)構(gòu)(struct, enum, union,typedef),
5). 位操作和邏輯運算(<<, >>, &, |, ~,^, &&),
6). 預(yù)處理(#define, #include, #error,#if...#elif...#else...#endif等),
7). 平臺擴展關(guān)鍵字(__asm, __inline,__syscall)
這些關(guān)鍵字共同構(gòu)成了嵌入式平臺的C語法。
嵌入式的應(yīng)用從邏輯上可以抽象為三個部分:
1). 數(shù)據(jù)的輸入(如傳感器,信號,接口輸入),
2). 數(shù)據(jù)的處理(如協(xié)議的解碼和封包,AD采樣值的轉(zhuǎn)換等)
3). 數(shù)據(jù)的輸出(GUI的顯示,輸出的引腳狀態(tài),DA的輸出控制電壓,PWM波的占空比等),
對于數(shù)據(jù)的管理就貫穿著整個嵌入式應(yīng)用的開發(fā),它包含數(shù)據(jù)類型,存儲空間管理,位和邏輯操作,以及數(shù)據(jù)結(jié)構(gòu),C語言從語法上支撐上述功能的實現(xiàn),并提供相應(yīng)的優(yōu)化機制,以應(yīng)對嵌入式下更受限的資源環(huán)境。
數(shù)據(jù)類型
C語言支持常用的字符型,整型,浮點型變量,有些編譯器如keil還擴展支持bit(位)和sfr(寄存器)等數(shù)據(jù)類型來滿足特殊的地址操作。C語言只規(guī)定了每種基本數(shù)據(jù)類型的最小取值范圍,因此在不同芯片平臺上相同類型可能占用不同長度的存儲空間,這就需要在代碼實現(xiàn)時考慮后續(xù)移植的兼容性,而C語言提供的typedef就是用于處理這種情況的關(guān)鍵字,在大部分支持跨平臺的軟件項目中被采用,典型的如下:
typedef unsigned char uint8_t;
typedef unsigned short uint16_t;
typedef unsigned int uint32_t;
typedef signed int int32_t;
既然不同平臺的基本數(shù)據(jù)寬度不同,那么如何確定當前平臺的基礎(chǔ)數(shù)據(jù)類型如int的寬度,這就需要C語言提供的接口sizeof,實現(xiàn)如下。
printf("int size:%d, short size:%d, char size:%d\n", sizeof(int), sizeof(char), sizeof(short));
printf("point p size:%d\n", sizeof(p));
其實這就和芯片的可尋址寬度有關(guān),如32位MCU的寬度就是4,64位MCU的寬度就是8,在有些時候這也是查看MCU位寬比較簡單的方式。
內(nèi)存管理和存儲架構(gòu)
C語言允許程序變量在定義時就確定內(nèi)存地址,通過作用域,以及關(guān)鍵字extern,static,實現(xiàn)了精細的處理機制,按照在硬件的區(qū)域不同,內(nèi)存分配有三種方式(節(jié)選自C++高質(zhì)量編程):
1). 從靜態(tài)存儲區(qū)域分配。內(nèi)存在程序編譯的時候就已經(jīng)分配好,這塊內(nèi)存在程序的整個運行期間都存在。例如全局變量,static 變量。
2). 在棧上創(chuàng)建。在執(zhí)行函數(shù)時,函數(shù)內(nèi)局部變量的存儲單元都可以在棧上創(chuàng)建,函數(shù)執(zhí)行結(jié)束時這些存儲單元自動被釋放。棧內(nèi)存分配運算內(nèi)置于處理器的指令集中 ,效率很高,但是分配的內(nèi)存容量有限。
3). 從堆上分配,亦稱動態(tài)內(nèi)存分配。程序在運行的時候用 malloc 或 new 申請任意多少的內(nèi)存,程序員自己負責在何時用 free 或 delete 釋放內(nèi)存。動態(tài)內(nèi)存的生存期由程序員決定,使用非常靈活,但同時遇到問題也最多。
//main.c#include <stdio.h>#include <stdlib.h>
static int st_val; //靜態(tài)全局變量 -- 靜態(tài)存儲區(qū)
int ex_val; //全局變量 -- 靜態(tài)存儲區(qū)int main(void)
int a = 0; //局部變量 -- 棧上申請
static int local_st_val = 0; //靜態(tài)變量
ptr = (int *)malloc(sizeof(int)); //從堆上申請空間
printf("*p value:%d", *ptr);
//free后需要將ptr置空,否則會導(dǎo)致后續(xù)ptr的校驗失效,出現(xiàn)野指針
C語言的作用域不僅描述了標識符的可訪問的區(qū)域,其實也規(guī)定了變量的存儲區(qū)域,在文件作用域的變量st_val和ex_val被分配到靜態(tài)存儲區(qū),其中static關(guān)鍵字主要限定變量能否被其它文件訪問,而代碼塊作用域中的變量a, ptr和local_st_val則要根據(jù)類型的不同,分配到不同的區(qū)域,其中a是局部變量,被分配到棧中,ptr作為指針,由malloc分配空間,因此定義在堆中,而local_st_val則被關(guān)鍵字限定,表示分配到靜態(tài)存儲區(qū),這里就涉及到重要知識點,static在文件作用域和代碼塊作用域的意義是不同的:在文件作用域用于限定函數(shù)和變量的外部鏈接性(能否被其它文件訪問), 在代碼塊作用域則用于將變量分配到靜態(tài)存儲區(qū)。
對于C語言,如果理解上述知識對于內(nèi)存管理基本就足夠,但對于嵌入式C來說,定義一個變量,它不一定在內(nèi)存(SRAM)中,也有可能在FLASH空間,或直接由寄存器存儲(register定義變量或者高優(yōu)化等級下的部分局部變量),如定義為const的全局變量定義在FLASH中,定義為register的局部變量會被優(yōu)化到直接放在通用寄存器中,在優(yōu)化運行速度,或者存儲受限時,理解這部分知識對于代碼的維護就很有意義。此外,嵌入式C語言的編譯器中會擴展內(nèi)存管理機制,如支持分散加載機制和__attribute__((section("用戶定義區(qū)域"))),允許指定變量存儲在特殊的區(qū)域如(SDRAM, SQI FLASH), 這強化了對內(nèi)存的管理,以適應(yīng)復(fù)雜的應(yīng)用環(huán)境場景和需求。
LD_ROM 0x00800000 0x10000 { ;load region size_region
EX_ROM 0x00800000 0x10000 { ;load address = execution address
*.o (RESET, +First)
*(InRoot$$Sections)
.ANY (+RO)
}
EX_RAM 0x20000000 0xC000 { ;rw Data
.ANY (+RW +ZI)
}
EX_RAM1 0x2000C000 0x2000 {
.ANY(MySection)
}
EX_RAM2 0x40000000 0x20000{
.ANY(Sdram)
}
}
int a[10] __attribute__((section("Mysection")));
int b[100] __attribute__((section("Sdram")));
采用
這種方式,我們就可以將變量指定到需要的區(qū)域,這在某些情況下
必須的,如做GUI或者網(wǎng)頁時因為要存儲大量圖片和文檔,內(nèi)部FLASH空間可能不足,這時就可以將變量聲明到外部區(qū)域,另外內(nèi)存中某些部分的數(shù)據(jù)比較重要,為了避免被其它內(nèi)容覆蓋,可能需要單獨劃分SRAM區(qū)域,避免被誤修改導(dǎo)致致命性的錯誤,這些經(jīng)驗在實際的產(chǎn)品開發(fā)中是常用且重要,不過因為篇幅原因,這里只簡略的提供例子,如果工作中遇到這種需求,建議詳細去了解下。
至于堆的使用,對于嵌入式Linux來說,使用起來和標準C語言一致,注意malloc后的檢查,釋放后記得置空,避免"野指針“,不過對于資源受限的單片機來說,使用malloc的場景一般較少,如果需要頻繁申請內(nèi)存塊的場景,都會構(gòu)建基于靜態(tài)存儲區(qū)和內(nèi)存塊分割的一套內(nèi)存管理機制,一方面效率會更高(用固定大小的塊提前分割,在使用時直接查找編號處理),另一方面對于內(nèi)存塊的使用可控,可以有效避免內(nèi)存碎片的問題,常見的如RTOS和網(wǎng)絡(luò)LWIP都是采用這種機制,我個人習慣也采用這種方式,所以關(guān)于堆的細節(jié)不在描述,如果希望了解,可以參考<C Primer Plus>中關(guān)于存儲相關(guān)的說明。
指針和數(shù)組
數(shù)組和指針往往是引起程序bug的主要原因,如數(shù)組越界,指針越界,非法地址訪問,非對齊訪問,這些問題背后往往都有指針和數(shù)組的影子,因此理解和掌握指針和數(shù)組,是成為合格C語言開發(fā)者的必經(jīng)之路。
數(shù)組是由相同類型元素構(gòu)成,當它被聲明時,編譯器就根據(jù)內(nèi)部元素的特性在內(nèi)存中分配一段空間,另外C語言也提供多維數(shù)組,以應(yīng)對特殊場景的需求,而指針則是提供使用地址的符號方法,只有指向具體的地址才有意義,C語言的指針具有最大的靈活性,在被訪問前,可以指向任何地址,這大大方便了對硬件的操作,但同時也對開發(fā)者有了更高的要求。參考如下代碼。
int main(void)
{
char cval[] = "hello";
int i;
int ival[] = {1, 2, 3, 4};
int arr_val[][2] = {{1, 2}, {3, 4}};
const char *pconst = "hello";
char *p;
int *pi;
int *pa;
int **par;
p = cval;
p++;
pi = ival;
pi+=1;
pa = arr_val[0];
pa+=1;
par = arr_val;
par++;
for(i=0; i<sizeof(cval); i++)
{
printf("%d ", cval[i]);
}
printf("\n");
printf("pconst:%s\n", pconst);
printf("addr:%d, %d\n", cval, p);
printf("addr:%d, %d\n", icval, pi);
printf("addr:%d, %d\n", arr_val, pa);
printf("addr:%d, %d\n", arr_val, par);
}
對于
數(shù)組來說,一般從0開始獲取值,以length-1作為結(jié)束,通過[0, length)半開半閉區(qū)間訪問,這一般不會出問題,但是某些時候,我們需要倒著讀取數(shù)組時,有可能錯誤的將length作為起始點,從而導(dǎo)致訪問越界,另外在操作數(shù)組時,有時為了節(jié)省空間,將訪問的下標變量i定義為unsigned char類型,而C語言中unsigned char類型的范圍是0~255,如果數(shù)組較大,會導(dǎo)致數(shù)組超過時無法截止,從而陷入死循環(huán),這種在最初代碼構(gòu)建時很容易避免,但后期如果更改需求,在加大數(shù)組后,在使用數(shù)組的其它地方都會有隱患,需要特別注意。
在前面提到過,指針占有的空間與芯片的尋址寬度有關(guān),32位平臺為4字節(jié),64位為8字節(jié),而指針的加減運算中的長度又與它的類型相關(guān),如char類型為1,int類型為4,如果你仔細觀察上面的代碼就會發(fā)現(xiàn)par的值增加了8,這是因為指向指針的指針,對應(yīng)的變量是指針,也就是長度就是指針類型的長度,在64位平臺下為8,如果在32位平臺則為4,這些知識理解起來并不困難,但是這些特性在工程運用中稍有不慎,就會埋下不易察覺的問題。另外指針還支持強制轉(zhuǎn)換,這在某些情況下相當有用,參考如下代碼:
#include <stdio.h>
typedef struct
{
int b;
int a;
}STRUCT_VAL;
static __align(4) char arr[8] = {0x12, 0x23, 0x34, 0x45, 0x56, 0x12, 0x24, 0x53};
int main(void)
{
STRUCT_VAL *pval;
int *ptr;
pval = (STRUCT_VAL *)arr;
ptr = (int *)&arr[4];
printf("val:%d, %d", pval->a, pval->b);
printf("val:%d,", *ptr);
}
基于指針的強制轉(zhuǎn)換,在協(xié)議解析,數(shù)據(jù)存儲管理中高效快捷的解決了數(shù)據(jù)解析的問題,但是在處理過程中涉及的數(shù)據(jù)對齊,大小端,是常見且十分易錯的問題,如上面arr字符數(shù)組,通過__align(4)強制定義為4字節(jié)對齊是必要的,這里可以保證后續(xù)轉(zhuǎn)換成int指針訪問時,不會觸發(fā)非對齊訪問異常,如果沒有強制定義,char默認是1字節(jié)對齊的,當然這并不就是一定觸發(fā)異常(由整個內(nèi)存的布局決定arr的地址,也與實際使用的空間是否支持非對齊訪問有關(guān),如部分SDRAM使用非對齊訪問時,會觸發(fā)異常), 這就導(dǎo)致可能增減其它變量,就可能觸發(fā)這種異常,而出異常的地方往往和添加的變量毫無關(guān)系,而且代碼在某些平臺運行正常,切換平臺后觸發(fā)異常,這種隱蔽的現(xiàn)象是嵌入式中很難查找解決的問題。另外,C語言指針還有特殊的用法就是通過強制轉(zhuǎn)換給特定的物理地址訪問,通過函數(shù)指針實現(xiàn)回調(diào),如下:
#include <stdio.h>
typedef int (*pfunc)(int, int);
int func_add(int a, int b){
return a+b;
}
int main(void)
{
pfunc *func_ptr;
*(volatile uint32_t *)0x20001000 = 0x01a23131;
func_ptr = func_add;
printf("%d\n", func_ptr(1, 2));
}
這里
說明下,volatile易變的,可變的,一般用于以下幾種狀況:
1)并行設(shè)備的硬件寄存器(如:狀態(tài)寄存器)
2)一個中斷服務(wù)子程序中會訪問到的非自動變量(Non-automatic variables)
3)多線程應(yīng)用中被幾個任務(wù)共享的變量
volatile可以解決用戶模式和異常中斷訪問同一個變量時,出現(xiàn)的不同步問題,另外在訪問硬件地址時,volatile也阻止對地址訪問的優(yōu)化,從而確保訪問的實際的地址,精通volatile的運用,在嵌入式底層中十分重要,也是嵌入式C從業(yè)者的基本要求之一。函數(shù)指針在一般嵌入式軟件的開發(fā)中并不常見,但對許多重要的實現(xiàn)如異步回調(diào),驅(qū)動模塊,使用函數(shù)指針就可以利用簡單的方式實現(xiàn)很多應(yīng)用,當然我這里只能說是拋磚引玉,許多細節(jié)知識是值得詳細去了解掌握的。
結(jié)構(gòu)類型和對齊
C語言提供自定義數(shù)據(jù)類型來描述一類具有相同特征點的事務(wù),主要支持的有結(jié)構(gòu)體,枚舉和聯(lián)合體。其中枚舉通過別名限制數(shù)據(jù)的訪問,可以讓數(shù)據(jù)更直觀,易讀,實現(xiàn)如下:
typedef enum {spring=1, summer, autumn, winter }season;
聯(lián)合體的是能在同一個存儲空間里存儲不同類型數(shù)據(jù)的數(shù)據(jù)類型,對于聯(lián)合體的占用空間,則是以其中占用空間最大的變量為準,如下:
typedef union{
char c;
short s;
int i;
}UNION_VAL;
UNION_VAL val;
int main(void)
{
printf("addr:0x%x, 0x%x, 0x%x\n",
(int)(&(val.c)), (int)(&(val.s)), (int)(&(val.i)));
val.i = 0x12345678;
if(val.s == 0x5678)
printf("小端模式\n");
else
printf("大端模式\n");
}
聯(lián)合體的用途主要通過共享內(nèi)存地址的方式,實現(xiàn)對數(shù)據(jù)內(nèi)部段的訪問,這在解析某些變量時,提供了更為簡便的方式,此外測試芯片的大小端模式也是聯(lián)合體的常見應(yīng)用,當然利用指針強制轉(zhuǎn)換,也能實現(xiàn)該目的,實現(xiàn)如下:
int data = 0x12345678;
short *pdata = (short *)&data;
if(*pdata = 0x5678)
printf("%s\n", "小端模式");
else
printf("%s\n", "大端模式");
可以看出使用聯(lián)合體在某些情況下可以避免對指針的濫用。
結(jié)構(gòu)體則是將具有共通特征的變量組成的集合,比起C++的類來說,它沒有安全訪問的限制,不支持直接內(nèi)部帶函數(shù),但通過自定義數(shù)據(jù)類型,函數(shù)指針,仍然能夠?qū)崿F(xiàn)很多類似于類的操作,對于大部分嵌入式項目來說,結(jié)構(gòu)化處理數(shù)據(jù)對于優(yōu)化整體架構(gòu)以及后期維護大有便利,下面舉例說明:
typedef int (*pfunc)(int, int);
typedef struct{
int num;
int profit;
pfunc get_total;
}STRUCT_VAL;
int GetTotalProfit(int a, int b)
{
return a*b;
}
int main(void){
STRUCT_VAL Val;
STRUCT_VAL *pVal;
Val.get_total = GetTotalProfit;
Val.num = 1;
Val.profit = 10;
printf("Total:%d\n", Val.get_total(Val.num, Val.profit));
pVal = &Val;
printf("Total:%d\n", pVal->get_total(pVal->num, pVal->profit));
}
*/
C語言的結(jié)構(gòu)體支持指針和變量的方式訪問,通過轉(zhuǎn)換可以解析任意內(nèi)存的數(shù)據(jù)(如我們之前提到的通過指針強制轉(zhuǎn)換解析協(xié)議),另外通過將數(shù)據(jù)和函數(shù)指針打包,在通過指針傳遞,是實現(xiàn)驅(qū)動層實接口切換的重要基礎(chǔ),有著重要的實踐意義,另外基于位域,聯(lián)合體,結(jié)構(gòu)體,可以實現(xiàn)另一種位操作,這對于封裝底層硬件寄存器具有重要意義,實踐如下:
typedef unsigned char uint8_t;
union reg{
struct{
uint8_t bit0:1;
uint8_t bit1:1;
uint8_t bit2_6:5;
uint8_t bit7:1;
}bit;
uint8_t all;
};
int main(void)
{
union reg RegData;
RegData.all = 0;
RegData.bit.bit0 = 1;
RegData.bit.bit7 = 1;
printf("0x%x\n", RegData.all);
RegData.bit.bit2_6 = 0x3;
printf("0x%x\n", RegData.all);
}
通過聯(lián)合體和位域操作,可以實現(xiàn)對數(shù)據(jù)內(nèi)bit的訪問,這在寄存器以及內(nèi)存受限的平臺,提供了簡便且直觀的處理方式,另外對于結(jié)構(gòu)體的另一個重要知識點就是對齊了,通過對齊訪問,可以大幅度提高運行效率,但是因為對齊引入的存儲長度問題,也是容易出錯的問題,對于對齊的理解,可以分類為如下說明。
基礎(chǔ)數(shù)據(jù)類型:以默認的的長度對齊,如char以1字節(jié)對齊,short以2字節(jié)對齊等
數(shù)組 :按照基本數(shù)據(jù)類型對齊,第一個對齊了后面的自然也就對齊了。
聯(lián)合體 :按其包含的長度最大的數(shù)據(jù)類型對齊。
結(jié)構(gòu)體:結(jié)構(gòu)體中每個數(shù)據(jù)類型都要對齊,結(jié)構(gòu)體本身以內(nèi)部最大數(shù)據(jù)類型長度對齊
union DATA{
int a;
char b;
};
struct BUFFER0{
union DATA data;
char a;
int b;
short s;
};
struct BUFFER1{
char a;
short s;
union DATA data;
int b;
};
int main(void)
{
struct BUFFER0 buf0;
struct BUFFER1 buf1;
printf("size:%d, %d\n", sizeof(buf0), sizeof(buf1));
printf("addr:0x%x, 0x%x, 0x%x, 0x%x\n",
(int)&(buf0.data), (int)&(buf0.a), (int)&(buf0.b), (int)&(buf0.s));
printf("addr:0x%x, 0x%x, 0x%x, 0x%x\n",
(int)&(buf1.a), (int)&(buf1.s), (int)&(buf1.data), (int)&(buf1.b));
}
其中union聯(lián)合體的大小與內(nèi)部最大的變量int一致,為4字節(jié),根據(jù)讀取的值,就知道實際內(nèi)存布局和填充的位置是一致,事實上學會通過填充來理解C語言的對齊機制,是有效且快捷的方式。
預(yù)處理機制
C語言提供了豐富的預(yù)處理機制,方便了跨平臺的代碼的實現(xiàn),此外C語言通過宏機制實現(xiàn)的數(shù)據(jù)和代碼塊替換,字符串格式化,代碼段切換,對于工程應(yīng)用具有重要意義,下面按照功能需求,描述在C語言運用中的常用預(yù)處理機制。
#include 包含文件命令,在C語言中,它執(zhí)行的效果是將包含文件中的所有內(nèi)容插入到當前位置,這不只包含頭文件,一些參數(shù)文件,配置文件,也可以使用該文件插入到當前代碼的指定位置。其中<>和""分別表示從標準庫路徑還是用戶自定義路徑開始檢索。
#define宏定義,常見的用法包含定義常量或者代碼段別名,當然某些情況下配合##格式化字符串,可以實現(xiàn)接口的統(tǒng)一化處理,實例如下:
#define MAX_SIZE 10
#define MODULE_ON 1
#define ERROR_LOOP() do{\
printf("error loop\n");\
}while(0);
#define global(val) g_##val
int global(v) = 10;
int global(add)(int a, int b)
{
return a+b;
}
#if..#elif...#else...#endif, #ifdef..#endif, #ifndef...#endif條件選擇判斷,條件選擇主要用于切換代碼塊,這種綜合性項目和跨平臺項目中為了滿足多種情況下的需求往往會被使用。
#undef 取消定義的參數(shù),避免重定義問題。
#error,#warning用于用戶自定義的告警信息,配合#if,#ifdef使用,可以限制錯誤的預(yù)定義配置。
#pragma 帶參數(shù)的預(yù)定義處理,常見的#pragma pack(1), 不過使用后會導(dǎo)致后續(xù)的整個文件都以設(shè)置的字節(jié)對齊,配合push和pop可以解決這種問題,代碼如下:
#pragma pack(push)
#pragma pack(1)
struct TestA
{
char i;
int b;
}A;
#pragma pack(pop);
等同于
struct _TestB{
char i;
int b;
}__attribute__((packed))A;
總結(jié)
如果你看到了這里,那么應(yīng)該對C語言有了比較清晰的認識,嵌入式C語言在處理硬件物理地址,位操作,內(nèi)存訪問,都給予開發(fā)者了充分的自由,通過數(shù)組,指針以及強制轉(zhuǎn)換的技巧,可以有效減少數(shù)據(jù)處理中的復(fù)制過程,這對于底層是必要的,也方便了整個架構(gòu)的開發(fā)。但是由這種自由帶來的非法訪問,溢出,越界,以及不同硬件平臺對齊,數(shù)據(jù)寬度,大小端問題,在功能設(shè)計人員手里一般還能夠處理,對于后續(xù)接手項目的人來說,如果本身的設(shè)計沒有考慮清楚這些問題,往往代表著問題和麻煩,所以對于任何嵌入式C的從業(yè)者,清晰的掌握這些基礎(chǔ)的知識和必要的。
講到這里,關(guān)于嵌入式C語言的初步總結(jié)就到此為止,但C語言在嵌入式運用的中的重點和難點并不僅僅只有這些,如嵌入式C語言支持的內(nèi)聯(lián)匯編,通訊間的可靠性實現(xiàn),存儲數(shù)據(jù)校驗和完整性保證,這些工程上的運用和技巧,都很難用簡單的言語說清楚,另外有關(guān)異常觸發(fā)后的查找和解決的技巧,也值得詳細的說明,這里因為篇幅以及自己還未整理清晰,就先到此為止。