《 C 語言的一些“騷操作”及其深層理解》之長(zhǎng)字符串的拆分技巧
長(zhǎng)字符串的拆分技巧
很多時(shí)候我們需要進(jìn)行長(zhǎng)字符串的拆分。在振南的研發(fā)經(jīng)歷中,使用到這種操作的最典型的應(yīng)用場(chǎng)合有三個(gè)。
1.NMEA協(xié)議數(shù)據(jù)的解析
NMEA可能很多人不太了解,但是說到GPS肯定大家都很熟悉。當(dāng)我們從GPS模塊中讀取定位信息的時(shí)候,數(shù)據(jù)就是遵循NMEA協(xié)議格式的。圖2.2為一個(gè)標(biāo)準(zhǔn)的GPS數(shù)據(jù)幀。
圖2.2 一個(gè)符合NMEA協(xié)議標(biāo)準(zhǔn)的GPS數(shù)據(jù)幀
整個(gè)數(shù)據(jù)幀采用ASCII編碼,它以$GP作為開始,后面依次排列的是各項(xiàng)參數(shù),參數(shù)之間使用,作為分隔。比如$GPRMC為推薦定位信息,我當(dāng)時(shí)就是使用這一條數(shù)據(jù)來獲取經(jīng)緯度信息的(當(dāng)時(shí)是Intel杯嵌入式邀請(qǐng)賽需要作一個(gè)手持GPS跟蹤器)。這條數(shù)據(jù)中N后面是緯度,E后面是經(jīng)度。我們要作的就是將它們從整個(gè)數(shù)據(jù)幀(一個(gè)長(zhǎng)字符串)中提取出來。所以,這就涉及到了所謂的“長(zhǎng)串拆分”。
2.Shell命令行的命令解析
在很多項(xiàng)目中,我都習(xí)慣于基于串口編寫一個(gè)后臺(tái)Shell系統(tǒng),可以起到一個(gè)基本的調(diào)試作用。從而一定程度上減少修改代碼和固件燒錄的次數(shù)。比如,項(xiàng)目中如果涉及DAC電壓經(jīng)常的調(diào)整輸出,我就會(huì)在后臺(tái)中設(shè)計(jì)一個(gè)命令SetV n,以便隨時(shí)靈活的操控DAC。隨著項(xiàng)目功能的升級(jí),后臺(tái)命令也會(huì)變得開始復(fù)雜。比如SetArg a b c d e f g h....,用于同時(shí)設(shè)置程序中多個(gè)關(guān)鍵參數(shù)的值;再比如SetV channel n freq a,設(shè)置某通道第n個(gè)信號(hào)的輸出幅值和頻率。
這些命令通過PC上的串口助手或調(diào)試終端來發(fā)送,比如超級(jí)終端、SecureCRT或XShell等。程序中從串口接收到命令之后,將其放入內(nèi)存的緩沖區(qū)中,其形式就是一個(gè)字符串。命令字以及后面的若干參數(shù)之間使用空格來分隔。程序要匹配命令字,并提取參數(shù),以便執(zhí)行相應(yīng)的操作。所以,這也涉及到長(zhǎng)串的拆分。
3.DTU模塊的AT指令解析
AT指令其實(shí)和NMEA是一個(gè)道理,它們都是一種通信協(xié)議格式,只不過AT指令更多使用在網(wǎng)絡(luò)通信模塊中,比如SIM800、ESP8266、HC06藍(lán)牙串口等。舉個(gè)例子,我們想知道網(wǎng)絡(luò)信號(hào)強(qiáng)度,就可以向模塊發(fā)送”AT+CSQ\r\n”,模塊會(huì)返回”+CSQ: 29,0\r\n”。CSQ:后面的29就是信號(hào)強(qiáng)度。它們都是ASCII編碼的,也就是一個(gè)字符串。我們需要將29從其中提取出來。當(dāng)然,AT指令也有比較復(fù)雜的,字符串會(huì)比較長(zhǎng),包含的參數(shù)也會(huì)比較多。所以,要想使用這些網(wǎng)絡(luò)模塊實(shí)現(xiàn)網(wǎng)絡(luò)通信,就必須實(shí)現(xiàn)對(duì)AT指令的解析。
說了這么多,都是在說長(zhǎng)串拆分很重要。根本問題是如何實(shí)現(xiàn)它?很多人可能都會(huì)想到使用那個(gè)分隔字符,比如空格、逗號(hào)。然后去一個(gè)個(gè)數(shù)要提取的參數(shù)前面有幾個(gè)分隔字符,然后后將相應(yīng)位置上的字符組成一個(gè)新的短字符串。如圖2.3所示。
圖2.3 通過分隔字符定位要提取的部分
這種方法固然可行,但是略顯笨拙。其實(shí)對(duì)于這種有明顯分隔符的長(zhǎng)字符串,我們可以采用“打散”或“爆炸”的思想,具體過程是這樣的:將長(zhǎng)字符串中的所有分隔符全部替換為’\0’,即字符串結(jié)束符。此時(shí),長(zhǎng)字符串就被分解成了在內(nèi)存中順序存放的若干個(gè)短字符串。如果要取出第n個(gè)短字符串,可以用這個(gè)函數(shù):
很多時(shí)候我們需要一次性訪問長(zhǎng)字符串中的多個(gè)短字符串,此時(shí)振南經(jīng)常會(huì)這樣來作:通過一個(gè)循環(huán),將長(zhǎng)字符串中的所有分隔符替換為’\0’,在此過程中將每一個(gè)短字符串首字符的位置記錄到一個(gè)數(shù)組中,代碼如下:
好,舉個(gè)例子:我們要提取”abc 1000 50 off 2500”中的”abc”、”50”和”off”,可以使用上面的函數(shù)來實(shí)現(xiàn)。