STM32也能實現(xiàn)目標分類?本文使用的芯片是STM32F103VCT6, 最大工作頻率72M,64KB RAM, 256KB FLASH。資源就那么點,這些高大上的基本都是DSP、高級ARM之類芯片玩的,你一個這么點資源的芯片湊什么熱鬧。但是筆者經過多年在嵌入式方面的經驗,成功實現(xiàn)了基于STM32的目標分類,下面把實現(xiàn)的過程和大家分享下。
受限于芯片資源,我們設計的算法不能太復雜,主要體現(xiàn)在幾個方面:
1、識別目標的特征不能太多。
2、具體的算法要簡單,不然CPU跑不動,不能實現(xiàn)實時性。
基于這兩點筆者給大家分享一個在STM32平臺上實現(xiàn)用顏色來識別人民幣的面額,大家都知道,人民幣的每個面額的顏色都不相同,如下圖:
從圖中可以看出,人民幣每個面額顏色都有區(qū)別,所以我們可以采集人民幣的顏色數(shù)據作為識別的特征。在本項目中用到了兩組顏色傳感器,當紙幣經過時,通過AD循環(huán)采集紙幣的RGB顏色數(shù)據,這樣就得到了用于計算特征的數(shù)據。
目標分類一般有兩個步驟:一是提取特征,二是根據設計的分類器對特征數(shù)據進行分類,下面就這兩部分進行說明。
1、人民幣顏色數(shù)據的特征提取
這里先給大家講解下顏色的HIS顏色模型,HSI是指一個數(shù)字圖像的模型,是美國色彩學家孟塞爾(H.A.Munsell)于1915年提出的,它反映了人的視覺系統(tǒng)感知彩色的方式,以色調、飽和度和亮度三種基本特征量來感知顏色。HSI模型的建立基于兩個重要的事實:第一個,分量與圖像的彩色信息無關;第二個,H和S分量與人感受顏色的方式是緊密相聯(lián)的。這些特點使得HSI模型非常適合彩色特性檢測與分析。
色調H(Hue):與光波的波長有關,它表示人的感官對不同顏色的感受,如紅色、綠色、藍色等,它也可表示一定范圍的顏色,如暖色、冷色等。
飽和度S(Saturation):表示顏色的純度,純光譜色是完全飽和的,加入白光會稀釋飽和度。飽和度越大,顏色看起來就會越鮮艷,反之亦然。
亮度I(Intensity):對應成像亮度和圖像灰度,是顏色的明亮程度。
通過上面的介紹,大家應該明白,我們要把采集到的RGB顏色數(shù)據轉換HIS模型上,如下圖:
具體的轉換公式為:
代碼如下:
void rgb_to_ish(int r,int g,int b, double *I,double *S,double *H){ double R,G,B; R=(double)r/255.0; G=(double)g/255.0; B=(double)b/255.0; *I=(R+G+B)/3; if(*I<0.001) { *H=0; *S=0; return; } *S = 1-(min(min(R,G),B)/(*I)); if(*S==0) { *H=0; return; } *H=((R-G)+(R-B))/2/sqrt((R-G)*(R-G)+(R-B)*(G-B)); if(G>B) { *H=acos(*H); } else { *H=2*M_PI-acos(*H); } *H/=2*M_PI;}
在轉換之前,首先需要對RGB數(shù)據進行歸一化,調整到同一長度下,代碼如下:
void ResizeData(const u8 *pOldData,I32 len,u8 *pNewData, I32 newLen){ I32 i,tx,xx,dxi; I32 t; for (i = 0; i < newLen; i++) { tx = i*1024*(len)/(newLen); xx = tx>>10; dxi=tx-xx*1024; t = ((((I32)pOldData[xx+1]-(I32)pOldData[xx])*dxi)>>10)+(((I32)pOldData[xx]-(I32)pOldData[xx+1])*dxi>>20)+(I32)pOldData[xx]; if (t > 255) { t = 255; } t; = }}
對提取特征總結下:
1. 對RGB數(shù)據進行歸一化
2. 轉換為HIS模式表示
一張人民幣提取到的特征如下:
1 1:360 2:441 3:408 4:430 5:402 6:432 7:411 8:493 9:451 10:476 11:480 12:463 13:468 14:456 15:497 16:458 17:514 18:458 19:519 20:470 21:509 22:467 23:512 24:458 25:520 26:457 27:482 28:451 29:446 30:448 31:427 32:440 33:415 34:428 35:396 36:425 37:398 38:432 39:380 40:452 41:403 42:422 43:444 44:426 45:416 46:385 47:512 48:280 49:316 50:663 51:324 52:464 53:384 54:448 55:406 56:453 57:425 58:492 59:442 60:545 61:440 62:546 63:481 64:527 65:515 66:527 67:534 68:528 69:533 70:520 71:514 72:535 73:503 74:559 75:532 76:544 77:555 78:520 79:544 80:520 81:523 82:505 83:519 84:480 85:528 86:427 87:533 88:330 89:385 90:344 91:320 92:425 93:346 94:473 95:403 96:462 97:446 98:446 99:455 100:468 101:464 102:482 103:491 104:461 105:481 106:451 107:468 108:425 109:455 110:417 111:431 112:367 113:405 114:339 115:347 116:353 117:335 118:372 119:354 120:370 121:346 122:380 123:305 124:444 125:350 126:445 127:414 128:387 129:432 130:354 131:408 132:356 133:345 134:402 135:350 136:407 137:364 138:377 139:337 140:391 141:326 142:429 143:356 144:476 145:456 146:439 147:458 148:441 149:460 150:439 151:456 152:439 153:459 154:443 155:458 156:439 157:469 158:433 159:473 160:433 161:478 162:444 163:469 164:445 165:465 166:437 167:462 168:437 169:464 170:439 171:464 172:443 173:471 174:420 175:467 176:394 177:414 178:392 179:398 180:385 181:401 182:375 183:374 184:427 185:407 186:424 187:432 188:429 189:432 190:404 191:539 192:276 193:387 194:645 195:315 196:440 197:365 198:426 199:384 200:428 201:387 202:419 203:376 204:407 205:363 206:398 207:364 208:407 209:372 210:410 211:372 212:424 213:381 214:473 215:441 216:503 217:493 218:489 219:513 220:448 221:508 222:416 223:471 224:410 225:437 226:411 227:413 228:397 229:410 230:359 231:398 232:324 233:359 234:312 235:327 236:336 237:287 238:383 239:346 240:368 241:360 242:389 243:405 244:336 245:346 246:391 247:385 248:380 249:396 250:382 251:387 252:364 253:373 254:378 255:375 256:352 257:371 258:333 259:355 260:335 261:373 262:342 263:405 264:371 265:355 266:456 267:323 268:431 269:359 270:386 271:382 272:379 273:409 274:349 275:427 276:325 277:327 278:388 279:310 280:370 281:342 282:328 283:297 284:364 285:320 286:376 287:348 288:440
這里提取了288維的特征。
2、基于提取的特征進行目標分類
這里給大家分享一個很著名的分類器liblinear,它是是國立臺灣大學的Chih-Jen Lin博士開發(fā)的主要是應對large-scale的data classification,因為linear分類器的訓練比非線性分類器的訓練計算復雜度要低很多,時間也少很多,而且在large scale data上的性能和非線性的分類器性能相當,所以Liblinear是針對大數(shù)據而生的。通過筆者的實驗,這個分類器在STM32 平臺上實現(xiàn)非常容易,而且速度很快,分類主要代碼如下:
for (i = 0; i < Class; i++){ fvtInt = 0; for (j = 0; j < 144*2; j++) { t0 = (int)pf1[j]; t1 = (int)pFvt[j*Class+i]; fvtInt += t0*t1; } fvt = ((double)(fvtInt))/100000; fvt += ((double)(pFvt[j*Class+i]*200))/100000; tt = exp(-fvt); fvt = 1/(1+tt); if (max_t < fvt) { max_t = fvt; min_i = pNoteClass[i]; }}
大家看看就這么幾段代碼就實現(xiàn)了,這里提醒下,在運算過程中盡量使用整型數(shù)據,以節(jié)省空間。
3、識別步驟
1. 對提取的特征進行訓練,訓練在PC端實現(xiàn),得到用于分類的模型文件,部分內容如下圖:
2. 將上面得到的模型文件整型化,有利于提高運行速度。
3. 用上面的提供的分類代碼就可以實現(xiàn)分類了。
我這邊數(shù)據的實驗結果:
nTotal = 30500, err = 177, 識別率為:0.994197
就這么簡單的幾個步驟,就可以讓STM32立馬高大上起來!-!
/ The End /
本文主要介紹了在STM32F103平臺上對人民幣顏色信息進行識別的算法原理。
如有疑問,歡迎留言討論。
本文由【嵌入式案例Show】原創(chuàng)出品,未經許可,請勿轉載
免責聲明:本文內容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!