當前位置:首頁 > 智能硬件 > 機器視覺
[導讀] 在機器視覺處理中,我們經常要對檢測到的物體的方位特征進行評估。比如說,我們要 OCR 識別一個字符串。那么這個字符串與x軸的夾角就很重要,我們需要這個信息把這個字符串轉正,然后才方便識別。

在機器視覺處理中,我們經常要對檢測到的物體的方位特征進行評估。比如說,我們要 OCR 識別一個字符串。那么這個字符串與x軸的夾角就很重要,我們需要這個信息把這個字符串轉正,然后才方便識別。

條形碼識別也類似,尤其是當我們條形碼不是很清晰時,首先將條形碼轉正,然后用各向異性的濾波器處理一下,可以讓條形碼變得更清晰易于讀取。

這里給出一種基于統(tǒng)計參數的特征提取方法。這個方法已經有幾十年歷史了,算是個老方法,但是效果很不錯,所以值得寫篇文章來介紹介紹。

區(qū)域的矩

一片區(qū)域 R 的矩定義為:

當p 和q 都取 0 時,得到的就是這片區(qū)域的面積。也就是:

矩還可以歸一化,也就是用上面的定義再除以面積 a。

表示的是這片區(qū)域的重心??梢杂盟鼇砻枋鰠^(qū)域的位置。

歸一化的矩回隨區(qū)域在圖像中的位置不同而變化,要去除這個影響,可以用中心矩,中心矩只反映區(qū)域本身的特征。

具體的方法是將這個區(qū)域當作一個橢圓區(qū)域,那么用上面5個參量就可以計算出橢圓的長短軸和旋轉角度。具體公式如下:

橢圓的這幾個參數的圖形解釋如下圖:

利用這幾個參數就可以確定區(qū)域的方位和尺寸了。
比如我們有下面的一幅測試圖像。

用上面方法計算出的橢圓如下:

可以看出結果非常的好。尤其是旋轉角度,計算的非常準確。

下面是我的測試代碼,供參考。用到了些 Qt 的功能。
#include
#include
#include
#include
#include "picturebox.h"
#include

QImage threshold(const QImage &image, quint8 th)
{
int height = image.height();
int width = image.width();
QImage ret(width, height, QImage::Format_Indexed8);
ret.setColorCount(256);
for(int i = 0; i < 256; i++)
{
ret.setColor(i, qRgb(i, i, i));
}

for(int i = 0; i < height; i ++)
{
const uchar *pSrc = (uchar *)image.constScanLine(i);
uchar *pDest = (uchar *)ret.scanLine(i);
for( int j = 0; j < width; j ++)
{
pDest[j] = (pSrc[j] > th)? 255: 0;
}
}
return ret;
}

QImage toGray( const QImage &image )
{
int height = image.height();
int width = image.width();
QImage ret(width, height, QImage::Format_Indexed8);
ret.setColorCount(256);
for(int i = 0; i < 256; i++)
{
ret.setColor(i, qRgb(i, i, i));
}

qDebug () << image.format();
switch(image.format())
{
case QImage::Format_Indexed8:
case QImage::Format_Grayscale8:
for(int i = 0; i < height; i ++)
{
const uchar *pSrc = (uchar *)image.constScanLine(i);
uchar *pDest = (uchar *)ret.scanLine(i);
memcpy(pDest, pSrc, width);
}
break;
case QImage::Format_RGB32:
case QImage::Format_ARGB32:
case QImage::Format_ARGB32_PremulTIplied:
for(int i = 0; i < height; i ++)
{
const QRgb *pSrc = (QRgb *)image.constScanLine(i);
uchar *pDest = (uchar *)ret.scanLine(i);

for( int j = 0; j < width; j ++)
{
pDest[j] = qGray(pSrc[j]);
}
}
break;
}
return ret;
}

QPointF center(const QImage &image, int value)
{
if(image.isNull() || image.format() != QImage::Format_Indexed8)
{
return QPointF(-1, -1);
}
int width = image.width();
int height = image.height();
int x_mean = 0;
int y_mean = 0;
int count = 0;
for(int j = 0; j < height; j ++)
{
const uchar * p = image.constScanLine(j);
for(int i = 0; i < width; i++)
{
if( p[i] == value )
{
x_mean += i;
y_mean += j;
count++;
}
}
}
return QPointF((double)x_mean / count, (double)y_mean / count);

}
struct ELLIPSE_PARA
{
double x_mean; //橢圓的中心坐標 x
double y_mean; //橢圓的中心坐標 y
double r1; //橢圓的長軸半徑
double r2; //橢圓的短軸半徑
double theta; //橢圓的長軸與 x 軸的夾角(逆時針)
};

/**
* @brief ellipseFit 將一片區(qū)域當作橢圓來估計五個幾何參數
* @param image
* @param value
* @param para
*/
bool ellipseFit(const QImage &image, int value, ELLIPSE_PARA * para)
{
if(image.isNull() || image.format() != QImage::Format_Indexed8)
{
return false;
}
QPointF c = center(image, value);

int width = image.width();
int height = image.height();
double n01 = c.x();
double n10 = c.y();

double mu20 = 0.0;
double mu02 = 0.0;
double mu11 = 0.0;

int count = 0;
for(int row = 0; row < height; row ++)
{
const uchar * p = image.constScanLine(row);
for(int col = 0; col < width; col++)
{
if( p[col] == value )
{
mu02 += (col - n01) * (col - n01);
mu20 += (row - n10) * (row - n10);
mu11 += (col - n01) * (row - n10);
count ++;
}
}
}
if(count == 0)
{
return false;
}
mu20 /= count;
mu02 /= count;
mu11 /= count;

double t1 = mu20 + mu02;
double t2 = mu20 - mu02;
double t3 = sqrt(t2 * t2 + 4 * mu11 * mu11);
double r1 = sqrt(2 * ( t1 + t3) );
double r2 = sqrt(2 * ( t1 - t3) );

double theta = - atan2(2 * mu11, mu02 - mu20) / 2.0;

para->r1 = r1;
para->r2 = r2;
para->theta = theta;
para->x_mean = n01;
para->y_mean = n10;

return true;
}

int main(int argc, char *argv[])
{
QApplicaTIon a(argc, argv);
QImage image("D:/test55.png");
QImage imageGray = toGray(image);
//imageGray = threshold(imageGray, 128);
ELLIPSE_PARA para;
ellipseFit(imageGray, 0, ¶);

qDebug() << para.r1;
qDebug() << para.r2;
qDebug() << para.theta * 180 / 3.14159;
QPointF c(para.x_mean, para.y_mean);
qDebug() << c;
QPainter painter(&image);
painter.setPen(Qt::red);
painter.translate(c);
painter.rotate(-para.theta * 180 / 3.14159);
painter.drawEllipse(QPointF(0, 0), para.r1, para.r2 );

PictureBox box;
box.seTImage(image);
box.show();
return a.exec();
}

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉