當前位置:首頁 > 公眾號精選 > TsinghuaJoking
[導讀]關于經(jīng)典網(wǎng)絡重要的BP(誤差反向傳播網(wǎng)絡)是所有學習人工神經(jīng)網(wǎng)絡最先接觸到的一個實用網(wǎng)絡,它的原理相對比較簡單,在很多平臺中都非常容易實現(xiàn)。

這學期的人工神經(jīng)網(wǎng)絡課程已經(jīng)進行完了第三章內(nèi)容,關于經(jīng)典網(wǎng)絡重要的BP(誤差反向傳播網(wǎng)絡)是所有學習人工神經(jīng)網(wǎng)絡最先接觸到的一個實用網(wǎng)絡。它的原理相對比較簡單,在很多平臺中都非常容易實現(xiàn)。

學習神經(jīng)網(wǎng)絡的基本原理之后,更重要的是能夠通過一些應用場合來應用它,使他能夠幫助自己解決一些實際的工程問題。

近期購買到的 LC100-A[1] 電感電容測量模塊,用于測量一些實驗中實驗對象的電感、電容值隨著其他一些物理變量(工作電壓、距離、溫度等)所產(chǎn)生變化規(guī)律。為了便于實驗,需要能夠?qū)C100-A測量數(shù)值自動記錄。

<<< 左右滑動見更多 >>>

在開始的方式就是直接使用攝像頭獲取液晶顯示數(shù)據(jù),然后使用字符識別軟件來完成其中數(shù)字的識別。

測試一下CNOCR識別效果。它對于屏幕截圖中的文字識別效果還不錯:

▲ 屏幕截取的一段文字
  • 識別時間:1.98。* 識別結(jié)果:

[['●', '更', '新', '了', '訓', '練', '代', '碼', ',', '使', '用', 'm', 'x', 'n', 'e', 't', '的', 'r', 'e', 'c', 'o', 'r', 'd', 'i', 'o', '首', '先', '把', '數(shù)', '據(jù)', '轉(zhuǎn)', '換', '成', '二', '進', '制', '格', '式', ',', '提', '升', '后', '續(xù)', '的'], ['訓', '練', '效', '率', '。', '訓', '練', '時', '支', '持', '對', '圖', '片', '做', '實', '時', '數(shù)', '據(jù)', '增', '強', '。', '也', '加', '入', '了', '更', '多', '可', '傳', '入', '的', '參', '數(shù)', '。'], ['●', '允', '許', '訓', '練', '集', '中', '的', '文', '字', '數(shù)', '量', '不', '同', ',', '目', '前', '是', '中', '文', '1', '0', '個', '字', ',', '英', '文', '2', '0', '個', '字', '母', '。'], ['。', '提', '供', '了', '更', '多', '的', '模', '型', '選', '擇', ',', '允', '許', '大', '家', '按', '需', '訓', '練', '多', '種', '不', '同', '大', '小', '的', '識', '別', '模', '型', '。'], ['●', ' ', '內(nèi)', '置', '了', '各', '種', '訓', '練', '好', '的', '模', '型', ',', '最', '小', '的', '模', '型', '只', '有', '之', '前', '模', '型', '的', '1', '/', '5', '大', '小', '。', '所', '有', '模', '型', '都', '可', '免', '費'], ['使', '用', '。']]

那么對于前面液晶屏幕識別效果呢:

▲ 只是數(shù)字部分

識別結(jié)果:[['.', '。', '與', 'F', '早', 'H']]

好像驢唇不對馬嘴。

這主要原因還是原來網(wǎng)絡沒有針對上述液晶實現(xiàn)數(shù)字進行訓練過。由于液晶顯示圖片質(zhì)量非常好,實際上只需要最簡單的BP網(wǎng)絡就可以達到很好的效果。

下面給出在MATLAB中構建網(wǎng)絡并進行實驗的過程。


使用神經(jīng)網(wǎng)絡解決問題,一個重要的環(huán)節(jié)就是進行訓練數(shù)據(jù)的準備。通過對采集到的一些圖片中的數(shù)字進行提取并手工標注,來完成對網(wǎng)絡的訓練。

1.數(shù)字分割

下面是桌面攝像頭捕捉到的測量圖片,通過簡單的圖片灰度投影,比較方便將顯示數(shù)字所在圖片中的位置定出。為了簡單起見,也可以固定攝像頭與LCD相對位置,這樣手工定標出結(jié)果字符位置也可以適用于后面測量結(jié)果。

▲ 液晶數(shù)字顯示以及數(shù)字部分

這個問題簡單之處在于所有字符都是等寬,而且對比度非常好,簡單的分離就可以將所有的字符單獨分離出來。由于攝像頭位置固定,所以簡單分割之后的字符之后少量的上下左右平移,沒有旋轉(zhuǎn)。對于圖片位置、尺寸就不再進行歸一化。這些差異最后有神經(jīng)網(wǎng)絡來彌補。

▲ 分割出的數(shù)字

液晶顯示字符的圖片對比度很好。但就是有一個問題,在攝像頭拍攝的時候,經(jīng)常會遇到字符變化過程,這就會使得圖片中字符呈現(xiàn)兩個字符疊加的情況。下面是一些示例:

▲ 數(shù)字變化過程的圖片

這些過程,說實在的,即使人工識別也會無法分辨。

后面通過人工輸入標注了2000多個樣本。

2.圖片二值化

對于分割的圖片進行二值化,可以消除環(huán)境光對于圖片亮度的影響。在一定程度上,也可以消除液晶字符在變化時所引起的模糊。

<<< 左右滑動見更多 >>>

上面所有的字符的尺寸是23乘以38點陣。


1.構建網(wǎng)絡和訓練

簡單的實驗,就用簡單的方法。對于前面所得到的字符,不再人工定義它們的特征。僅僅將原來的彩色圖片變換成灰度圖像,然后排列成23×38=874維向量。然后增加一層中間隱層便組成了最簡單的分類網(wǎng)絡。

net = patternnet(11)

▲ 構造一個單隱層神經(jīng)網(wǎng)絡

將前面人工標注的樣本一半用于訓練,全部樣本用于測試。下面給出了測試的結(jié)果。

plotconfusion(xx, net(yy))

▲ 訓練結(jié)果

2.訓練結(jié)果與分析

整體的錯誤率大約為:ERR= 2.99%。

下面是識別正確的字符。

▲ 識別正確的字符

下面給出了部分識別錯誤字符的情況?;旧隙际且恍┡臄z到液晶字符在變化過程中的重疊字符情況。這些情況本身在人工標注的時候就存在模糊。

<<< 左右滑動見更多 >>>

3.網(wǎng)絡結(jié)構與錯誤率

下面給出了網(wǎng)絡的隱層節(jié)點個數(shù)與識別錯誤樣本個數(shù)之間的關系。可以看到當中間隱層節(jié)點大于5之后,識別性能就不再有明顯的變化了。

隱層節(jié)點個數(shù) 2 3 4 5 6 7 8 9 10 11
錯誤數(shù)量 1810 656 216 77 69 66 65 72 58 68
▲ 隱層節(jié)點個數(shù)與錯誤率

使用神經(jīng)網(wǎng)絡解決問題,不是尋找最強大的網(wǎng)絡,而是需要最合適的網(wǎng)絡。

通過上面的測試結(jié)果來看,簡單的單隱層網(wǎng)絡便可以很好的滿足液晶顯示數(shù)字識別。那么對于那些由于數(shù)字跳動所引起的錯誤該怎么處理呢?

這個問題如果僅僅依靠增加訓練樣本和改進網(wǎng)絡結(jié)構是很難進行徹底解決,規(guī)避這個錯誤可以通過對連續(xù)識別結(jié)果進行比對來解決。對顯示數(shù)字進行連續(xù)快速采集5幀圖像,其中液晶跳動往往只發(fā)生在其中一幀,或者兩幀。那么對于五個圖像識別出的數(shù)字進行對比,找到相同次數(shù)最多的數(shù)字作為輸出結(jié)果。

參考資料

[1]

LC100-A: https://zhuoqing.blog.csdn.net/article/details/108997475

免責聲明:本文內(nèi)容由21ic獲得授權后發(fā)布,版權歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉