計(jì)算機(jī)智能化圖像識(shí)別技術(shù)的探討
掃描二維碼
隨時(shí)隨地手機(jī)看文章
引 言
隨著社會(huì)與科學(xué)技術(shù)的進(jìn)步發(fā)展,計(jì)算機(jī)圖像識(shí)別技術(shù)也越來(lái)越智能化,能夠很大程度地滿足人們對(duì)圖像的個(gè)性化需求。圖像識(shí)別技術(shù)將計(jì)算機(jī)技術(shù)、識(shí)別處理技術(shù)、智能化結(jié)合在一起,將輸入的圖像圖形信息轉(zhuǎn)換為計(jì)算機(jī)數(shù)字信號(hào), 對(duì)這些多源數(shù)據(jù)信息進(jìn)行分析處理,轉(zhuǎn)化成具有特征的信息, 進(jìn)行分類匹配,得到最終的效果,這樣的方式顯著提升了圖像的處理速度和質(zhì)量 。計(jì)算機(jī)數(shù)字信號(hào)有抗干擾、信息量小、易存儲(chǔ)并能夠長(zhǎng)期存儲(chǔ)的優(yōu)點(diǎn),使得圖像識(shí)別容易被執(zhí)行操作 [2]。計(jì)算機(jī)圖像識(shí)別技術(shù)歷經(jīng)了幾個(gè)階段的發(fā)展演變, 早期只能對(duì)簡(jiǎn)單的數(shù)字、文字信息進(jìn)行識(shí)別處理,后來(lái)漸漸發(fā)展為可以對(duì)簡(jiǎn)單的圖形圖像數(shù)字化信息進(jìn)行識(shí)別處理,以及現(xiàn)在的稍復(fù)雜的二維圖像甚至三維立體圖像 [3]。現(xiàn)今的圖像識(shí)別系統(tǒng)大致可分為三種形式 :神經(jīng)網(wǎng)絡(luò)、結(jié)構(gòu)以及統(tǒng)計(jì), 如圖 1所示?;谏窠?jīng)網(wǎng)絡(luò)形式的圖像識(shí)別是一種新型的應(yīng)用廣泛的識(shí)別技術(shù),將傳統(tǒng)的圖像識(shí)別技術(shù)與先進(jìn)的神經(jīng)網(wǎng)絡(luò)方法相結(jié)合,大大提升了識(shí)別率 [4]。
圖 1 圖像識(shí)別系統(tǒng)
計(jì)算機(jī)圖像識(shí)別處理與人類對(duì)圖像的感知識(shí)別是類似的,然而計(jì)算機(jī)識(shí)別能力更強(qiáng),能處理的信息量更大??梢杂脕?lái)進(jìn)行條形碼識(shí)別、人臉面部識(shí)別、指紋識(shí)別、身份認(rèn)證、模型匹配等,一定程度上保障了人們?nèi)粘I畹陌踩?。?jiǎn)單又廣泛的圖像識(shí)別應(yīng)用于智能手機(jī)方面,指紋識(shí)別、面部識(shí)別簡(jiǎn)化了人們解鎖屏幕之前的繁瑣操作,大大縮短了解鎖時(shí)間,提升了使用效率。現(xiàn)在的高端識(shí)別技術(shù)已經(jīng)可以實(shí)現(xiàn)當(dāng)對(duì)象物體的位置、角度和距離等無(wú)論發(fā)生怎樣的改變,計(jì)算機(jī)都能識(shí)別其本質(zhì)的特點(diǎn),對(duì)圖像的最終判斷不會(huì)產(chǎn)生影響 [5]。例如蘋(píng)果公司新推出的 iPhone X 手機(jī)的面部識(shí)別功能,無(wú)論是在黑夜,還是用戶戴眼鏡、臉上有疤痕等面部有些變化,其都能識(shí)別出并進(jìn)行解鎖。學(xué)校、機(jī)關(guān)政府等使用的掃臉打卡機(jī)器同樣也使用到了此技術(shù)。
1 技術(shù)特征點(diǎn)
圖像本身可能會(huì)帶有大量的數(shù)據(jù)信息,在識(shí)別過(guò)程中還需要對(duì)圖像的信息進(jìn)行比對(duì)分析,這就需要對(duì)大量的數(shù)據(jù)進(jìn)行處理,信息量很龐大。圖像的最小單位是像素,一幅圖像是由眾多的像素組成,并且各像素之間有著緊密的關(guān)系。像素對(duì)應(yīng)圖像的信息,在一定程度上反映出圖像的內(nèi)容。像素與像素間、像素與圖像間的關(guān)聯(lián)性是很強(qiáng)的,在識(shí)別過(guò)程中有著重要的作用 [6]。
對(duì)圖像進(jìn)行識(shí)別,首先要將圖像信息轉(zhuǎn)變?yōu)槎S數(shù)組, 即計(jì)算機(jī)可識(shí)別的數(shù)字信號(hào),這樣任意精度間的轉(zhuǎn)換就需要高精度的數(shù)字化智能處理技術(shù) [7]。智能化的計(jì)算機(jī)圖像識(shí)別提升了圖像信息的精準(zhǔn)度,識(shí)別結(jié)果更加接近于真實(shí)性,使得圖像受環(huán)境噪聲的影響較小,提升了抗干擾性 [8]。隨著科技的進(jìn)步,圖像識(shí)別技術(shù)也更加的靈活,在圖像的轉(zhuǎn)換處理上方便快捷,識(shí)別率精確很多。圖像識(shí)別處理大都為了滿足人們的生產(chǎn)生活需求,人為地進(jìn)行控制分析處理,有時(shí)會(huì)加 入個(gè)人喜好情感等因素,依個(gè)人要求改變最后的識(shí)別結(jié)果 [9]。
2 技術(shù)實(shí)現(xiàn)過(guò)程
計(jì)算機(jī)圖像識(shí)別的過(guò)程與人腦識(shí)別圖像的過(guò)程是類似的。首先將要識(shí)別的圖像對(duì)象輸入到計(jì)算機(jī)中,之后對(duì)其進(jìn)行預(yù)處理和壓縮處理,對(duì)圖像的關(guān)鍵特征進(jìn)行提取,之后進(jìn)行分類,最后根據(jù)要求對(duì)圖像進(jìn)行匹配 [6]。圖像識(shí)別過(guò)程如圖 2 所示。
圖中圖像預(yù)處理過(guò)程是最為關(guān)鍵的也是最復(fù)雜困難的一個(gè)環(huán)節(jié),會(huì)將圖像中一些不重要的數(shù)據(jù)信息去除,對(duì)圖像識(shí)別效果影響最大[10]。圖像預(yù)處理包括對(duì)圖像進(jìn)行灰度化處理、二值化處理、平滑去噪及輪廓提取等操作?;叶然幚頃?huì)將圖像中的各像素點(diǎn)的灰度值根據(jù)需求,經(jīng)某一灰度化公式處理后得到成像效果 [11]。二值化處理比較簡(jiǎn)單,只需將圖像中像素點(diǎn)的灰度值均設(shè)置為 0 或 255 即可,最后圖像呈現(xiàn)的效果即為黑與白 [12]。去噪處理是將圖像中的一些噪聲及沒(méi)用的干擾信息去除,突出需要的圖像內(nèi)容,從而使人們能直觀清晰地看到需求信息。輪廓提取是突出目標(biāo)圖像對(duì)象的邊緣輪廓信息,使人們可以僅從圖像中的形狀邊緣特征就看出圖像的信息內(nèi)容。
對(duì)圖像進(jìn)行壓縮處理,將圖像多余的信息進(jìn)行壓縮或刪減,可以減少圖像的占用空間,能夠更好的傳輸和存儲(chǔ),但并不會(huì)影響圖像的可識(shí)別性。壓縮代碼及形式需根據(jù)實(shí)際情況來(lái)選擇 [9]。提取圖像的關(guān)鍵特征是系統(tǒng)根據(jù)圖像的主要特征點(diǎn)進(jìn)行處理提取,如圖像的顏色特征、形狀特征、紋理特征及空間特征等。
3 存在問(wèn)題及解決途徑
雖然我國(guó)智能化的圖像識(shí)別技術(shù)取得了迅速發(fā)展,識(shí)別效果不錯(cuò),但是我國(guó)對(duì)這項(xiàng)技術(shù)仍處于起步發(fā)展階段,還存在諸多的不足之處,識(shí)別技術(shù)存在一些瓶頸問(wèn)題?,F(xiàn)如今的技術(shù)只能對(duì)簡(jiǎn)單的圖像進(jìn)行識(shí)別處理,效果還比較好 ;然而當(dāng)圖像一旦變得復(fù)雜,數(shù)據(jù)信息多的時(shí)候,計(jì)算量以及計(jì)算時(shí)間都會(huì)變大,識(shí)別率也會(huì)下降 [13]。圖像識(shí)別技術(shù)如圖 3 所示。
技術(shù)受限主要是由于以下幾方面的原因。我國(guó)的計(jì)算機(jī)軟硬件設(shè)備技術(shù)相對(duì)比較落后,當(dāng)識(shí)別復(fù)雜的圖像時(shí),任務(wù)量較大,計(jì)算機(jī)運(yùn)行處理速度跟不上,無(wú)法及時(shí)地識(shí)別處理圖像,降低了識(shí)別精度和效率 [14]。同時(shí)也會(huì)造成我國(guó)的研究成果少于國(guó)外具有發(fā)達(dá)水平計(jì)算機(jī)軟硬件國(guó)家的研究成果。我國(guó)智能識(shí)別的圖像大多還是二維圖像,并且有時(shí)圖像的質(zhì)量不是很高,模糊或是有雜質(zhì),或受人為因素的任意性干擾限制,都會(huì)影響圖像的識(shí)別效率。
圖 3 識(shí)別技術(shù)
基于以上問(wèn)題,大家還需要對(duì)其進(jìn)行優(yōu)化提高,加大研究投入計(jì)算機(jī)軟硬件設(shè)備的開(kāi)發(fā),多運(yùn)用高性能的計(jì)算機(jī)來(lái)支撐識(shí)別處理圖像。并且將工作重心從二維圖像逐漸轉(zhuǎn)變?yōu)槿S圖像,未來(lái)甚至?xí)l(fā)展為多維 [15]。優(yōu)化完善識(shí)別技術(shù), 降低圖像質(zhì)量及環(huán)境噪聲對(duì)識(shí)別處理的影響,從而提升識(shí)別精度和分辨率。
4 應(yīng)用領(lǐng)域
如今圖像識(shí)別技術(shù)隨著高端先進(jìn)的科學(xué)技術(shù)已經(jīng)漸漸深入到人們的生活中,應(yīng)用范圍領(lǐng)域廣泛,如交通領(lǐng)域、建筑工程領(lǐng)域、醫(yī)學(xué)領(lǐng)域、文學(xué)藝術(shù)領(lǐng)域、農(nóng)業(yè)領(lǐng)域等,被不斷推廣 [2],并且具有著較高的應(yīng)用價(jià)值與作用,靈活便捷智能的特點(diǎn)使其應(yīng)用普遍,十分有必要在各行業(yè)進(jìn)行普及發(fā)展。
4.1 交通領(lǐng)域
要想富,先修路。隨著各城市經(jīng)濟(jì)的發(fā)展,城市交通設(shè)施也在不斷發(fā)展改變,道路四通八達(dá),建設(shè)面積越來(lái)越大, 路況也越來(lái)越復(fù)雜,并且人們生活水平不斷提高,各家各戶都擁有了私家車,不論是節(jié)假日還是工作日都會(huì)駕車出行, 這就給道路交通帶來(lái)了不小的壓力。為了保證人們能高效地駕車出行,計(jì)算機(jī)圖像識(shí)別技術(shù)在交通設(shè)施領(lǐng)域方面就起到了很大的作用,它可以同時(shí)對(duì)路況信息和車輛信息進(jìn)行檢測(cè)。各大城市都不斷地修道路,所以司機(jī)在駕駛時(shí)也會(huì)有很多道路不熟悉,無(wú)法準(zhǔn)時(shí)準(zhǔn)確地到達(dá)目的地。而圖像識(shí)別技術(shù)會(huì)為駕駛員提供實(shí)時(shí)可靠準(zhǔn)確的路況信息,為駕駛員指引方向, 保障了道路、車輛以及駕駛員的雙重安全 [13]。圖像識(shí)別除了對(duì)道路檢測(cè)外還可以進(jìn)行車輛檢測(cè),通過(guò)車輛分割技術(shù)對(duì)車輛進(jìn)行跟蹤與識(shí)別,檢測(cè)車速與車流量,判斷車輛是否有超速違規(guī)等現(xiàn)象,利于交通事故的處理,以及能有效地保障道路通暢運(yùn)行。
4.2 醫(yī)學(xué)領(lǐng)域
身體是革命的本錢(qián),擁有一個(gè)健康的身體才是無(wú)限財(cái)富的保證。如今人們對(duì)自己的健康問(wèn)題越發(fā)重視了,我國(guó)醫(yī)療事業(yè)也飛速發(fā)展,醫(yī)療器械設(shè)備融入了計(jì)算機(jī)圖像識(shí)別技術(shù), 越來(lái)越智能化。醫(yī)生可以直接通過(guò)設(shè)備對(duì)病人進(jìn)行拍片觀察診斷,針對(duì)性治療,清晰直觀,準(zhǔn)確又高效。例如應(yīng)用于微創(chuàng)手術(shù)的手機(jī)導(dǎo)航技術(shù)、CT 技術(shù)、核磁共振以及 B 超、彩超等,醫(yī)生與患者可以通過(guò)圖像清晰直觀地看到病情狀況, 以此提出有針對(duì)性的治療方案,提高醫(yī)學(xué)技術(shù) [16]。
4.3 安防領(lǐng)域
天網(wǎng)恢恢,疏而不漏。人民安居樂(lè)業(yè)是保障國(guó)家繁榮昌盛的關(guān)鍵所在,如今科技的進(jìn)步使得視頻監(jiān)控普及運(yùn)用,能夠遍布各個(gè)角落,如天眼一般監(jiān)控著每個(gè)地方的一舉一動(dòng), 讓黑惡勢(shì)力無(wú)藏身之處,極大地保障了民生安全。安防設(shè)施的建設(shè)也日益嚴(yán)格,由傳統(tǒng)的人工視頻調(diào)查分析轉(zhuǎn)為智能化的計(jì)算機(jī)圖像識(shí)別技術(shù)分析,避免了人工可能引起的疏漏誤差,更加精準(zhǔn)嚴(yán)格 [17]?,F(xiàn)在的視頻監(jiān)控分布廣雜,人工分析處理視頻信息不僅耗費(fèi)大量的時(shí)間,還會(huì)耗費(fèi)大量的人力物力,而且人為因素會(huì)造成很多信息的遺漏,速度慢、效率低 [18]。將視頻監(jiān)控自動(dòng)化,通過(guò)計(jì)算機(jī)采集圖像,提取識(shí)別信息,將圖像中的信息數(shù)據(jù)一體化,精準(zhǔn)度更高,大大降低了人工操作的工作量、工作時(shí)間,提高了效率。監(jiān)控視頻信息還可以作為事故鑒定的有效依據(jù)。
4.4 農(nóng)業(yè)領(lǐng)域
民以食為天。自古以來(lái)農(nóng)業(yè)在我國(guó)就有著舉足輕重的地位,糧食產(chǎn)量對(duì)經(jīng)濟(jì)有較大的影響,所以提高產(chǎn)量是我國(guó)農(nóng)業(yè)研究人員的研究關(guān)鍵。高科技不光應(yīng)用在人們的日常生活中,農(nóng)業(yè)領(lǐng)域也同樣引入了高科技,智慧農(nóng)業(yè)也不再是什么新鮮詞匯,智能化農(nóng)業(yè)引入計(jì)算機(jī)圖像識(shí)別技術(shù),可以實(shí)時(shí)觀測(cè)到植物的生長(zhǎng)狀況,植物葉片的病蟲(chóng)害研究,對(duì)植物進(jìn)行實(shí)時(shí)全景監(jiān)控,還可以進(jìn)行農(nóng)產(chǎn)品的質(zhì)檢。對(duì)研究植物表型, 影響植物生長(zhǎng)因素以及研發(fā)植物新品種有科學(xué)指導(dǎo)意義 [19]。
4.5 文藝領(lǐng)域
圖像識(shí)別技術(shù)在文藝領(lǐng)域主要應(yīng)用于對(duì)圖像、聲音方面的識(shí)別處理,呈現(xiàn)出藝術(shù)性。通過(guò)智能化識(shí)別系統(tǒng)自動(dòng)將無(wú)用信息過(guò)濾掉,保證信息的有效性,匹配性。還可以依據(jù)美學(xué)原理對(duì)圖像進(jìn)行色彩調(diào)整,增強(qiáng)其藝術(shù)感,從而為人們呈現(xiàn)出更加美好的畫(huà)面,如日常看到的 3D 電影、3D 電視等所呈現(xiàn)出的震撼場(chǎng)景,超強(qiáng)的視覺(jué)效果給人們帶來(lái)一場(chǎng)場(chǎng)視覺(jué)盛宴 [19],讓人們身臨其境。
5 結(jié) 語(yǔ)
智能化的計(jì)算機(jī)圖像識(shí)別技術(shù)提取出圖像中有用有價(jià)值的信息給人們,以便更好地服務(wù)人們的生產(chǎn)、生活。其應(yīng)用價(jià)值非常廣泛,在提升人民經(jīng)濟(jì)發(fā)展的同時(shí)還能保障財(cái)產(chǎn)的安全,發(fā)展前景廣闊。然而還需要繼續(xù)研究提升識(shí)別精度, 不斷地創(chuàng)新完善技術(shù),使其更加多維化、智能化,為促進(jìn)我國(guó)社會(huì)的智能化與可持續(xù)化發(fā)展做出貢獻(xiàn)。