當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 【導(dǎo)讀】:最新,眼擎科技eyemore成像引擎隨處可見,讓機(jī)器擁有人眼,真有那么厲害還是吹捧過度呢? 視覺“識(shí)別”是人工智能時(shí)代下,對安防行業(yè)而言最重要

【導(dǎo)讀】:最新,眼擎科技eyemore成像引擎隨處可見,讓機(jī)器擁有人眼,真有那么厲害還是吹捧過度呢?

視覺“識(shí)別”是人工智能時(shí)代下,對安防行業(yè)而言最重要的技術(shù)之一,但目前無論是人臉識(shí)別還是車輛識(shí)別,都面臨著被復(fù)雜光線影響的問題,而后端算法只能做到在特定場景、特定光線狀況下,對物體進(jìn)行有效識(shí)別,可一旦光線發(fā)生了變化,識(shí)別率就會(huì)大打折扣。

機(jī)器視覺不能重蹈語音識(shí)別的覆轍。”眼擎科技CEO朱繼志告訴億歐,語音識(shí)別技術(shù)已經(jīng)宣稱識(shí)別率達(dá)到99%,但卻遲遲無法在生活場景中大規(guī)模應(yīng)用,原因就在于“99%的數(shù)據(jù)是在安靜的實(shí)驗(yàn)室中得出的,而生活場景中有大量的噪音,這對識(shí)別產(chǎn)生了巨大的干擾。”同理,在視覺識(shí)別中,攝像頭正常光照下的成像AI識(shí)別率能接近100%,但實(shí)際部署中不可避免會(huì)遇到弱光、逆光、反光等復(fù)雜光的影響,所以現(xiàn)實(shí)中算法識(shí)別率遠(yuǎn)不能達(dá)到實(shí)驗(yàn)室的“理論”效果。

“大腦要強(qiáng),但如果感知端無法傳輸有效的信息,那么大腦再強(qiáng)也沒有用。”針對當(dāng)前AI成像的問題,朱繼志于2014年創(chuàng)立了眼擎科技,研發(fā)超越人眼視覺能力的成像引擎技術(shù)及芯片,解決數(shù)碼成像在弱光、逆光、反光等復(fù)雜光環(huán)境下成像的痛點(diǎn)。

AI視覺新問題:大腦夠強(qiáng)了,眼睛卻跟不上

在安防領(lǐng)域,每年攝像頭出貨量超過1億臺(tái),人臉識(shí)別、車輛識(shí)別等算法的成熟持續(xù)帶動(dòng)著安防市場擴(kuò)大,但在實(shí)際應(yīng)用中,“識(shí)別”受到了諸多環(huán)境因素的限制,其中最重要一個(gè)挑戰(zhàn)就是復(fù)雜光線。

“如果將整個(gè)識(shí)別的系統(tǒng)比作一個(gè)人,我們現(xiàn)在已經(jīng)有很強(qiáng)的大腦了,但眼睛卻跟不上。”朱繼志告訴億歐,要對人臉、車輛進(jìn)行識(shí)別的前提條件,是前端攝像頭能夠傳回清晰的畫面。但現(xiàn)在的問題是,在光線環(huán)境足夠好的時(shí)候,“大腦”對畫面內(nèi)容的識(shí)別率能接近100%;但在弱光、逆光、反光等復(fù)雜光環(huán)境下,由于無法接收到清晰的畫面,“大腦”對畫面內(nèi)容的識(shí)別率大打折扣。

為了解決復(fù)雜光問題,業(yè)內(nèi)出現(xiàn)了各種各樣的應(yīng)對方法。針對黑暗或弱光環(huán)境,可以使用紅外線,或者直接在攝像頭旁加裝一盞燈,“但這些方法只能解決一部分的光問題,而且還有’副作用’。”朱繼志說,紅外線只能在近距離發(fā)揮作用,而且成像噪點(diǎn)大,畫質(zhì)極易受到干擾;而加裝燈的方法只在某些場景下可行,“比如晚上在閘機(jī)口處加裝燈是可行的,但在公路上抓拍車輛的場景卻不合適。”朱繼志說道,大多數(shù)司機(jī)都對夜晚路過抓拍機(jī)的爆閃燈“有很不好的體驗(yàn)”,但如果不加裝爆閃燈,監(jiān)控設(shè)備就無法正常捕捉到車輛信息。

解決單一非正常光環(huán)境的方法已經(jīng)不盡如人意了,而前端設(shè)備需要面臨的遠(yuǎn)不止一種光環(huán)境。朱繼志告訴億歐,弱光、逆光、反光等只是復(fù)雜光線下的幾種典型,而大部分在戶外使用的攝像頭需要面臨的卻是多種復(fù)雜光線交替出現(xiàn)的場景。

以閘機(jī)口為例,攝像頭架設(shè)的位置和方向是固定的,但一天中光線的強(qiáng)弱、光源位置都會(huì)發(fā)生變化。“早上太陽從東邊升起,傍晚從西邊落下,到了晚上又是黑的。”朱繼志說,如果攝像機(jī)朝向東方,則早上逆光現(xiàn)象就會(huì)非常嚴(yán)重,朝向西邊也是同理,到了晚上又是弱光,而通常情況下算法只能針對其中一種狀況作出優(yōu)化,這給閘機(jī)的高效識(shí)別帶來巨大的挑戰(zhàn)。

打破被日系企業(yè)壟斷的ISP架構(gòu)

不解決弱光、逆光、反光等復(fù)雜光環(huán)境下的自適應(yīng)能力,AI視覺產(chǎn)品就無法大規(guī)模落地進(jìn)行產(chǎn)業(yè)化。但要怎么做才能解決這個(gè)問題呢?

朱繼志認(rèn)為,這個(gè)問題的出路在前端。“無論是什么樣的光環(huán)境,只要前端設(shè)備面臨負(fù)責(zé)光線對成像的干擾時(shí),依然能夠輸出如同正常光環(huán)境下成像的效果。那么企業(yè)在后端算法上就不需要再做過多的定制,如此一來,企業(yè)就能夠生產(chǎn)更多標(biāo)準(zhǔn)化的產(chǎn)品,提升企業(yè)、乃至整個(gè)行業(yè)的效率。”

要改造前端設(shè)備,首先需要了解當(dāng)前攝像機(jī)成像的原理,以及存在的問題。

朱繼志介紹道,在數(shù)碼時(shí)代,攝像頭成像需要經(jīng)歷幾個(gè)環(huán)節(jié)。首先,光線穿過鏡頭后,要經(jīng)過CMOS傳感器,CMOS會(huì)將光信號(hào)轉(zhuǎn)化為電信號(hào),“但這個(gè)電信號(hào)是很粗糙的,”朱繼志說,“如果要將它再轉(zhuǎn)化成一張可視化的圖像,就要再經(jīng)過ISP。”

ISP全稱為Image Signal Processing,即圖像信號(hào)處理,主要用來對前端圖像傳感器輸出信號(hào)處理進(jìn)行處理。ISP架構(gòu)能夠通過一些列的工作,實(shí)現(xiàn)自動(dòng)光圈、自動(dòng)曝光、自動(dòng)白平衡等功能,讓電信號(hào)真正變成一張可看的圖像。

“但傳統(tǒng)的ISP架構(gòu)有兩大問題。”朱繼志說。第一個(gè)問題是所有RAW數(shù)據(jù)在進(jìn)入ISP架構(gòu)時(shí),會(huì)直接從16位被裁成8位,導(dǎo)致了大量RAW數(shù)據(jù)信息丟失。RAW是一個(gè)單獨(dú)的數(shù)據(jù)流,如果16位的信息變成8位,那么再轉(zhuǎn)換成JPG格式圖片時(shí),圖片信息就會(huì)比原始的RAW數(shù)據(jù)信息少256倍。“這就是為什么圖像在逆光、反光等復(fù)雜光環(huán)境下質(zhì)量不高、成像不清晰的原因。”

另一個(gè)問題是,ISP架構(gòu)所有核心技術(shù)都被日本企業(yè)掌握。“日本公司是成像行業(yè)的頭部企業(yè),如果他們都不對ISP架構(gòu)進(jìn)行突破,那其他公司更加不可能做出大的改變。”朱繼志說道。

但成像中存在的痛點(diǎn)深深影響著AI視覺產(chǎn)品的大規(guī)模落地是不爭的事實(shí)。既然無法改變傳統(tǒng)的ISP架構(gòu),那就一定要在技術(shù)上進(jìn)行創(chuàng)新。秉著這樣的初衷,眼擎科技完全拋棄了日系成像技術(shù)的ISP架構(gòu),打破了日系廠商在成像領(lǐng)域的技術(shù)壟斷,開發(fā)出了全新的“成像引擎”。

從“給人看”到“給機(jī)器看

“如果一個(gè)問題存在了很久,都沒有被現(xiàn)有架構(gòu)解決,這說明一定要有全新的技術(shù)架構(gòu)才能破解難題。”朱繼志告訴億歐,眼擎科技開發(fā)的“成像引擎”就是這樣一個(gè)解決復(fù)雜光環(huán)境下AI視覺成像問題的全新架構(gòu)。

“傳統(tǒng)ISP架構(gòu)的目的是為了實(shí)現(xiàn)成像這個(gè)功能,”朱繼志說,“但成像引擎重視的是成像的性能。”

據(jù)了解,成像引擎是一個(gè)“算力+算法+數(shù)據(jù)”的全新成像架構(gòu),具有學(xué)習(xí)功能。朱繼志向億歐介紹道,處理圖片是一個(gè)十分復(fù)雜的過程,因此算力對成像引擎而言十分重要;但光有算力是不夠的,還要開發(fā)出針對不同場景的算法,才能解決實(shí)際應(yīng)用中的問題;在算力和算法都具備的條件下,最終還需要在不同復(fù)雜光環(huán)境下進(jìn)行測試,以收集到更多的場景數(shù)據(jù),讓算法進(jìn)行學(xué)習(xí),達(dá)到讓整個(gè)成像引擎能夠適應(yīng)多種復(fù)雜光環(huán)境的目的。

在成像引擎實(shí)際運(yùn)作中,“經(jīng)過CMOS的8~16位RAW數(shù)據(jù)進(jìn)來時(shí),我們直接基于RAW數(shù)據(jù)進(jìn)行無裁剪處理,如果按照16位的數(shù)據(jù)來算,成像引擎處理的原始圖像信息量比傳統(tǒng)ISP高256倍,最后把它壓縮成8位的JPG圖像。”朱繼志說,這樣的方法能夠保留所有圖像細(xì)節(jié)信息,無論在什么光線環(huán)境下,都能對圖像實(shí)現(xiàn)優(yōu)質(zhì)處理。

“顏色是AI測量世界的根本依據(jù),也是深度學(xué)習(xí)進(jìn)行圖像識(shí)別的基礎(chǔ)。”朱繼志認(rèn)為,成像技術(shù)的目的已經(jīng)從“給人看”過渡到“給機(jī)器看”,“AI視覺需要的是一把標(biāo)尺,關(guān)注的不是美顏、像素,而是準(zhǔn)確的輸出物體的顏色、銳度以及豐富的細(xì)節(jié)。”

據(jù)了解目前成像引擎暗光能力比人眼高8倍,降噪能力比攝像頭高64倍,逆光能力比攝像頭高32倍。未來三年,眼擎科技的使命就是讓成像引擎芯片的成像能力將全方位超越人眼。

AI視覺的“最后一公里”

今年1月,眼擎科技推出了完全自主研發(fā)的全球首款復(fù)雜光線專用成像芯片eyemoreX42。除了成像芯片,眼擎科技也通過提供成像開發(fā)套件、成像模組、成像算法IP以及深度定制成像方案等一系列全套的成像技術(shù)方案及服務(wù)。

“我們定位是一家上游的芯片公司。”朱繼志告訴億歐。傳統(tǒng)ISP架構(gòu)集成在SoC里面,而眼擎科技拋棄ISP架構(gòu)后,需要填補(bǔ)成像技術(shù)的空白,但眼擎科技的成像引擎是一個(gè)“算力+算法+數(shù)據(jù)”的全新成像架構(gòu),原來ISP在SoC中所處的位置無法承擔(dān)成像引擎的處理能力,“所以我們要單獨(dú)生產(chǎn)一個(gè)芯片來實(shí)現(xiàn)成像引擎的功能。”

“AI正驅(qū)動(dòng)著芯片產(chǎn)業(yè)發(fā)生變化。”朱繼志告訴億歐,以前CPU一家獨(dú)大,攝像機(jī)里只需要一個(gè)主芯片就能實(shí)現(xiàn)所有功能;但AI時(shí)代來臨后,GPU的重要性就體現(xiàn)出來了,所有算法都是基于GPU實(shí)現(xiàn),因此攝像機(jī)中需要加入GPU;但當(dāng)GPU的算力變得很強(qiáng)、算法很豐富的時(shí)候,前端攝像頭能力的好壞就成了AI視覺“最后一公里”的關(guān)鍵問題,因此還需要一款新的成像芯片來解決這個(gè)問題,眼擎科技解決的正是這“最后一公里”的問題。

朱繼志表示,眼擎科技的愿景是成為AI成像領(lǐng)域的頭部企業(yè),定位上游的技術(shù)方案商,通過賦能的方式,向下游打造終端產(chǎn)品的公司輸出自己的成像能力。據(jù)了解,眼擎科技未來將在安防、工業(yè)檢測、無人零售、智能醫(yī)療、機(jī)器人、深度相機(jī)等領(lǐng)域重點(diǎn)發(fā)力。

“我們是面向未來的,關(guān)注的是新產(chǎn)品和新應(yīng)用市場。”朱繼志告訴億歐,眼擎科技的戰(zhàn)略是先做核心技術(shù)突破,再找市場應(yīng)用部署,“場景與技術(shù)是相互推動(dòng)的,場景的需求能催生技術(shù)的更新,而技術(shù)的創(chuàng)新能’解鎖’更多應(yīng)用場景。”朱繼志說,比如在安防領(lǐng)域,眼擎的全新成像技術(shù)將變革閘機(jī)的場景,未來閘機(jī)處的攝像頭不再需要任何輔助光源,也能清晰的“看”見人和物;同樣,“未來公路上有爆閃燈,可能也會(huì)變成一件奇怪的事。”

今年是眼擎科技啟動(dòng)市場推廣的第一年,朱繼志認(rèn)為,將芯片推向市場需要2年的時(shí)間,之后還要再用2年的時(shí)間等待市場成熟。“AI視覺成像能力的改變并不是一蹴而就的,而是一個(gè)慢慢迭代升級的過程。”朱繼志說,只講技術(shù)原理,安防圈子的人都懂,但只有看到成像引擎的實(shí)際效果,市場才能對這個(gè)原創(chuàng)技術(shù)有最直觀的感知,“用戶體驗(yàn)這種主觀的感覺是很難說清楚的,所以還需要時(shí)間讓大家慢慢了解和接受。”

eyemore成像引擎,是否真像口頭說得那么厲害,只有到真正商用級別的時(shí)候才能見真章,更希望中國IOT大會(huì)中能夠見到眼擎科技帶來的干貨,在此我們滿懷期待,靜候眼擎科技佳音。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉