嵌入式視覺(jué)發(fā)展迅速，如何選擇處理器來(lái)實(shí)現(xiàn)這一技術(shù)呢？

時(shí)間：2018-09-17 11:20:15

關(guān)鍵字：如何選擇嵌入式系統(tǒng) 技術(shù) 視覺(jué)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 作者：嵌入式視覺(jué)聯(lián)盟 BDTI創(chuàng)始人兼總裁Jeff Bier隨著功能越來(lái)越強(qiáng)大的處理器、圖像傳感器、存儲(chǔ)器和其他半導(dǎo)體器件以及相關(guān)算法的出現(xiàn)，可以在多種嵌入式系統(tǒng)中實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)功能，通過(guò)視頻輸入來(lái)分析周圍環(huán)境。微

作者：嵌入式視覺(jué)聯(lián)盟 BDTI創(chuàng)始人兼總裁Jeff Bier

隨著功能越來(lái)越強(qiáng)大的處理器、圖像傳感器、存儲(chǔ)器和其他半導(dǎo)體器件以及相關(guān)算法的出現(xiàn)，可以在多種嵌入式系統(tǒng)中實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)功能，通過(guò)視頻輸入來(lái)分析周圍環(huán)境。微軟的Kinect游戲控制器和Mobileye的輔助駕駛系統(tǒng)等產(chǎn)品都非常重視嵌入式視覺(jué)技術(shù)的發(fā)展?jié)摿Α＝Y(jié)果，很多嵌入式系統(tǒng)設(shè)計(jì)人員開(kāi)始思考如何實(shí)現(xiàn)嵌入式視覺(jué)功能。本文研究嵌入式視覺(jué)的發(fā)展機(jī)遇，對(duì)比實(shí)現(xiàn)這一技術(shù)的各種處理器選擇，介紹幫助工程師在其設(shè)計(jì)中采用視覺(jué)功能的業(yè)界聯(lián)盟。

“嵌入式視覺(jué)”這一名詞是指在嵌入式系統(tǒng)中使用計(jì)算機(jī)視覺(jué)技術(shù)。換句話說(shuō)，“嵌入式視覺(jué)”是指從視覺(jué)輸入中提取出其背后含義的嵌入式系統(tǒng)。與過(guò)去10年中無(wú)線通信技術(shù)的流行相類似，嵌入式視覺(jué)技術(shù)有望在今后10年得到廣泛應(yīng)用。

很明顯，嵌入式視覺(jué)技術(shù)能夠?yàn)槎喾N應(yīng)用帶來(lái)巨大的價(jià)值(圖1)。兩個(gè)例子是，Mobileye基于視覺(jué)的輔助駕駛系統(tǒng)，用于幫助防止車輛事故的發(fā)生；以及MG國(guó)際公司的泳池安全系統(tǒng)，旨在防止游泳溺水。還有一些純粹的怪才發(fā)明，Intellectual Ventures的激光滅蚊槍，設(shè)計(jì)用于防止人們感染瘧疾等。

圖1.嵌入式視覺(jué)是從計(jì)算機(jī)視覺(jué)應(yīng)用開(kāi)始的，這些應(yīng)用包括，裝配線檢查、光學(xué)字符識(shí)別、機(jī)器人技術(shù)、監(jiān)控和軍事系統(tǒng)等。但是，最近幾年，對(duì)降低成本提高性能的需求加速了這一技術(shù)在各種其他市場(chǎng)上的廣泛應(yīng)用。

正如同高速無(wú)線互聯(lián)是從高成本新奇技術(shù)起步一樣，目前為止，嵌入式視覺(jué)技術(shù)一般只用于復(fù)雜昂貴的系統(tǒng)中，例如，毛發(fā)移植的手術(shù)機(jī)器人，制造業(yè)的質(zhì)量控制檢查系統(tǒng)等。

數(shù)字集成電路的發(fā)展是高速無(wú)線技術(shù)從新奇發(fā)展到主流的關(guān)鍵因素。芯片速度足夠快，成本足夠低，能效足夠高時(shí)，高速無(wú)線技術(shù)便成為市場(chǎng)主流技術(shù)。今天，人們能夠以不到100美元的價(jià)格購(gòu)買寬帶無(wú)線調(diào)制解調(diào)器。

同樣的，數(shù)字芯片技術(shù)的進(jìn)步為嵌入式視覺(jué)的大批量應(yīng)用鋪平了道路(圖2)。與無(wú)線通信相似，嵌入式視覺(jué)需要很強(qiáng)的處理能力——特別是，越來(lái)越多的應(yīng)用采用了高分辨率攝像機(jī)，開(kāi)始使用多臺(tái)攝像機(jī)。以足夠低的成本實(shí)現(xiàn)這類處理能力，從而促進(jìn)大批量應(yīng)用，這是一個(gè)很大的挑戰(zhàn)。事實(shí)是嵌入式視覺(jué)應(yīng)用需要很強(qiáng)的可編程能力，進(jìn)一步增大了這一挑戰(zhàn)的難度。在無(wú)線應(yīng)用中，標(biāo)準(zhǔn)意味著不同手機(jī)之間的基帶算法不會(huì)有太大的變化，與之相比，在嵌入式視覺(jué)應(yīng)用中，通過(guò)獨(dú)特的算法，有可能得到更好的結(jié)果——實(shí)現(xiàn)更有價(jià)值的功能。

圖2.嵌入式視覺(jué)輔助系統(tǒng)涉及到硬件、半導(dǎo)體和軟件元器件供應(yīng)商，子系統(tǒng)開(kāi)發(fā)人員、系統(tǒng)集成商，以及最終用戶，還有實(shí)現(xiàn)未來(lái)突破的基礎(chǔ)研究等。本文主要關(guān)注圖中顯示的嵌入式視覺(jué)算法處理技術(shù)。

采用嵌入式視覺(jué)，業(yè)界進(jìn)入了一種“良性循環(huán)”，這是很多其他數(shù)字信號(hào)處理(DSP)應(yīng)用領(lǐng)域的特點(diǎn)。目前雖然很少有專門用于嵌入式視覺(jué)應(yīng)用的芯片，但是，這些應(yīng)用越來(lái)越多的采用了針對(duì)其他應(yīng)用開(kāi)發(fā)的高性能、高性價(jià)比處理芯片，包括，數(shù)字信號(hào)處理器、CPU、FPGA和GPU等。這些芯片單位成本、單位功率的可編程性能越來(lái)越高，因此，能夠支持實(shí)現(xiàn)大批量嵌入式視覺(jué)產(chǎn)品。這些大批量應(yīng)用也相應(yīng)的引起了硅片提供商更多的關(guān)注，他們會(huì)提供更好的性能、更高的效率和可編程處理能力。

處理選擇

如前所述，視覺(jué)算法通常需要很強(qiáng)的計(jì)算能力。當(dāng)然，所有的嵌入式系統(tǒng)一般都受限于嚴(yán)格的成本和功耗要求。在其他DSP應(yīng)用領(lǐng)域，例如，數(shù)字無(wú)線通信等，芯片設(shè)計(jì)人員使用專用協(xié)處理器和加速器來(lái)完成應(yīng)用所要求的苛刻的處理任務(wù)，同時(shí)滿足了高性能、低成本和低功耗需求，從而解決了這一難題。但是，芯片用戶一般不能對(duì)這些協(xié)處理器和加速器進(jìn)行編程。

無(wú)線應(yīng)用通常能夠接受這些優(yōu)缺點(diǎn)，無(wú)線應(yīng)用標(biāo)準(zhǔn)意味著不同設(shè)備設(shè)計(jì)人員使用的算法之間有很強(qiáng)的共性。然而在視覺(jué)應(yīng)用中，對(duì)算法的選擇并沒(méi)有標(biāo)準(zhǔn)約束。相反，一般可以選擇很多方法來(lái)解決某一特殊的視覺(jué)問(wèn)題。因此，視覺(jué)算法是非常多樣的，往往隨著時(shí)間的變化而迅速變化。結(jié)果，與數(shù)字無(wú)線和以壓縮技術(shù)為主的消費(fèi)類視頻設(shè)備等應(yīng)用相比，視覺(jué)應(yīng)用并不傾向于采用非可編程加速器和協(xié)處理器。

但是很難同時(shí)實(shí)現(xiàn)高性能、低成本和低功耗以及可編程功能。專用硬件通常能夠以低成本實(shí)現(xiàn)高性能，但是可編程能力較弱。通用CPU具有可編程能力，但是性能較差，性價(jià)比不高，能效也較低。要求較高的嵌入式視覺(jué)應(yīng)用通常結(jié)合使用多個(gè)處理單元，例如，可能會(huì)包括：

●通用CPU，用于啟發(fā)式復(fù)雜判決、網(wǎng)絡(luò)訪問(wèn)、用戶接口、存儲(chǔ)管理和總體控制等。

●高性能數(shù)字信號(hào)處理器，用于實(shí)時(shí)中等速率處理，不太復(fù)雜的算法等。

●用于簡(jiǎn)單算法像素速率處理的一個(gè)或者多個(gè)高度并行的引擎。

任何處理器在理論上都可以用于嵌入式視覺(jué)，目前最有可能的類型是：

●高性能嵌入式CPU

●專用標(biāo)準(zhǔn)產(chǎn)品(ASSP)與CPU相結(jié)合

●具有CPU的圖形處理單元(GPU)

●具有加速器以及CPU的數(shù)字信號(hào)處理器

●移動(dòng)“應(yīng)用處理器”

●具有CPU的現(xiàn)場(chǎng)可編程門陣列(FPGA)

各類處理器，及其在嵌入式視覺(jué)應(yīng)用上的關(guān)鍵優(yōu)缺點(diǎn)

高性能嵌入式CPU

在很多情況下，嵌入式CPU不能提供足夠的性能實(shí)現(xiàn)要求較高的視覺(jué)算法——也不能夠以可以接受的價(jià)格或者功耗來(lái)滿足性能要求。通常，存儲(chǔ)器帶寬是關(guān)鍵性能瓶頸，因?yàn)橐曈X(jué)算法通常使用大量的數(shù)據(jù)，不會(huì)重復(fù)訪問(wèn)相同的數(shù)據(jù)。嵌入式CPU的存儲(chǔ)器系統(tǒng)無(wú)法設(shè)計(jì)適應(yīng)這類數(shù)據(jù)流。然而，與大部分處理器相類似，隨著時(shí)間的推移，嵌入式CPU的性能在逐漸增強(qiáng)，在某些情況下，能夠提供足夠的性能。

在可能的情況下，有足夠的理由在CPU上運(yùn)行視覺(jué)算法。首先，大部分嵌入式系統(tǒng)需要CPU來(lái)實(shí)現(xiàn)各種功能。如果所需要的視覺(jué)功能能夠通過(guò)這種CPU來(lái)實(shí)現(xiàn)，那么，相對(duì)于多處理器解決方案相比，這降低了系統(tǒng)的復(fù)雜度。而且，大部分視覺(jué)算法一開(kāi)始是在PC上開(kāi)發(fā)的，使用了通用CPU及其相關(guān)的軟件開(kāi)發(fā)工具。PC CPU和嵌入式CPU (及其相關(guān)的工具)之間的相似性意味著，與其他類型的嵌入式視覺(jué)處理器相比，一般比較容易在嵌入式CPU上通過(guò)嵌入方式實(shí)現(xiàn)視覺(jué)算法。最后，嵌入式CPU使用起來(lái)通常比其他類型的嵌入式視覺(jué)處理器更簡(jiǎn)單，這是因?yàn)槠湎鄬?duì)直觀的體系結(jié)構(gòu)、成熟的工具以及其他的應(yīng)用開(kāi)發(fā)基礎(chǔ)支持平臺(tái)等，例如，操作系統(tǒng)。

結(jié)合了CPU的ASSP

ASSP是專用、集成度很高的芯片，定制用于特殊應(yīng)用或者專業(yè)應(yīng)用。ASSP可以采用CPU，或者使用單獨(dú)的CPU芯片。憑借專業(yè)化，與其他類型的處理解決方案相比，ASSP通常具有優(yōu)異的成本和能效。在其他技術(shù)中，ASSP通過(guò)使用專用協(xié)處理器和加速器來(lái)提高效率。而且，由于ASSP主要集中在專業(yè)應(yīng)用上，因此，通常需要大量的應(yīng)用軟件。

這種專業(yè)化使得ASSP能夠?qū)崿F(xiàn)很高的效率，但是，也帶來(lái)了很大的局限：缺乏靈活性。設(shè)計(jì)用于某一應(yīng)用的ASSP一般不能用于其他應(yīng)用，甚至目標(biāo)應(yīng)用相關(guān)的應(yīng)用。ASSP使用唯一的體系結(jié)構(gòu)，與其他類型的處理器相比，更難進(jìn)行編程。實(shí)際上，某些ASSP并不支持用戶編程。另一方面的考慮是風(fēng)險(xiǎn)問(wèn)題。ASSP通常由小供應(yīng)商提供，這可能會(huì)增加難以提供芯片的風(fēng)險(xiǎn)，或者無(wú)法提供后續(xù)產(chǎn)品以幫助系統(tǒng)設(shè)計(jì)人員更新其設(shè)計(jì)，設(shè)計(jì)人員不得不從頭開(kāi)始進(jìn)行設(shè)計(jì)。

具有CPU的GPU

GPU主要是用于3D圖形，并且越來(lái)越多的用于實(shí)現(xiàn)其他功能，例如，視覺(jué)應(yīng)用等。目前，個(gè)人計(jì)算機(jī)的GPU傾向于可編程，除了3D圖形還能完成其他功能。這類GPU被稱為“通用GPU”，或者“GPGPU”。GPU有很強(qiáng)的并行處理能力。它們?cè)趥€(gè)人計(jì)算機(jī)上是獨(dú)一無(wú)二的?？梢悦赓M(fèi)使用GPU軟件開(kāi)發(fā)工具，從GPGPU開(kāi)始進(jìn)行編程并不是很復(fù)雜。出于這些原因，在PC上第一次開(kāi)發(fā)其計(jì)算機(jī)視覺(jué)算法的開(kāi)發(fā)人員通常采用GPU作為并行處理引擎，他們出于仿真或者原型開(kāi)發(fā)的目的，需要加速算法的執(zhí)行。

GPU緊密集成了通用CPU，有時(shí)候是在同一芯片上。然而，GPU芯片的一種局限是目前能夠集成的CPU類型有限，而且支持這類集成的CPU操作系統(tǒng)也很有限。目前，可以提供設(shè)計(jì)用于智能電話和平板電腦等產(chǎn)品的低成本、低功耗GPU。但是，這些GPU一般不是GPGPU，因此，除了3D圖形之外，將其用在其他應(yīng)用中有很大的難度。

具有加速器以及CPU的數(shù)字信號(hào)處理器

數(shù)字信號(hào)處理器是專門用于信號(hào)處理算法和應(yīng)用的微處理器。對(duì)于視覺(jué)應(yīng)用核心的信號(hào)處理等任務(wù)，這種專業(yè)化使得數(shù)字信號(hào)處理器的效率要遠(yuǎn)遠(yuǎn)高于通用CPU。而且，與其他類型的并行處理器相比，數(shù)字信號(hào)處理器相對(duì)比較成熟，使用起來(lái)更方便。

但是，雖然數(shù)字信號(hào)處理器在視覺(jué)算法上的性能和效率要高于通用CPU，但仍然難以提供足夠的性能來(lái)滿足算法要求。出于這一原因，DSP一般需要一個(gè)或者多個(gè)輔助協(xié)處理器。因此，視覺(jué)應(yīng)用中一個(gè)典型的DSP芯片包括了CPU、數(shù)字信號(hào)處理器以及多個(gè)協(xié)處理器。這種異質(zhì)結(jié)合能夠產(chǎn)生很好的性能和很高的效率，但也難以編程。實(shí)際上，DSP供應(yīng)商一般不支持用戶對(duì)協(xié)處理器進(jìn)行編程；而是讓協(xié)處理器運(yùn)行芯片供應(yīng)商開(kāi)發(fā)的軟件函數(shù)庫(kù)。

移動(dòng)“應(yīng)用處理器”

移動(dòng)“應(yīng)用處理器”是集成度非常高的芯片系統(tǒng)，一般主要設(shè)計(jì)用于智能電話，而不是其他應(yīng)用。應(yīng)用處理器通常包括高性能CPU內(nèi)核，以及各種特殊的協(xié)處理器，例如，數(shù)字信號(hào)處理器、GPU、視頻處理單元(VPU)、2D圖形處理器，以及圖像采集處理器等。

這些芯片專門針對(duì)電池供電應(yīng)用進(jìn)行了設(shè)計(jì)，因此，能效非常高。而且，由于圍繞智能電話和平板電腦的應(yīng)用越來(lái)越重要，因此，移動(dòng)應(yīng)用處理器一般有很強(qiáng)的軟件開(kāi)發(fā)基礎(chǔ)支持平臺(tái)，包括，低成本開(kāi)發(fā)電路板、Linux和Android端口等。然而，正如前面章節(jié)對(duì)數(shù)字信號(hào)處理器的討論，應(yīng)用處理器中的專用協(xié)處理器一般不是用戶可編程的，限制了它們?cè)谝曈X(jué)應(yīng)用中的發(fā)展。

具有CPU的FPGA

FPGA是靈活的邏輯芯片，可以在門級(jí)和模塊級(jí)進(jìn)行重新配置。這一靈活性使得用戶能夠隨時(shí)實(shí)現(xiàn)定制滿足應(yīng)用需求的計(jì)算結(jié)構(gòu)。它還支持選擇滿足應(yīng)用需求的I/O接口和片內(nèi)外設(shè)。能夠定制計(jì)算結(jié)構(gòu)，結(jié)合現(xiàn)代FPGA中大量的資源，同時(shí)實(shí)現(xiàn)了高性能和良好的性價(jià)比和能效比。

但是，使用FGPA實(shí)際上是硬件設(shè)計(jì)功能，而不是軟件開(kāi)發(fā)工作。一般在寄存器傳送級(jí)(RTL)使用硬件描述語(yǔ)言(Verilog或者VHLD)來(lái)進(jìn)行FPGA設(shè)計(jì)，寄存器傳送級(jí)是很低的抽象級(jí)。與使用本文討論的其他類型的處理器相比，這使得FPGA設(shè)計(jì)非常耗時(shí)，成本也高。

雖然如此，使用FPGA越來(lái)越方便了，這是由多種因素造成的。首先，是所謂的“IP模塊”庫(kù)——可重用FPGA設(shè)計(jì)組件庫(kù)，其功能越來(lái)越強(qiáng)大了。在某些情況下，這些庫(kù)能夠直接滿足視覺(jué)算法要求。在其他一些應(yīng)用中，它們還支持視頻I/O端口或者掃描線緩沖等功能。而且，F(xiàn)GPA供應(yīng)商及其合作伙伴提供了越來(lái)越多的參考設(shè)計(jì)——采用了FPGA的可重用系統(tǒng)設(shè)計(jì)，面向?qū)I(yè)應(yīng)用。最后，利用高級(jí)綜合工具，設(shè)計(jì)人員使用高級(jí)語(yǔ)言，在FPGA中實(shí)現(xiàn)視覺(jué)和其他算法，而且效率越來(lái)越高。用戶可以在FPGA中實(shí)現(xiàn)性能相對(duì)低一些的CPU。而且，在少量的應(yīng)用中，F(xiàn)PGA制造商在器件中集成了高性能CPU。

總結(jié)

采用嵌入式視覺(jué)，業(yè)界進(jìn)入了一種“良性循環(huán)”，這是很多其他DSP應(yīng)用領(lǐng)域的特點(diǎn)。目前雖然很少有專門用于嵌入式視覺(jué)應(yīng)用的芯片，但是，這些應(yīng)用越來(lái)越多的采用了針對(duì)其他應(yīng)用開(kāi)發(fā)的高性能、高性價(jià)比處理芯片，包括，數(shù)字信號(hào)處理器、CPU、FPGA和GPU等。這些芯片單位成本、單位功率的可編程性能越來(lái)越高，因此，能夠支持實(shí)現(xiàn)大批量嵌入式視覺(jué)產(chǎn)品。這些大批量應(yīng)用也相應(yīng)的引起了硅片提供商更多的關(guān)注，他們會(huì)提供更好的性能、更高的效率和可編程處理能力。嵌入式視覺(jué)聯(lián)盟還可以幫助工程師利用這些芯片來(lái)開(kāi)發(fā)多種新奇的產(chǎn)品。