當(dāng)前位置:首頁(yè) > 電源 > 數(shù)字電源
[導(dǎo)讀]尋求高性能處理能力的嵌入式設(shè)計(jì)人員在成本、性能、功耗上,不可避免的面臨類(lèi)似“百慕大三角”的困境,無(wú)法同時(shí)實(shí)現(xiàn)三者的最佳組合,而只能達(dá)到其中的兩個(gè)目標(biāo)。定制ASIC設(shè)計(jì)適用于那些能夠負(fù)擔(dān)得起時(shí)間、費(fèi)用

尋求高性能處理能力的嵌入式設(shè)計(jì)人員在成本、性能、功耗上,不可避免的面臨類(lèi)似“百慕大三角”的困境,無(wú)法同時(shí)實(shí)現(xiàn)三者的最佳組合,而只能達(dá)到其中的兩個(gè)目標(biāo)。定制ASIC設(shè)計(jì)適用于那些能夠負(fù)擔(dān)得起時(shí)間、費(fèi)用和風(fēng)險(xiǎn)的少數(shù)人,但是由于器件尺寸持續(xù)減小,而ASIC設(shè)計(jì)成本不斷攀升,完全定制設(shè)計(jì)受成本限制,能夠應(yīng)用的領(lǐng)域越來(lái)越少。

具有多個(gè)軟核處理器的FPGA嵌入式系統(tǒng)為嵌入式設(shè)計(jì)人員提供了強(qiáng)大的多種功能選項(xiàng),通過(guò)定制功能配置性能最佳的片內(nèi)系統(tǒng)不再是ASIC設(shè)計(jì)人員的專(zhuān)利。現(xiàn)在,開(kāi)發(fā)人員能夠趕在產(chǎn)品進(jìn)入最終測(cè)試之前,對(duì)其嵌入式系統(tǒng)性能特性進(jìn)行修改。開(kāi)發(fā)人員還可以延長(zhǎng)產(chǎn)品生命周期,將產(chǎn)品迅速推向市場(chǎng),通過(guò)互聯(lián)網(wǎng)對(duì)硬件和軟件功能進(jìn)行遠(yuǎn)端升級(jí)。

盡管術(shù)語(yǔ)“多處理器”會(huì)使人聯(lián)想起學(xué)術(shù)文章中的“并行處理”一詞,實(shí)際商用的單器件多CPU則簡(jiǎn)單明了得多。開(kāi)始進(jìn)行一個(gè)新設(shè)計(jì)時(shí),開(kāi)發(fā)人員必須考慮一定的性能標(biāo)準(zhǔn)。多個(gè)軟核處理器之間的任務(wù)劃分具有很大的設(shè)計(jì)靈活性,實(shí)現(xiàn)了由于規(guī)范或競(jìng)爭(zhēng)產(chǎn)品變化而進(jìn)行的最后一刻設(shè)計(jì)更改,同時(shí)能夠與這些性能標(biāo)準(zhǔn)保持同步。

多軟核處理器可作為一種分而治之的策略來(lái)提高系統(tǒng)整體性能,或者卸載現(xiàn)有處理器任務(wù)。設(shè)計(jì)人員通常采用400MHz~800MHz的分立處理器實(shí)現(xiàn)簡(jiǎn)單和復(fù)雜的多種器件任務(wù)。采用多個(gè)軟核處理器,可根據(jù)時(shí)間和功耗要求,通過(guò)任務(wù)劃分,更高效的發(fā)揮處理能力,提供同樣甚至更好的整體性能。

單個(gè)FPGA中能夠?qū)崿F(xiàn)的軟核處理器數(shù)量?jī)H受器件資源的限制(如,邏輯和存儲(chǔ)器資源)。例如,高密度FPGA可以含有幾百個(gè)軟核處理器,并且可以采用不同類(lèi)型的軟核處理器,如16位或32位、性能最佳、邏輯面積最佳處理器等。

根據(jù)任務(wù)不同,編碼算法由多個(gè)處理器進(jìn)行分擔(dān)。專(zhuān)用處理器承擔(dān)對(duì)時(shí)間要求嚴(yán)的任務(wù),而要求不高的任務(wù)則由一個(gè)或多個(gè)其他CPU分擔(dān)。這種靈活性實(shí)現(xiàn)了任務(wù)的邏輯分組,能夠以較低的時(shí)鐘頻率和功耗實(shí)現(xiàn)較高的性能。

FPGA中的嵌入式處理器

ASIC設(shè)計(jì)人員對(duì)構(gòu)建定制器件進(jìn)行了多年的研究,因此,我們不難想象定制器件應(yīng)包含一組合適的外設(shè)、存儲(chǔ)器接口和處理功能。直到1990年后期,FPGA才能夠提供足夠的片內(nèi)存儲(chǔ)器、可編程邏輯等基本性能資源來(lái)實(shí)現(xiàn)經(jīng)濟(jì)可行的定制FPGA嵌入式處理器器件。現(xiàn)在,可直接使用專(zhuān)為FPGA設(shè)計(jì)的嵌入式IP功能(包括CPU、信號(hào)處理引擎、外設(shè)和標(biāo)準(zhǔn)通信接口等),與傳統(tǒng)分立的嵌入式器件相比,它具有成本和性能的雙重優(yōu)勢(shì)。

從本質(zhì)上看,設(shè)計(jì)人員對(duì)問(wèn)題的劃分與在印刷電路板上構(gòu)建一個(gè)多處理器系統(tǒng)相類(lèi)似。每一部分分配不同的任務(wù),一個(gè)處理器進(jìn)行一般的系統(tǒng)管理(風(fēng)扇監(jiān)控、人機(jī)接口、系統(tǒng)控制臺(tái)等),其他的則處理通信、信號(hào)處理、統(tǒng)計(jì)收集等系統(tǒng)任務(wù)。

多處理器方案將分立的處理器功能由電路板移到FPGA內(nèi)部,從而降低了器件整體成本,也同時(shí)減小了電路板尺寸。這種方案需要較少的互連,減少了處理器之間的信號(hào)布線。更多的低級(jí)處理器運(yùn)行在更低的時(shí)鐘頻率上,減少了電路板層數(shù)。

該方法還可以降低軟件設(shè)計(jì)成本,減少80%由于耗時(shí)的代碼編寫(xiě)而造成的系統(tǒng)整體設(shè)計(jì)時(shí)間代價(jià)。如果任務(wù)能夠劃分給多個(gè)處理器,那么工程師就能夠直接迅速的進(jìn)行源代碼編寫(xiě)、調(diào)試和維護(hù)。產(chǎn)品成熟時(shí),由于可以方便的對(duì)源代碼進(jìn)行分析,因此代碼維護(hù)比較輕松。

多通道應(yīng)用

多通道應(yīng)用采用單芯片多處理器來(lái)滿足系統(tǒng)吞吐量要求,每個(gè)處理器專(zhuān)用于處理全部通道吞吐量的不同部分,它們運(yùn)行完全相同的源代碼,也可以根據(jù)系統(tǒng)要求靈活的改變算法。在有些情況下,加入主處理器來(lái)處理一般的系統(tǒng)管理任務(wù),如系統(tǒng)初始化、統(tǒng)計(jì)收集和錯(cuò)誤處理等。
 

串行鏈接的處理器

系統(tǒng)結(jié)構(gòu)將一個(gè)鏈上的幾個(gè)處理器組合對(duì)待為更復(fù)雜流水線上的一級(jí)。每個(gè)CPU負(fù)責(zé)全部處理任務(wù)的一部分,共享數(shù)據(jù)存儲(chǔ)器(片外采用仲裁或?qū)S么鎯?chǔ)器接口,片內(nèi)采用雙端口存儲(chǔ)器),將結(jié)果由一級(jí)的輸出傳向下一級(jí)的輸入。

處理器協(xié)同芯片

不管CPU是否在FPGA內(nèi)部,與FPGA連接的分立處理器和DSP芯片也可以使用硬件加速、外設(shè)擴(kuò)展和接口橋接等。現(xiàn)在,可直接使用芯片間接口IP,實(shí)現(xiàn)對(duì)FPGA內(nèi)部外設(shè)、加速邏輯和I/O接口的外部訪問(wèn)。
 

確定處理器性能

在應(yīng)用軟件還沒(méi)有明確時(shí),很難確定嵌入式系統(tǒng)的處理器性能。業(yè)界標(biāo)準(zhǔn)會(huì)有一些幫助,但是在軟件完成之前,一切都具有不確定性。這使得設(shè)計(jì)人員非常謹(jǐn)慎,擔(dān)心低估性能要求,而選擇高于所需性能(價(jià)格也高)要求的器件。如果設(shè)計(jì)人員能夠準(zhǔn)確的預(yù)測(cè)所需性能,那么選擇處理器將變得非常簡(jiǎn)單。這種預(yù)測(cè)要考慮對(duì)時(shí)間要求嚴(yán)的任務(wù)以及一個(gè)或多個(gè)低級(jí)任務(wù)所產(chǎn)生的負(fù)載對(duì)性能的要求。

基于FPGA的嵌入式系統(tǒng)提供靈活的性能,支持最后一刻更改,根據(jù)客戶要求來(lái)提升系統(tǒng)性能。將

含有大量計(jì)算的算法轉(zhuǎn)換為FPGA中的邏輯后,其運(yùn)行速度比微處理器或數(shù)字信號(hào)處理器實(shí)現(xiàn)的相同軟件算法快出幾個(gè)數(shù)量級(jí)。更重要的是,硬件資源可提供給對(duì)性能要求高的算法,從而降低了對(duì)高性能CPU的需求,并降低了時(shí)鐘頻率和功耗,簡(jiǎn)化了電路板設(shè)計(jì)。[!--empirenews.page--]
 

擴(kuò)展指令集

多個(gè)處理器IP供應(yīng)商能夠擴(kuò)展處理器指令集,以包含在硬件中實(shí)施的專(zhuān)用算法,并在FPGA中實(shí)現(xiàn)。采用處理器常用的加載/存儲(chǔ)操作,數(shù)據(jù)可饋入到定制邏輯模塊中,成為處理器算法邏輯單元(ALU)的一部分。在有些情況下,定制指令能夠支持多周期操作,實(shí)現(xiàn)對(duì)FIFO和存儲(chǔ)器緩沖等其他系統(tǒng)資源的訪問(wèn)。定制指令的典型應(yīng)用包括位處理、復(fù)雜的數(shù)值和邏輯運(yùn)算等。

依靠處理器加載和存儲(chǔ)操作,定制指令與采用通用ALU資源運(yùn)行同樣算法相比,具有明顯的性能優(yōu)勢(shì)。例如,64kbyte的循環(huán)冗余校驗(yàn)(CRC)以定制指令運(yùn)行時(shí),運(yùn)行速度比軟件快出27倍1。不同的應(yīng)用具有不同的性能結(jié)果,但是總體上比單獨(dú)采用軟件快得多。

處理器IP供應(yīng)商不同,開(kāi)發(fā)人員如何使用定制指令也各不相同。例如,在加入定制指令時(shí),有的必須生成一個(gè)新的編譯器。然后,根據(jù)應(yīng)用標(biāo)準(zhǔn),這種定制編譯器導(dǎo)出定制指令調(diào)用。更簡(jiǎn)單的方法是由用戶在其C源代碼中作為子程序來(lái)直接調(diào)用指令。由于軟件設(shè)計(jì)人員能夠更清楚的掌握何時(shí)使用定制指令,因此這種方法更自然一些。

提升系統(tǒng)性能的多種方法

其他提升系統(tǒng)整體性能的方法包括利用硬件加速(也稱(chēng)為協(xié)處理器)、處理器協(xié)同芯片以及定制片內(nèi)系統(tǒng)等。

與定制指令不同,硬件加速器作為獨(dú)立的邏輯模塊直接從嵌入式CPU獲取指令,不需要CPU干預(yù),處理全部數(shù)據(jù)緩沖。一個(gè)簡(jiǎn)單的模塊框圖包括帶有兩個(gè)1/2 DMA通道的處理模塊(一個(gè)讀取輸入數(shù)據(jù),另一個(gè)存儲(chǔ)結(jié)果)以及一個(gè)控制接口,用于CPU建立、啟動(dòng)、停止以及工作中對(duì)各單元的輪詢等。這種體系結(jié)構(gòu)非常適合于對(duì)大塊數(shù)據(jù)的處理,此時(shí),CPU加載數(shù)據(jù)并存儲(chǔ)結(jié)果成為性能瓶頸。

硬件加速器由于其固有的自治特性,能夠比軟件運(yùn)行任務(wù)提高幾個(gè)數(shù)量級(jí)的性能增益,因此加速功能通常在硬件中設(shè)計(jì)實(shí)現(xiàn)。

不管CPU是否在FPGA內(nèi)部,與FPGA連接的分立處理器和DSP協(xié)同芯片都可以使用硬件加速、擴(kuò)展外設(shè)以及接口橋接等。現(xiàn)在,可直接使用芯片間接口IP,實(shí)現(xiàn)對(duì)FPGA內(nèi)部外設(shè)、加速邏輯和I/O接口的外部訪問(wèn)。

總結(jié)

在FPGA中采用多個(gè)軟核處理器,根據(jù)時(shí)間和功耗要求劃分任務(wù),可高效使用處理能力,與分立處理器相比,具有相同甚至更高的整體性能。多個(gè)軟核處理器還可以用作分而治之的策略,來(lái)提升系統(tǒng)整體性能或者卸載現(xiàn)有處理器任務(wù),這種策略僅受目標(biāo)FPGA邏輯和存儲(chǔ)器資源的限制。

一類(lèi)新的硬件開(kāi)發(fā)工具、知識(shí)產(chǎn)權(quán)內(nèi)核以及FPGA體系實(shí)現(xiàn)了這些技術(shù)的主流應(yīng)用。在嵌入式領(lǐng)域,由于這些技術(shù)的成功,主要FPGA供應(yīng)商進(jìn)一步加大了開(kāi)發(fā)和投入。在您下一個(gè)設(shè)計(jì)中,應(yīng)考慮如何應(yīng)用這些技術(shù)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉