低功耗物聯(lián)網(wǎng)應(yīng)用的處理器配置
掃描二維碼
隨時(shí)隨地手機(jī)看文章
系統(tǒng)架構(gòu)要求
為了執(zhí)行高級(jí)系統(tǒng)功能,系統(tǒng)設(shè)計(jì)經(jīng)常要求升級(jí)應(yīng)用處理器的性能水平,但同時(shí)還要維持類似8位微控制器系統(tǒng)的功耗。把它想象成用發(fā)條玩具的電量提供一個(gè)智能手機(jī)的大腦。能配置處理器實(shí)現(xiàn)這些似乎有沖突的目標(biāo),至關(guān)重要。本文說明通過選擇和配置處理器,降低系統(tǒng)功耗的技術(shù)和方法。
把 DSP 處理與 RISC 處理相結(jié)合
物聯(lián)網(wǎng)設(shè)備的定義是根據(jù)它們的能力,包括吸收或“感知”真實(shí)世界的信號(hào),通過互聯(lián)網(wǎng)或本地網(wǎng)絡(luò)對(duì)關(guān)聯(lián)數(shù)據(jù)和通信結(jié)果進(jìn)行操作。大多數(shù)通用 RISC 處理器可以成功地處理信號(hào),但是專用的 DSP 處理這些任務(wù)的功耗效率更好,延遲更低。另一方面,RISC 處理器很適合傳遞數(shù)據(jù)和設(shè)置通信通道。用分離的多個(gè)獨(dú)立的處理器是一個(gè)選擇,但是它會(huì)增加系統(tǒng)的成本和板級(jí)空間,開發(fā)和調(diào)試還要用多種環(huán)境與工具。如果一個(gè)芯片兼具兩種功能,就可以降低復(fù)雜性和成本。
語音觸發(fā)、語音控制、語音回放和慣性傳感器處理等主要功能在實(shí)時(shí)啟動(dòng)和低功耗環(huán)境中已經(jīng)是必需品了,這就要求系統(tǒng)的DSP指令能夠在滿足低功耗目標(biāo)下實(shí)現(xiàn)諸如濾波、快速傅立葉變換(FFT)和插值等任務(wù)。
DesignWare® ARC® EMxD 系列處理器面對(duì)這些挑戰(zhàn),通過向 ARC 可配置處理器核心增加有 ARCv2DSP指令集架構(gòu)(ISA)的 DSP 引擎,在一個(gè)統(tǒng)一的架構(gòu)里進(jìn)行 RISC 和數(shù)字信號(hào)處理(圖 1)。它們功耗低,對(duì)語音控制用的語音檢測(cè)功耗可以低于 1 微瓦。
ARC EM DSP 處理器高度可配置,以便每個(gè)用例都可以量身定制,最好地平衡目標(biāo)應(yīng)用的 DSP 性能和 RISC 性能,以及功耗效率和面積效率。例如,ARC EM5D 和 EM7D 很適合需要約 50% DSP 處理的應(yīng)用,而 EM9D 和 EM11D 支持 XY 存儲(chǔ)器,用于 DSP 敏感的應(yīng)用很理想。ARC 處理器擴(kuò)展(APEX)技術(shù)還讓設(shè)計(jì)工程師能創(chuàng)建用戶定義指令,支持集成定制的硬件加速器,提高特定應(yīng)用的性能,同時(shí)又降低耗電量和減少需要的存儲(chǔ)器數(shù)量。
圖 1:ARC EMxD 框圖
包括支持多組存儲(chǔ)器
在RISC + DSP處理器中用來實(shí)現(xiàn)典型的 DSP MAC 操作的代碼,包括從存儲(chǔ)器加載數(shù)據(jù),然后按加載的操作數(shù)執(zhí)行 MAC 操作。如圖 2 所示,先是通過加載指令獲得兩個(gè)數(shù)據(jù)值然后緊接著進(jìn)行MAC操作,本架構(gòu)的最大吞吐量可以達(dá)到每個(gè)周期1/3 MAC。
圖 2:RISC + DSP 架構(gòu)中的 DSP MAC 操作
增加一個(gè) XY 存儲(chǔ)器系統(tǒng),可以支持需要更大吞吐量的 DSP 應(yīng)用。一個(gè)基于 XY 存儲(chǔ)器的系統(tǒng)一般包括多組存儲(chǔ)器和帶有指針和更新寄存器的自動(dòng)化地址生成單元(AGU)。AGU 置于指令流水線中,允許一條指令執(zhí)行三個(gè)數(shù)據(jù)移動(dòng)、一個(gè) MAC 操作和三個(gè)地址指針更新,支持多址指針升級(jí)模式。這種方法使用一個(gè)基于 XY 存儲(chǔ)器的系統(tǒng)架構(gòu),可以實(shí)現(xiàn)每個(gè)周期一個(gè) MAC 操作的有效吞吐量,顯著提升性能(圖 3)。因?yàn)?XY 存儲(chǔ)器系統(tǒng)不需要單獨(dú)加載和遞增指令,還能減少代碼。
圖 3:有 XY 存儲(chǔ)器的 RISC + DSP架構(gòu)里的DSP MAC 操作
除了提高吞吐量和減少代碼外,降低耗電量是常常被忽視的一大優(yōu)勢(shì)。如圖 4 所示,DSP 函數(shù)通過使用 XY 存儲(chǔ)器(EM9D)可以大幅節(jié)省電量,因?yàn)橥瑯拥暮瘮?shù)需要的時(shí)鐘周期數(shù)更少,尤其是為 RISC + DSP 架構(gòu)量身定制時(shí),允許 RISC 和 DSP 同時(shí)訪問。
圖 4:隨著 DSP 需要的增加,有無 XY 存儲(chǔ)器的耗電量比較
用緊密集成的存儲(chǔ)器
物聯(lián)網(wǎng)應(yīng)用對(duì)性能和處理能力的要求不斷提高,推動(dòng)了從緊密集成 8 位微處理器的嵌入式系統(tǒng)轉(zhuǎn)向基于總線的 32 位處理器嵌入式系統(tǒng)的發(fā)展趨勢(shì)。這個(gè)趨勢(shì)對(duì)系統(tǒng)的功耗和面積產(chǎn)生了負(fù)面影響,違背了物聯(lián)網(wǎng)產(chǎn)品隨著大規(guī)模應(yīng)用變得更小更便宜的主要需求。向 32 位嵌入式處理器系統(tǒng)緊密集成的擴(kuò)展,移除較為低效的總線基礎(chǔ)架構(gòu),可以同時(shí)實(shí)現(xiàn)所有這些系統(tǒng)目標(biāo)。處理器可以直接訪問各個(gè)存儲(chǔ)器和外部寄存器,降低延遲和需要的時(shí)鐘頻率,從而會(huì)降低執(zhí)行這些功能所需要的電量。
降低情況的示例如圖 5 所示,圖中比較了基于總線的處理器子系統(tǒng)和緊密集成的系統(tǒng)處理傳感器數(shù)據(jù)的用電情況。處理器核心訪問輔助寄存器用一個(gè)時(shí)鐘周期,而在基于總線的系統(tǒng)里,外部寄存器要用四個(gè)周期。
圖 5:緊密集成的系統(tǒng)中處理傳感器數(shù)據(jù)的省電情況
DMA
降低處理器系統(tǒng)功耗的另一種方法是使用直接存儲(chǔ)器訪問(DMA),這種方法使周邊設(shè)備不用涉及 CPU 就能移動(dòng)數(shù)據(jù)。要確保系統(tǒng)面積優(yōu)化,DMA 必須面向處理器和應(yīng)用進(jìn)行高度優(yōu)化。因?yàn)閮?nèi)部 DMA 移動(dòng)數(shù)據(jù)進(jìn)出 XY 存儲(chǔ)器不會(huì)影響處理器通道,所以把 DMA 和多級(jí)存儲(chǔ)器結(jié)合起來,甚至?xí)?jié)省更多電量。
Synopsys 的 ARC EM 系列處理器的 µDMA 法完全以物聯(lián)網(wǎng)應(yīng)用為目標(biāo),只包含這種類型的嵌入式系統(tǒng)需要的特性。µDMA 控制器通過讓 EM內(nèi)核休眠來降低電量操作,而 µDMA 圍繞芯片從周邊設(shè)備向存儲(chǔ)器移動(dòng)數(shù)據(jù),或在存儲(chǔ)器之間移動(dòng)數(shù)據(jù)時(shí),并且只在必要時(shí)才喚醒內(nèi)核。另外多種的休眠模式可以用來自定義最小的可運(yùn)行功耗。
軟件算法加速
如上所述,物聯(lián)網(wǎng)應(yīng)用的要求不斷擴(kuò)張,其中一個(gè)重要的關(guān)鍵是安全性。不過,安全算法會(huì)使系統(tǒng)更復(fù)雜,而系統(tǒng)的功耗和面積預(yù)算已經(jīng)非常緊張。通過減少時(shí)鐘周期來加速安全算法可以降低功耗。對(duì)系統(tǒng)需要的任何常見或常用功能來說,確實(shí)如此;通過提高執(zhí)行效率,用得越多越省電。
ARC EM 處理器系列使用 APEX 技術(shù),使 SoC 設(shè)計(jì)工程師可以簡(jiǎn)化和自動(dòng)化處理設(shè)計(jì)和驗(yàn)證常見功能的擴(kuò)展,像加密軟件算法或客戶專用代碼,從而使執(zhí)行這些常用算法耗費(fèi)的時(shí)間、存儲(chǔ)器和電量更少。
圖 6:使用APEX加速對(duì)傳感器應(yīng)用軟件運(yùn)行時(shí)的耗電量降低和周期數(shù)減少情況
結(jié)論
為物聯(lián)網(wǎng)應(yīng)用設(shè)計(jì)芯片時(shí),設(shè)計(jì)工程師為了滿足性能要求的不斷發(fā)展,經(jīng)常要考慮犧牲耗電量。設(shè)計(jì)工程師可以選擇架構(gòu)方法達(dá)到需要的性能而不犧牲能量效率。選擇處理器架構(gòu)時(shí),關(guān)鍵要看靈活性和可配置性,還要能擴(kuò)展以適應(yīng)不斷變化的應(yīng)用要求。
ARC EM 系列處理器可以擴(kuò)展,能提供不會(huì)過時(shí)的產(chǎn)品路線圖,能靈活找出最佳的性能功耗比。能用 APEX 技術(shù)定制處理器,就能在物聯(lián)網(wǎng)市場(chǎng)競(jìng)爭(zhēng)中差異化你的產(chǎn)品。