如何選用合適DSP元件進(jìn)行低功率設(shè)計
許多嵌入式處理器都宣稱它們的功耗最低。但是事實上沒有一顆元件能在所有的應(yīng)用中保持最低功耗,因為低功耗的定義與應(yīng)用環(huán)境習(xí)習(xí)相關(guān),適合某種應(yīng)用的晶片設(shè)計很可能會給另一種應(yīng)用帶來難題。可攜式應(yīng)用多半是根據(jù)電池壽命來定義低功耗,這類應(yīng)用的功能相當(dāng)廣泛,操作模式也千變?nèi)f化。電信系統(tǒng)元件若要滿足應(yīng)用電源需求,就必須在功率預(yù)算范圍內(nèi)處理所要求的通道數(shù)目,同時透過封裝和電路板將功耗散逸,以確保元件保持在額定溫度范圍內(nèi);另外,這些基礎(chǔ)設(shè)施應(yīng)用也很重視最大負(fù)載條件下的功耗。因此,為了達(dá)到功耗要求,DSP供應(yīng)商會針對目標(biāo)應(yīng)用選擇最合適的元件制程、電路設(shè)計、電壓和頻率操作點(diǎn)以及整體架構(gòu)。
省電技術(shù)
DSP供應(yīng)商有許多技術(shù)可以用來降低功耗,并且達(dá)成效能目標(biāo),包括:
●選擇適當(dāng)制程;
●電晶體設(shè)計技術(shù);
●選擇正確的操作頻率和電壓;
●選擇正確的架構(gòu),包括整合度、記憶體架構(gòu)和運(yùn)算處理單元;
●採用散熱效率很高的封裝,確保元件保持在特定操作溫度范圍內(nèi)。
功耗來源
無論應(yīng)用為何,元件功耗都包含下面幾種來源:
漏電功耗(leakage power)
元件的漏電功耗為固定值,不受處理器動作或操作頻率影響,但會隨著制程、操作電壓和溫度而改變。低精密度(low geometry)制程的漏電功耗多半會跟著電壓和溫度而呈指數(shù)增加。
時脈功耗(clocking power)
元件的時脈功耗與時脈頻率成正比。高整合度元件的晶片面積多半用于記憶體或暫存器等同步組件,如果時脈架構(gòu)設(shè)計不良,那么無論元件實際工作量多寡,其功耗都會保持不變。
操作功耗(active power)
與元件當(dāng)時所執(zhí)行的實際系統(tǒng)功能有關(guān)。
除了上述來源之外,元件功耗還會受到兩大因素影響:
元件電流
元件電流越高,電池電力的消耗速度就越快,有時還會超出功率預(yù)算范圍而導(dǎo)致供應(yīng)電壓下降,使元件脫離正常操作區(qū)而造成錯誤。
元件/系統(tǒng)溫度升高
元件若無法有效散熱,其溫度就可能超出額定范圍而造成操作錯誤。
下列最佳化技術(shù)會以不同方式解決前述各種功耗問題。
選擇適當(dāng)制程
為了使不同應(yīng)用的效能和功耗達(dá)到最佳化,德州儀器(TI)能提供各種制程類型,例如TI的130奈米低漏電制程在1.5V操作時幾乎沒有漏電流,對于DSP多半處于閑置狀態(tài)的可攜式應(yīng)用而言,這種低漏電制程就能幫助它們節(jié)省功耗。另一種高效能制程的漏電流較大,卻能在1.2V下操作,採用該制程的元件可以達(dá)到低漏電制程的兩倍MHz效能。在較重視最大操作功耗(fully-active power)的基礎(chǔ)設(shè)施應(yīng)用里,這種高效能制程的競爭力還勝過低漏電制程,原因有兩點(diǎn):首先,低漏電運(yùn)算處理單元的操作頻率只有高效能制程的一半,這表示其數(shù)量必須加倍才能提供同樣效能,但這會導(dǎo)致元件成本提高。其次,由于功耗與電壓平方成正比,故在其他條件相同的情形下,高效能制程的操作功耗只有低漏電制程的(1.2V/1.5V)2或是64%。由于低操作功耗對于基礎(chǔ)設(shè)施應(yīng)用的重要性通常會超過低漏電功耗,因此高效能制程就成為這類應(yīng)用的最佳選擇。
電晶體設(shè)計
同樣制程的電晶體也可以有不同的開關(guān)臨界電壓(VT),例如低VT電晶體的切換速度較快,高VT電晶體的漏電流則較小,晶片只需在會影響速度的部份使用低VT電晶體,其它電路則採用高VT電晶體以節(jié)省電力。設(shè)計人員的元件資料庫應(yīng)包含高VT和低VT電晶體所構(gòu)成的基本邏輯閘(NAND、NOR和INVERT等),他們有時還會使用中間臨界電壓(middle-VT)的電晶體。一般說來,除非為了滿足重要的效能要求,否則應(yīng)盡量使用高VT電晶體組成的邏輯閘。
元件操作點(diǎn):電壓和頻率
數(shù)種元件時脈供應(yīng)方式可以節(jié)省功耗:
●多時脈域(multiple clock domain);
●動態(tài)頻率調(diào)整(dynamic frequency scaling);
●時脈閘控(clock gating)。
除了時脈,調(diào)整電壓也能降低功耗:
●靜態(tài)電壓調(diào)整;
●動態(tài)電壓/頻率調(diào)整;
●多電壓域(multiple voltage domain)。
多時脈域
時脈域是元件中使用同一個時脈頻率的部份。將晶片電路分成多個時脈域可以讓每個部份以最適當(dāng)?shù)乃俣炔僮鳎M(jìn)而節(jié)省電力。例如高效能DSP可能需要以1GHz操作,但連接至立體聲編碼解碼器界面的串列埠卻只需12MHz的速度。雖然多時脈域設(shè)計還需要同步電路和橋接電路讓訊號跨越不同的時脈域,其能大幅降低整體功耗。
頻率調(diào)整
元件的某些時脈域在不同時間可能會有不同的操作需求,例如處理器若在某段時間只有10%的運(yùn)算需求,那么將時脈頻率減為平常的1/10就能大幅降低時脈功耗。動態(tài)時脈調(diào)整電路的設(shè)計必須非常小心,以確保同步邏輯電路收到穩(wěn)定而不會跳動的最小負(fù)載週期時脈。頻率調(diào)整對于使用電池的應(yīng)用最有幫助。
時脈閘控
時脈閘控會切斷閑置電路的時脈,其中又以睡眠模式的做法最簡單,它讓使用者利用軟體關(guān)掉晶片部份電路。其它技術(shù)則自動將元件某些部份的時脈關(guān)掉,直到有需要時再啟動,例如乙太網(wǎng)路的媒體存取控制器(MAC)平常可處于睡眠模式,等到它偵測到網(wǎng)路后才開始工作。時脈閘控也和頻率調(diào)整一樣適合所有使用電池的應(yīng)用。
靜態(tài)電壓調(diào)整
若應(yīng)用的效能需求較低,元件也可在較低電壓下操作。舉例來說,若DSP是在1.2V電壓下以720 MHz速率工作,它也能使用1.1V電壓并以600MHz頻率操作。由于功耗與電壓平方成正比,在1.1V電壓下以600MHz速率操作的功耗只有720MHz功耗的(1.1V/1.2V)2,大約是84%左右。另外,操作功耗也會因為時脈頻率降低而減少兩成。
動態(tài)電壓/頻率調(diào)整
這種技術(shù)讓電壓隨著頻率而減少以進(jìn)一步節(jié)省功耗。頻率的切換同樣必須非常小心,元件應(yīng)先將時脈切斷,然后才改變操作電壓。動態(tài)電壓
/頻率調(diào)整技術(shù)非常適合可攜式應(yīng)用。[!--empirenews.page--]
電壓域
多域的觀念同樣適用于電壓,設(shè)計人員可以根據(jù)效能需求將晶片分成多個部份,而每個部份使用不同的電壓。由于不同的電壓域必須以隔離電路分開,保護(hù)它們不受其它電壓域的損害,因此這種技術(shù)用于設(shè)計時必須相當(dāng)謹(jǐn)慎。它們還必須提供轉(zhuǎn)換電路,用來轉(zhuǎn)換跨越不同電壓域的訊號。多電壓域需要多組電源,然而晶片內(nèi)建穩(wěn)壓器的效率通常都比不上電路板層級的電源供應(yīng)器,因此這類設(shè)計多半需要由電路板供應(yīng)多組電源,這正是多電壓域技術(shù)的缺點(diǎn)之一:因為電路板需要增加多個電源層,使得設(shè)計復(fù)雜性大幅提升。
電源閘控(power supply gating)
電源閘控又比時脈閘控技術(shù)更進(jìn)一步,它會直接切斷晶片閑置電路的電源。由于這種技術(shù)更復(fù)雜,又需要隔離電路,因此通常會用于比時脈閘控技術(shù)(以個別電路為單位)還大的范圍(多半以模組為單位)。這種技術(shù)和多電壓域技術(shù)也有所不同,其隔離電路會內(nèi)建于晶片,避免增加電路板設(shè)計的復(fù)雜性。
操作點(diǎn)技術(shù)的應(yīng)用范圍
上述技術(shù)是否有用,端賴使用者是根據(jù)電池壽命或最大功耗來評斷應(yīng)用系統(tǒng)的優(yōu)劣。某些技術(shù)幾乎對所有應(yīng)用都有幫助,例如多時脈域和多電壓域技術(shù)只需用到時脈頻率和電壓,所以任何應(yīng)用系統(tǒng)都可以採用這兩種技術(shù)。域的數(shù)目只會受到這些技術(shù)所帶來的設(shè)計復(fù)雜性限制,多電壓域還可能受到電路板復(fù)雜性的影響。同樣地,多數(shù)元件的電路并非都是在最大負(fù)載條件下操作,因此時脈閘控技術(shù)(尤其採用自動控制方式的技術(shù))在許多應(yīng)用都能發(fā)揮作用。靜態(tài)電壓調(diào)整對所有應(yīng)用都有好處,因為元件只會在提供所需效能的必要電壓下操作。
應(yīng)用系統(tǒng)若以電池為電源,并提供多種操作模式,那么頻率調(diào)整和動態(tài)電壓/頻率調(diào)整技術(shù)就能發(fā)揮最大作用;另一方面,這些方法對于重視最大功耗的應(yīng)用卻沒有太大用處。除此之外,電源閘控對于這些類似于基礎(chǔ)設(shè)施的應(yīng)用可能也沒有幫助,因為這類應(yīng)用的元件很少會有大片電路處于閑置狀態(tài)。
選擇適當(dāng)架構(gòu)
調(diào)整應(yīng)用功耗的另一種做法是選擇最適當(dāng)?shù)墓δ苷隙?、運(yùn)算處理單元和記憶體架構(gòu)。
週邊和記憶體的整合
元件和外部零件需要透過電路板互傳訊號,有可能是系統(tǒng)功耗的主要來源,因為經(jīng)由電路板傳送訊號需要比晶片功能整合還高的電壓,電路板訊號線的寄生電容也會造成功耗。
運(yùn)算處理單元的調(diào)整
以系統(tǒng)單晶片為主的現(xiàn)代元件可以選擇不同類型的運(yùn)算處理單元:
DSP
專門執(zhí)行訊號和影像處理演算法的處理器,內(nèi)建多組應(yīng)用最佳化硬體運(yùn)算邏輯單元和乘法器,能以極高效率執(zhí)行標(biāo)準(zhǔn)訊號處理演算法。這類元件具備完整的可程式能力,可以輕松支援未來出現(xiàn)的新標(biāo)準(zhǔn)。
通用處理器
ARM處理器就是例子,其主要用來執(zhí)行一般性功能,例如圖形化使用者界面、網(wǎng)路堆疊(network stack)和整體系統(tǒng)控制。由于它們不必整合DSP功能所需的運(yùn)算處理單元,所以執(zhí)行一般性功能時功耗就比較小。
特殊用途硬體協(xié)同處理器
只包含特定功能所需的算術(shù)單元和控制電路。如果應(yīng)用功能的定義很明確,又不太可能改變,即可將該功能整合到硬體協(xié)同處理器。舉例來說,整合了Viterbi和Turbo處理器的DSP,便可專門執(zhí)行3G基地臺標(biāo)準(zhǔn)所要求的前向錯誤更正(FEC)。
今日的系統(tǒng)單晶片多半會整合前述多種運(yùn)算處理單元。有些架構(gòu)會採用多種不同類型的運(yùn)算處理單元,然后將不同的功能交給最適當(dāng)?shù)暮诵膱?zhí)行。DSP可以高效率執(zhí)行訊號處理,RISC則適合處理系統(tǒng)控制和使用者界面等工作。由于每個運(yùn)算處理單元都以實際所需的速度執(zhí)行最擅長的工作,故能將功耗減至最小;相形之下,若只用一個運(yùn)算處理單元執(zhí)行所有功能,其時脈頻率就必須更高,同時還要包含更多硬體,其中有些部份可能經(jīng)常處于閑置狀態(tài)。換言之,這類設(shè)計的工作效率必然較低,而在工作效率就等于電源效率的情形下,其功耗必然更高。
記憶體系統(tǒng)的選擇
元件若想避免存取外部記憶體,也可將應(yīng)用所需的記憶體全部整合至晶片內(nèi)。然而視訊或影像系統(tǒng)之類的應(yīng)用卻需要極為龐大的記憶體,將它們?nèi)空现辆璧某杀究赡苓h(yuǎn)超過直接在電路板上增加DRAM的費(fèi)用。這類應(yīng)用可以利用快取架構(gòu)來減少外部記憶體的存取次數(shù),進(jìn)行降低系統(tǒng)總功耗。
就算元件包含全部所需的記憶體,快取也能幫助它們降低功耗。這類元件可以將少量的第一層快取記憶體直接連線到處理器,使其儲存主記憶體中最常用的內(nèi)容。主記憶體則是第二層記憶體,其速度通常較慢,所用的記憶體方塊也比第一層快取更省電。由于處理器的多數(shù)存取動作都會命中第一層快取記憶體,這些記憶體又採用電容值較小的結(jié)構(gòu),所以每次存取動作的功耗就變得更低。[!--empirenews.page--]
封裝與功耗
前述所有省電技術(shù)都能幫助元件減少產(chǎn)生熱量,封裝則能透過高效率散熱進(jìn)一步加強(qiáng)它們的效果。傳統(tǒng)的風(fēng)扇、散熱空間或
散熱片都不適合空間有限的可攜式應(yīng)用,它們的高度或成本也可能超過插入式模組或汽車應(yīng)用所能接受的范圍;相形之下,金屬散熱蓋或散熱層雖會增加元件成本,卻能提供更高散熱效率。有些元件還將散熱錫球連接到元件的散熱接地面,由它透過電路板來達(dá)成更良好的散熱效果。
選擇適當(dāng)技術(shù)
電池供電型應(yīng)用
可攜式或掌上型應(yīng)用最重視電池壽命,但可攜式應(yīng)用使用電池的方式卻有極大差異??蓴y式產(chǎn)品有許多不同的操作模式,設(shè)計人員必須將這些模式列入考慮才能讓電池享有最長壽命。
MP3播放機(jī)
由于歌曲下載時間只佔(zhàn)播放少部份的時間,這類產(chǎn)品的電力多半用于歌曲播放。為了將待機(jī)功耗減到最少,它們還會在一段時間后自動關(guān)機(jī)。MP3播放機(jī)必須將音樂即時解壓縮,避免資料流失造成各種雜音。MP3播放機(jī)的效能需求遠(yuǎn)小于視訊處理或?qū)掝l通訊等其它應(yīng)用,所以最適合使用低功耗DSP。這類元件通常會採用低漏電制程,因為漏電仍是主要功耗來源。它們還能採用頻率調(diào)整技術(shù),以便根據(jù)歌曲所需的解碼效能來降低元件的時脈頻率。
數(shù)位相機(jī)
這類產(chǎn)品有多種操作模式,包括:
(1)自動關(guān)機(jī)的待機(jī)模式;
(2)預(yù)視模式(等待拍攝相片);
(3)拍照模式(實際拍攝相片以及處理和壓縮影像);
(4)錄影模式(部份相機(jī)具備此功能)。
數(shù)位相機(jī)的螢?zāi)挥袝r會開啟很長的時間,但DSP真正執(zhí)行影像壓縮的時間卻很短。數(shù)位相機(jī)在預(yù)視模式和拍攝模式都必須執(zhí)行許多即時處理作業(yè),在預(yù)視模式必須不斷顯示最新畫面,在拍攝模式則要盡快完成相片的處理和壓縮,以便繼續(xù)拍攝下一張照片,進(jìn)而將兩次拍攝之間的延遲時間縮到最短。這種DSP包含多種不同的運(yùn)算處理單元:
●ARM7核心,負(fù)責(zé)系統(tǒng)控制功能和使用者界面;
●TMS320C54x處理器;
●SIMD影像處理引擎(iMX),提供可程式影像處理功能;
●可變長度編碼和解碼(VLC/VLD)協(xié)同處理器,負(fù)責(zé)影像和視訊的壓縮與解壓縮;
●預(yù)視引擎,即時顯示預(yù)視畫面以及數(shù)位變焦。
它還具備很高的功能整合度,可以縮小產(chǎn)品體積和減少系統(tǒng)功耗:
●多用途的OSD功能;
●彩色液晶螢?zāi)坏臄?shù)位界面;
●CompactFlash、SmartMedia、Secure Digital以及Memory Stick記憶卡界面;
●多通道10位元數(shù)位類比轉(zhuǎn)換器,負(fù)責(zé)提供NTSC/PAL復(fù)合視訊輸出;
●多通道串列音訊Codec界面(McBSP);
●晶片內(nèi)建USB 1.1功能控制器。
這類裝置可以選定某些很少使用的功能,然后在它們處于閑置狀態(tài)時切斷時脈訊號。舉例來說,預(yù)視和待機(jī)模式可能不需要iMX和VLD/VLC功能方塊,相機(jī)未連接至個人電腦時則可將USB界面的電源關(guān)掉。
行動電話
標(biāo)準(zhǔn)行動電話有兩種電源模式:
(1)等待電話的待機(jī)模式;
(2)實際撥打電話的通話模式。
處于待機(jī)模式時,數(shù)據(jù)機(jī)功能(在等待電話時)會以低功耗模式操作,應(yīng)用功能(數(shù)位語音編碼和解碼)的電源則可完全切斷。手機(jī)進(jìn)入通話模式后,數(shù)據(jù)機(jī)功能和應(yīng)用功能就會在功耗較高的模式下操作。低耗電制程已能滿足這類手機(jī)的處理需求,因此許多產(chǎn)品都採用這種制程以節(jié)省電力,此時產(chǎn)品凈功耗與每種模式所佔(zhàn)用的時間有關(guān)。它們還能使用電壓和頻率調(diào)整技術(shù),以便根據(jù)操作模式的作業(yè)需求來調(diào)整元件功耗。先進(jìn)手機(jī)還增加數(shù)位相機(jī)、MP3和錄影功能,所以其操作模式也變得更多。為了支援這些操作模式,行動電話通常會採用不同類型處理器所組成的異質(zhì)架構(gòu),由DSP和各個操作模式專用的硬體加速器來執(zhí)行數(shù)據(jù)機(jī)和相機(jī)等應(yīng)用所需的訊號處理功能,再由DSP搭配負(fù)責(zé)使用者界面和系統(tǒng)控制功能的RISC處理器。如果某個模式不會用到加速器功能,系統(tǒng)也可切斷它們的電壓或時脈,例如待機(jī)模式不需要使用者界面時,可將RISC核心的電源關(guān)機(jī)。
可攜式應(yīng)用會視需要採取各種省電技術(shù),以便將重要操作模式的功耗減到最低。
基礎(chǔ)設(shè)施系統(tǒng)
封包語音(VoIP)或基地臺收發(fā)器等設(shè)備所用的無線和有線基礎(chǔ)設(shè)施雖屬于「插入式」應(yīng)用,卻仍須在不同的功耗限制下操作。有些系統(tǒng)會在電源供應(yīng)和系統(tǒng)散熱能力已經(jīng)固定的機(jī)架上,增加新的功能單元或通道容量,這些系統(tǒng)通常必須在室內(nèi)空調(diào)系統(tǒng)故障時繼續(xù)正常操作。每個機(jī)架的總功耗都不能超過現(xiàn)有電源供應(yīng)的供電能力,電源供應(yīng)會將電源提供給機(jī)架上的電路板,每張電路板再將電源分配給電路板上的不同元件。隨著半導(dǎo)體元件日益精密,晶片還能提高操作頻率或內(nèi)建多顆DSP處理器來支援更多通道。另一方面,不斷縮小的電路結(jié)構(gòu)卻讓晶片產(chǎn)生更多功耗,因此透過封裝提高散熱效率也變得更重要。由于這些系統(tǒng)必須非??煽浚栽诜治銎潆娫春蜕嵝枨髸r,應(yīng)將所有處理器都在最大負(fù)載下工作的情況列入考慮。
為了降低滿負(fù)載的操作功耗,這類系統(tǒng)多半會採用在較低電壓下操作的高效能制程,并且搭配對于任何應(yīng)用都有幫助的多時脈域和時脈閘控技術(shù)。這些系統(tǒng)不會利用多電壓域技術(shù)降低功耗,因其包含大量而密集的處理器,此時若採用多電壓域技術(shù)會造成電路板設(shè)計復(fù)雜性大幅增加。靜態(tài)電壓調(diào)整有助于節(jié)省功耗,由于功耗會隨著操作電壓的平方而改變,所以這些設(shè)計會選擇較低的操作電壓。這些元件還能整合更多核心,以彌補(bǔ)某些核心在較低頻率下操作所不足的效能,例如與其使用四個在1.2V下操作的300MHz核心,還不如使用6個在1.0 V下操作的200MHz核心,因為兩種解決方案的MHz效能(和通道處理能力)都是1200MHz,但后者功耗卻只有前者的(1.0V/1.2V)2,大約是69%。這些元件的晶片面積大都用于內(nèi)建記憶體,其中又以資料記憶體為主。由于在特定的通道處理密度下,每顆晶片所需的資料記憶體也是定值,而且其中多數(shù)記憶體又會直接分配給各個核心使用,所以增加核心并不會造成晶片總面積等比例增加,所帶來的低功耗優(yōu)點(diǎn)則足以彌補(bǔ)額外增加的成本。
功耗最佳化必須符合應(yīng)用需求
不同的DSP應(yīng)用設(shè)備需要不同的策略來滿足其需求,例如基礎(chǔ)設(shè)施系統(tǒng)希望降低最大負(fù)載條件下的功耗,可攜式應(yīng)用則希望將電池的電力消耗減至最少,它們的需求顯然就有極大差異。事實上,就算同類型的應(yīng)用都可能有著極為不同的要求,例如不同的可攜式應(yīng)用必須採取不同的電源最佳化技術(shù)來滿足各自的操作需求。半導(dǎo)體廠商想要服務(wù)各種市場,就必須掌握多種制程、設(shè)計和架構(gòu)技術(shù),才能針對目標(biāo)應(yīng)用提供最合適的元件。