如何選用合適DSP元件進(jìn)行低功率設(shè)計

時間：2010-12-05 07:09:15

關(guān)鍵字： DSP 元件低功率晶片

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]許多嵌入式處理器都宣稱它們的功耗最低。但是事實上沒有一顆元件能在所有的應(yīng)用中保持最低功耗，因為低功耗的定義與應(yīng)用環(huán)境習(xí)習(xí)相關(guān)，適合某種應(yīng)用的晶片設(shè)計很可能會給另一種應(yīng)用帶來難題?？蓴y式應(yīng)用多半是根據(jù)電

許多嵌入式處理器都宣稱它們的功耗最低。但是事實上沒有一顆元件能在所有的應(yīng)用中保持最低功耗，因為低功耗的定義與應(yīng)用環(huán)境習(xí)習(xí)相關(guān)，適合某種應(yīng)用的晶片設(shè)計很可能會給另一種應(yīng)用帶來難題?？蓴y式應(yīng)用多半是根據(jù)電池壽命來定義低功耗，這類應(yīng)用的功能相當(dāng)廣泛，操作模式也千變?nèi)f化。電信系統(tǒng)元件若要滿足應(yīng)用電源需求，就必須在功率預(yù)算范圍內(nèi)處理所要求的通道數(shù)目，同時透過封裝和電路板將功耗散逸，以確保元件保持在額定溫度范圍內(nèi)；另外，這些基礎(chǔ)設(shè)施應(yīng)用也很重視最大負(fù)載條件下的功耗。因此，為了達(dá)到功耗要求，DSP供應(yīng)商會針對目標(biāo)應(yīng)用選擇最合適的元件制程、電路設(shè)計、電壓和頻率操作點以及整體架構(gòu)。

省電技術(shù)
　　
DSP供應(yīng)商有許多技術(shù)可以用來降低功耗，并且達(dá)成效能目標(biāo)，包括：
　　●選擇適當(dāng)制程；
　　●電晶體設(shè)計技術(shù)；
　　●選擇正確的操作頻率和電壓；
　　●選擇正確的架構(gòu)，包括整合度、記憶體架構(gòu)和運算處理單元；
　　●採用散熱效率很高的封裝，確保元件保持在特定操作溫度范圍內(nèi)。

功耗來源
　　
無論應(yīng)用為何，元件功耗都包含下面幾種來源：
　
漏電功耗（leakage power）
　
元件的漏電功耗為固定值，不受處理器動作或操作頻率影響，但會隨著制程、操作電壓和溫度而改變。低精密度（low geometry）制程的漏電功耗多半會跟著電壓和溫度而呈指數(shù)增加。

時脈功耗（clocking power）
　　
元件的時脈功耗與時脈頻率成正比。高整合度元件的晶片面積多半用于記憶體或暫存器等同步組件，如果時脈架構(gòu)設(shè)計不良，那么無論元件實際工作量多寡，其功耗都會保持不變。

操作功耗（active power）
　　
與元件當(dāng)時所執(zhí)行的實際系統(tǒng)功能有關(guān)。
　　
除了上述來源之外，元件功耗還會受到兩大因素影響：

元件電流
　　
元件電流越高，電池電力的消耗速度就越快，有時還會超出功率預(yù)算范圍而導(dǎo)致供應(yīng)電壓下降，使元件脫離正常操作區(qū)而造成錯誤。

元件/系統(tǒng)溫度升高
　　
元件若無法有效散熱，其溫度就可能超出額定范圍而造成操作錯誤。
　　
下列最佳化技術(shù)會以不同方式解決前述各種功耗問題。

選擇適當(dāng)制程
　　
為了使不同應(yīng)用的效能和功耗達(dá)到最佳化，德州儀器（TI）能提供各種制程類型，例如TI的130奈米低漏電制程在1.5V操作時幾乎沒有漏電流，對于DSP多半處于閑置狀態(tài)的可攜式應(yīng)用而言，這種低漏電制程就能幫助它們節(jié)省功耗。另一種高效能制程的漏電流較大，卻能在1.2V下操作，採用該制程的元件可以達(dá)到低漏電制程的兩倍MHz效能。在較重視最大操作功耗（fully-active power）的基礎(chǔ)設(shè)施應(yīng)用里，這種高效能制程的競爭力還勝過低漏電制程，原因有兩點：首先，低漏電運算處理單元的操作頻率只有高效能制程的一半，這表示其數(shù)量必須加倍才能提供同樣效能，但這會導(dǎo)致元件成本提高。其次，由于功耗與電壓平方成正比，故在其他條件相同的情形下，高效能制程的操作功耗只有低漏電制程的（1.2V/1.5V）2或是64％。由于低操作功耗對于基礎(chǔ)設(shè)施應(yīng)用的重要性通常會超過低漏電功耗，因此高效能制程就成為這類應(yīng)用的最佳選擇。

電晶體設(shè)計
　　
同樣制程的電晶體也可以有不同的開關(guān)臨界電壓（VT），例如低VT電晶體的切換速度較快，高VT電晶體的漏電流則較小，晶片只需在會影響速度的部份使用低VT電晶體，其它電路則採用高VT電晶體以節(jié)省電力。設(shè)計人員的元件資料庫應(yīng)包含高VT和低VT電晶體所構(gòu)成的基本邏輯閘（NAND、NOR和INVERT等），他們有時還會使用中間臨界電壓（middle-VT）的電晶體。一般說來，除非為了滿足重要的效能要求，否則應(yīng)盡量使用高VT電晶體組成的邏輯閘。
　　元件操作點：電壓和頻率
　　數(shù)種元件時脈供應(yīng)方式可以節(jié)省功耗：
　　●多時脈域（multiple clock domain）；
　　●動態(tài)頻率調(diào)整（dynamic frequency scaling）；
　　●時脈閘控（clock gating）。
　　除了時脈，調(diào)整電壓也能降低功耗：
　　●靜態(tài)電壓調(diào)整；
　　●動態(tài)電壓/頻率調(diào)整；
　　●多電壓域（multiple voltage domain）。

多時脈域
　　
時脈域是元件中使用同一個時脈頻率的部份。將晶片電路分成多個時脈域可以讓每個部份以最適當(dāng)?shù)乃俣炔僮鳎M(jìn)而節(jié)省電力。例如高效能DSP可能需要以1GHz操作，但連接至立體聲編碼解碼器界面的串列埠卻只需12MHz的速度。雖然多時脈域設(shè)計還需要同步電路和橋接電路讓訊號跨越不同的時脈域，其能大幅降低整體功耗。

頻率調(diào)整
　　
元件的某些時脈域在不同時間可能會有不同的操作需求，例如處理器若在某段時間只有10％的運算需求，那么將時脈頻率減為平常的1/10就能大幅降低時脈功耗。動態(tài)時脈調(diào)整電路的設(shè)計必須非常小心，以確保同步邏輯電路收到穩(wěn)定而不會跳動的最小負(fù)載週期時脈。頻率調(diào)整對于使用電池的應(yīng)用最有幫助。
時脈閘控
　　
時脈閘控會切斷閑置電路的時脈，其中又以睡眠模式的做法最簡單，它讓使用者利用軟體關(guān)掉晶片部份電路。其它技術(shù)則自動將元件某些部份的時脈關(guān)掉，直到有需要時再啟動，例如乙太網(wǎng)路的媒體存取控制器（MAC）平常可處于睡眠模式，等到它偵測到網(wǎng)路后才開始工作。時脈閘控也和頻率調(diào)整一樣適合所有使用電池的應(yīng)用。

靜態(tài)電壓調(diào)整
　　
若應(yīng)用的效能需求較低，元件也可在較低電壓下操作。舉例來說，若DSP是在1.2V電壓下以720 MHz速率工作，它也能使用1.1V電壓并以600MHz頻率操作。由于功耗與電壓平方成正比，在1.1V電壓下以600MHz速率操作的功耗只有720MHz功耗的（1.1V/1.2V）2，大約是84％左右。另外，操作功耗也會因為時脈頻率降低而減少兩成。

動態(tài)電壓/頻率調(diào)整
　　
這種技術(shù)讓電壓隨著頻率而減少以進(jìn)一步節(jié)省功耗。頻率的切換同樣必須非常小心，元件應(yīng)先將時脈切斷，然后才改變操作電壓。動態(tài)電壓

/頻率調(diào)整技術(shù)非常適合可攜式應(yīng)用。[!--empirenews.page--]

電壓域
　　
多域的觀念同樣適用于電壓，設(shè)計人員可以根據(jù)效能需求將晶片分成多個部份，而每個部份使用不同的電壓。由于不同的電壓域必須以隔離電路分開，保護(hù)它們不受其它電壓域的損害，因此這種技術(shù)用于設(shè)計時必須相當(dāng)謹(jǐn)慎。它們還必須提供轉(zhuǎn)換電路，用來轉(zhuǎn)換跨越不同電壓域的訊號。多電壓域需要多組電源，然而晶片內(nèi)建穩(wěn)壓器的效率通常都比不上電路板層級的電源供應(yīng)器，因此這類設(shè)計多半需要由電路板供應(yīng)多組電源，這正是多電壓域技術(shù)的缺點之一：因為電路板需要增加多個電源層，使得設(shè)計復(fù)雜性大幅提升。

電源閘控（power supply gating）
　　
電源閘控又比時脈閘控技術(shù)更進(jìn)一步，它會直接切斷晶片閑置電路的電源。由于這種技術(shù)更復(fù)雜，又需要隔離電路，因此通常會用于比時脈閘控技術(shù)（以個別電路為單位）還大的范圍（多半以模組為單位）。這種技術(shù)和多電壓域技術(shù)也有所不同，其隔離電路會內(nèi)建于晶片，避免增加電路板設(shè)計的復(fù)雜性。

操作點技術(shù)的應(yīng)用范圍
　　
上述技術(shù)是否有用，端賴使用者是根據(jù)電池壽命或最大功耗來評斷應(yīng)用系統(tǒng)的優(yōu)劣。某些技術(shù)幾乎對所有應(yīng)用都有幫助，例如多時脈域和多電壓域技術(shù)只需用到時脈頻率和電壓，所以任何應(yīng)用系統(tǒng)都可以採用這兩種技術(shù)。域的數(shù)目只會受到這些技術(shù)所帶來的設(shè)計復(fù)雜性限制，多電壓域還可能受到電路板復(fù)雜性的影響。同樣地，多數(shù)元件的電路并非都是在最大負(fù)載條件下操作，因此時脈閘控技術(shù)（尤其採用自動控制方式的技術(shù)）在許多應(yīng)用都能發(fā)揮作用。靜態(tài)電壓調(diào)整對所有應(yīng)用都有好處，因為元件只會在提供所需效能的必要電壓下操作。
　　
應(yīng)用系統(tǒng)若以電池為電源，并提供多種操作模式，那么頻率調(diào)整和動態(tài)電壓/頻率調(diào)整技術(shù)就能發(fā)揮最大作用；另一方面，這些方法對于重視最大功耗的應(yīng)用卻沒有太大用處。除此之外，電源閘控對于這些類似于基礎(chǔ)設(shè)施的應(yīng)用可能也沒有幫助，因為這類應(yīng)用的元件很少會有大片電路處于閑置狀態(tài)。

選擇適當(dāng)架構(gòu)
　　
調(diào)整應(yīng)用功耗的另一種做法是選擇最適當(dāng)?shù)墓δ苷隙?、運算處理單元和記憶體架構(gòu)。

週邊和記憶體的整合
　　
元件和外部零件需要透過電路板互傳訊號，有可能是系統(tǒng)功耗的主要來源，因為經(jīng)由電路板傳送訊號需要比晶片功能整合還高的電壓，電路板訊號線的寄生電容也會造成功耗。
　
運算處理單元的調(diào)整
　　
以系統(tǒng)單晶片為主的現(xiàn)代元件可以選擇不同類型的運算處理單元：

DSP
　　
專門執(zhí)行訊號和影像處理演算法的處理器，內(nèi)建多組應(yīng)用最佳化硬體運算邏輯單元和乘法器，能以極高效率執(zhí)行標(biāo)準(zhǔn)訊號處理演算法。這類元件具備完整的可程式能力，可以輕松支援未來出現(xiàn)的新標(biāo)準(zhǔn)。

通用處理器
　　
ARM處理器就是例子，其主要用來執(zhí)行一般性功能，例如圖形化使用者界面、網(wǎng)路堆疊（network stack）和整體系統(tǒng)控制。由于它們不必整合DSP功能所需的運算處理單元，所以執(zhí)行一般性功能時功耗就比較小。

特殊用途硬體協(xié)同處理器
　　
只包含特定功能所需的算術(shù)單元和控制電路。如果應(yīng)用功能的定義很明確，又不太可能改變，即可將該功能整合到硬體協(xié)同處理器。舉例來說，整合了Viterbi和Turbo處理器的DSP，便可專門執(zhí)行3G基地臺標(biāo)準(zhǔn)所要求的前向錯誤更正（FEC）。
　　
今日的系統(tǒng)單晶片多半會整合前述多種運算處理單元。有些架構(gòu)會採用多種不同類型的運算處理單元，然后將不同的功能交給最適當(dāng)?shù)暮诵膱?zhí)行。DSP可以高效率執(zhí)行訊號處理，RISC則適合處理系統(tǒng)控制和使用者界面等工作。由于每個運算處理單元都以實際所需的速度執(zhí)行最擅長的工作，故能將功耗減至最??；相形之下，若只用一個運算處理單元執(zhí)行所有功能，其時脈頻率就必須更高，同時還要包含更多硬體，其中有些部份可能經(jīng)常處于閑置狀態(tài)。換言之，這類設(shè)計的工作效率必然較低，而在工作效率就等于電源效率的情形下，其功耗必然更高。
記憶體系統(tǒng)的選擇
　　
元件若想避免存取外部記憶體，也可將應(yīng)用所需的記憶體全部整合至晶片內(nèi)。然而視訊或影像系統(tǒng)之類的應(yīng)用卻需要極為龐大的記憶體，將它們?nèi)空现辆璧某杀究赡苓h(yuǎn)超過直接在電路板上增加DRAM的費用。這類應(yīng)用可以利用快取架構(gòu)來減少外部記憶體的存取次數(shù)，進(jìn)行降低系統(tǒng)總功耗。
　　
就算元件包含全部所需的記憶體，快取也能幫助它們降低功耗。這類元件可以將少量的第一層快取記憶體直接連線到處理器，使其儲存主記憶體中最常用的內(nèi)容。主記憶體則是第二層記憶體，其速度通常較慢，所用的記憶體方塊也比第一層快取更省電。由于處理器的多數(shù)存取動作都會命中第一層快取記憶體，這些記憶體又採用電容值較小的結(jié)構(gòu)，所以每次存取動作的功耗就變得更低。[!--empirenews.page--]

封裝與功耗
　　
前述所有省電技術(shù)都能幫助元件減少產(chǎn)生熱量，封裝則能透過高效率散熱進(jìn)一步加強它們的效果。傳統(tǒng)的風(fēng)扇、散熱空間或
散熱片都不適合空間有限的可攜式應(yīng)用，它們的高度或成本也可能超過插入式模組或汽車應(yīng)用所能接受的范圍；相形之下，金屬散熱蓋或散熱層雖會增加元件成本，卻能提供更高散熱效率。有些元件還將散熱錫球連接到元件的散熱接地面，由它透過電路板來達(dá)成更良好的散熱效果。

選擇適當(dāng)技術(shù)

電池供電型應(yīng)用
　　
可攜式或掌上型應(yīng)用最重視電池壽命，但可攜式應(yīng)用使用電池的方式卻有極大差異。可攜式產(chǎn)品有許多不同的操作模式，設(shè)計人員必須將這些模式列入考慮才能讓電池享有最長壽命。

MP3播放機
　　
由于歌曲下載時間只佔播放少部份的時間，這類產(chǎn)品的電力多半用于歌曲播放。為了將待機功耗減到最少，它們還會在一段時間后自動關(guān)機。MP3播放機必須將音樂即時解壓縮，避免資料流失造成各種雜音。MP3播放機的效能需求遠(yuǎn)小于視訊處理或?qū)掝l通訊等其它應(yīng)用，所以最適合使用低功耗DSP。這類元件通常會採用低漏電制程，因為漏電仍是主要功耗來源。它們還能採用頻率調(diào)整技術(shù)，以便根據(jù)歌曲所需的解碼效能來降低元件的時脈頻率。

數(shù)位相機
　　
這類產(chǎn)品有多種操作模式，包括：
　　(1)自動關(guān)機的待機模式；
　　(2)預(yù)視模式（等待拍攝相片）；
　　(3)拍照模式（實際拍攝相片以及處理和壓縮影像）；
　　(4)錄影模式（部份相機具備此功能）。
　　
數(shù)位相機的螢?zāi)挥袝r會開啟很長的時間，但DSP真正執(zhí)行影像壓縮的時間卻很短。數(shù)位相機在預(yù)視模式和拍攝模式都必須執(zhí)行許多即時處理作業(yè)，在預(yù)視模式必須不斷顯示最新畫面，在拍攝模式則要盡快完成相片的處理和壓縮，以便繼續(xù)拍攝下一張照片，進(jìn)而將兩次拍攝之間的延遲時間縮到最短。這種DSP包含多種不同的運算處理單元：
　　●ARM7核心，負(fù)責(zé)系統(tǒng)控制功能和使用者界面；
　　●TMS320C54x處理器；
　　●SIMD影像處理引擎（iMX），提供可程式影像處理功能；
　　●可變長度編碼和解碼（VLC/VLD）協(xié)同處理器，負(fù)責(zé)影像和視訊的壓縮與解壓縮；
　　●預(yù)視引擎，即時顯示預(yù)視畫面以及數(shù)位變焦。
　　它還具備很高的功能整合度，可以縮小產(chǎn)品體積和減少系統(tǒng)功耗：
　　●多用途的OSD功能；
　　●彩色液晶螢?zāi)坏臄?shù)位界面；
　　●CompactFlash、SmartMedia、Secure Digital以及Memory Stick記憶卡界面；
　　●多通道10位元數(shù)位類比轉(zhuǎn)換器，負(fù)責(zé)提供NTSC/PAL復(fù)合視訊輸出；
　　●多通道串列音訊Codec界面（McBSP）；
　　●晶片內(nèi)建USB 1.1功能控制器。
　　
這類裝置可以選定某些很少使用的功能，然后在它們處于閑置狀態(tài)時切斷時脈訊號。舉例來說，預(yù)視和待機模式可能不需要iMX和VLD/VLC功能方塊，相機未連接至個人電腦時則可將USB界面的電源關(guān)掉。

行動電話
　　
標(biāo)準(zhǔn)行動電話有兩種電源模式：
　　(1)等待電話的待機模式；
　　(2)實際撥打電話的通話模式。
　　處于待機模式時，數(shù)據(jù)機功能（在等待電話時）會以低功耗模式操作，應(yīng)用功能（數(shù)位語音編碼和解碼）的電源則可完全切斷。手機進(jìn)入通話模式后，數(shù)據(jù)機功能和應(yīng)用功能就會在功耗較高的模式下操作。低耗電制程已能滿足這類手機的處理需求，因此許多產(chǎn)品都採用這種制程以節(jié)省電力，此時產(chǎn)品凈功耗與每種模式所佔用的時間有關(guān)。它們還能使用電壓和頻率調(diào)整技術(shù)，以便根據(jù)操作模式的作業(yè)需求來調(diào)整元件功耗。先進(jìn)手機還增加數(shù)位相機、MP3和錄影功能，所以其操作模式也變得更多。為了支援這些操作模式，行動電話通常會採用不同類型處理器所組成的異質(zhì)架構(gòu)，由DSP和各個操作模式專用的硬體加速器來執(zhí)行數(shù)據(jù)機和相機等應(yīng)用所需的訊號處理功能，再由DSP搭配負(fù)責(zé)使用者界面和系統(tǒng)控制功能的RISC處理器。如果某個模式不會用到加速器功能，系統(tǒng)也可切斷它們的電壓或時脈，例如待機模式不需要使用者界面時，可將RISC核心的電源關(guān)機。
　　
可攜式應(yīng)用會視需要採取各種省電技術(shù)，以便將重要操作模式的功耗減到最低。
基礎(chǔ)設(shè)施系統(tǒng)
　　
封包語音（VoIP）或基地臺收發(fā)器等設(shè)備所用的無線和有線基礎(chǔ)設(shè)施雖屬于「插入式」應(yīng)用，卻仍須在不同的功耗限制下操作。有些系統(tǒng)會在電源供應(yīng)和系統(tǒng)散熱能力已經(jīng)固定的機架上，增加新的功能單元或通道容量，這些系統(tǒng)通常必須在室內(nèi)空調(diào)系統(tǒng)故障時繼續(xù)正常操作。每個機架的總功耗都不能超過現(xiàn)有電源供應(yīng)的供電能力，電源供應(yīng)會將電源提供給機架上的電路板，每張電路板再將電源分配給電路板上的不同元件。隨著半導(dǎo)體元件日益精密，晶片還能提高操作頻率或內(nèi)建多顆DSP處理器來支援更多通道。另一方面，不斷縮小的電路結(jié)構(gòu)卻讓晶片產(chǎn)生更多功耗，因此透過封裝提高散熱效率也變得更重要。由于這些系統(tǒng)必須非?？煽?，所以在分析其電源和散熱需求時，應(yīng)將所有處理器都在最大負(fù)載下工作的情況列入考慮。
　　
為了降低滿負(fù)載的操作功耗，這類系統(tǒng)多半會採用在較低電壓下操作的高效能制程，并且搭配對于任何應(yīng)用都有幫助的多時脈域和時脈閘控技術(shù)。這些系統(tǒng)不會利用多電壓域技術(shù)降低功耗，因其包含大量而密集的處理器，此時若採用多電壓域技術(shù)會造成電路板設(shè)計復(fù)雜性大幅增加。靜態(tài)電壓調(diào)整有助于節(jié)省功耗，由于功耗會隨著操作電壓的平方而改變，所以這些設(shè)計會選擇較低的操作電壓。這些元件還能整合更多核心，以彌補某些核心在較低頻率下操作所不足的效能，例如與其使用四個在1.2V下操作的300MHz核心，還不如使用6個在1.0 V下操作的200MHz核心，因為兩種解決方案的MHz效能（和通道處理能力）都是1200MHz，但后者功耗卻只有前者的（1.0V/1.2V）2，大約是69％。這些元件的晶片面積大都用于內(nèi)建記憶體，其中又以資料記憶體為主。由于在特定的通道處理密度下，每顆晶片所需的資料記憶體也是定值，而且其中多數(shù)記憶體又會直接分配給各個核心使用，所以增加核心并不會造成晶片總面積等比例增加，所帶來的低功耗優(yōu)點則足以彌補額外增加的成本。

功耗最佳化必須符合應(yīng)用需求
　　
不同的DSP應(yīng)用設(shè)備需要不同的策略來滿足其需求，例如基礎(chǔ)設(shè)施系統(tǒng)希望降低最大負(fù)載條件下的功耗，可攜式應(yīng)用則希望將電池的電力消耗減至最少，它們的需求顯然就有極大差異。事實上，就算同類型的應(yīng)用都可能有著極為不同的要求，例如不同的可攜式應(yīng)用必須採取不同的電源最佳化技術(shù)來滿足各自的操作需求。半導(dǎo)體廠商想要服務(wù)各種市場，就必須掌握多種制程、設(shè)計和架構(gòu)技術(shù)，才能針對目標(biāo)應(yīng)用提供最合適的元件。