簡(jiǎn)單介紹DSP芯片發(fā)展現(xiàn)狀及其特點(diǎn)
前言
DSPxpfzxzjqtd_67615.html' target='_blank'>DSP芯片,又稱數(shù)字信號(hào)處理器(嵌入式微處理器),它是一種具有特殊結(jié)構(gòu)的適用于進(jìn)行實(shí)時(shí)數(shù)字信號(hào)處理的微處理器。SP芯片的內(nèi)部采用程序和數(shù)據(jù)分開(kāi)的哈佛結(jié)構(gòu),具有專門(mén)的硬件乘法器,廣泛采用流水線操作,提供特殊的DSP指令,可以用來(lái)快速的實(shí)現(xiàn)各種數(shù)字信號(hào)處理算法(常用嵌入式處理器)。小編通過(guò)搜集整理資料,對(duì)有關(guān)DSP芯片發(fā)展現(xiàn)狀及其特點(diǎn)作了詳細(xì)的歸納總結(jié)。
DSP芯片的現(xiàn)狀和發(fā)展(嵌入式處理器比較)
第一個(gè)DSP芯片誕生于20世紀(jì)70年代末。以AMI公司的S2811和Intel公 司的2920為代表的第一代DSP芯片,其片內(nèi)都還沒(méi)有單周期硬件乘法器
1980年以后,DSP芯片取得了突飛猛進(jìn)的發(fā)展,主要表現(xiàn)在以下幾個(gè)方面
(1)制造工藝
早期DSP采用4UM的N溝道MOS(NMOS)工藝
現(xiàn)在的DSP則普遍采用亞微米CMOS工藝,達(dá)到0.25um或0.18um
DSP芯片的引腳數(shù)量從40個(gè)左右增加到200個(gè)以上
需要設(shè)計(jì)的外圍電路越來(lái)越少,每MIPS的成本、體積和功耗都有很大 的下降
(2)存儲(chǔ)器容量
20世紀(jì)80年代初的DSP,片內(nèi)程序存儲(chǔ)器和數(shù)據(jù)存儲(chǔ)器只有幾百個(gè)單元, 有的片內(nèi)沒(méi)有ROM
目前,DSP片內(nèi)的數(shù)據(jù)和程序存儲(chǔ)器可達(dá)幾十K字
此外,對(duì)片外程序存儲(chǔ)器和數(shù)據(jù)存儲(chǔ)器的尋址能力也大大增強(qiáng),可分別 達(dá)到16 M×46位和4G×40位以上
(3) 內(nèi)部結(jié)構(gòu)
目前,DSP芯片內(nèi)部廣泛采用多總線、多處理單元和多級(jí)流水線結(jié)構(gòu), 加上完善的接口功能,使DSP的系統(tǒng)功能、數(shù)據(jù)處理能力以及與外部設(shè) 備的通信功能大大增強(qiáng)
TMS320C6201 CPU中包含8個(gè)并行的處理單元,一個(gè)時(shí)鐘周期可以執(zhí)行8條指令,每秒最高進(jìn)行16億次的定點(diǎn)運(yùn)算
(3) 運(yùn)行速度
將近20年的發(fā)展,使DSP的指令周期從400ns縮短到10ns以下,相應(yīng)的 運(yùn)行速度從2.5MIPS提高到2000MIPS以上
具有代表性的是,TI公司的TMS320C6201 DSP,執(zhí)行一次1024點(diǎn)復(fù)數(shù) FFT運(yùn)算的時(shí)間只有66us
(4)運(yùn)算精度和動(dòng)態(tài)范圍
由于輸入信號(hào)動(dòng)態(tài)范圍以及迭代算法可能產(chǎn)生誤差積累問(wèn)題,因此對(duì)單 片DSP的精度提出了較高的要求
DSP的字長(zhǎng)從8位增加到16位、24位、32位,累加器的長(zhǎng)度也增加到40 位
超長(zhǎng)字指令字(VLIW)結(jié)構(gòu)和高性能的浮點(diǎn)DSP的出現(xiàn),擴(kuò)大了數(shù)據(jù)處理的動(dòng)態(tài)范圍
(5)開(kāi)發(fā)工具
20世紀(jì)90年代推出的DSP,都有較為完善的軟件和硬件開(kāi)發(fā)工具
Simulator軟件仿真器 Emulator在線仿真器
C編譯器
發(fā)展高速、高性能DSP器件
(6)高度集成化
集濾波、A/D、D/A、ROM、RAM和DSP內(nèi)核于一體的模擬數(shù)字混合式 DSP芯片將有較大的發(fā)展和應(yīng)用
低功耗低電壓 進(jìn)一步降低功耗,開(kāi)發(fā)低電壓DSP內(nèi)核(目前有的DSP內(nèi)核電壓已降到 3.3V和2.5V),使其更適用于個(gè)人通信機(jī)、便攜式計(jì)算機(jī)和便攜式儀器儀表。
開(kāi)發(fā)專用DSP芯片
為了滿足系統(tǒng)級(jí)芯片的設(shè)計(jì),開(kāi)發(fā)基于DSP內(nèi)核的ASIC會(huì)有較大的發(fā)展
提供更加完善的開(kāi)發(fā)環(huán)境 特別是開(kāi)發(fā)效率更高的、優(yōu)化的C編譯器和代數(shù)式指令系統(tǒng),以克服匯 編語(yǔ)言程序可讀性和可移植性較差的不足,縮短開(kāi)發(fā)周期
擴(kuò)大應(yīng)用領(lǐng)域 DSP芯片將向航空、航天、雷達(dá)、聲納、圖像、影視、醫(yī)療設(shè)備、家用 電器等眾多領(lǐng)域滲透,進(jìn)一步擴(kuò)大應(yīng)用范圍
DSP芯片的特點(diǎn)
(1) 哈佛(Havard)結(jié)構(gòu)
早期的微處理器內(nèi)部大多采用馮·諾依曼(Von-Neumann)結(jié)構(gòu).其片內(nèi)程序空間和數(shù)據(jù)空間是合在一起的,取指令和取操作數(shù)都是通過(guò)一條總線分時(shí)進(jìn)行的。當(dāng)高速運(yùn)算時(shí)。不但不能同時(shí)取指令和取操作數(shù),而且還會(huì)造成傳輸通道上的瓶頸現(xiàn)象。
DSP內(nèi)部采用的是程序空司和數(shù)據(jù)空間分開(kāi)的哈佛(Havard)結(jié)構(gòu),允許同時(shí)取指令(來(lái)自程序存儲(chǔ)器)和取操作數(shù)(來(lái)自數(shù)據(jù)存儲(chǔ)器)。而且,還允許在程序空間和數(shù)據(jù)空間之間相互傳送數(shù)據(jù),即改進(jìn)的哈佛結(jié)構(gòu)。
(2)多總線結(jié)構(gòu)
許多DSP芯片內(nèi)部都采用多總線結(jié)構(gòu),這樣可以保證在一個(gè)機(jī)器周期內(nèi) 可以多次訪問(wèn)程序空間和數(shù)據(jù)空間
TMS320C54x內(nèi)部有P、C、D、E等4條總線(每條總線又包括地址總線 和數(shù)據(jù)總線),可以在一個(gè)機(jī)器周期內(nèi)從程序存儲(chǔ)器取1條指今、從數(shù)據(jù) 存儲(chǔ)器讀2個(gè)操作數(shù)和向數(shù)據(jù)存儲(chǔ)器寫(xiě)1個(gè)操作數(shù),大大提高了DSP的運(yùn)行速度。
DSP來(lái)說(shuō),內(nèi)部總線是個(gè)十分重要的資源,總線越多,可以完成的功能 就越復(fù)雜。
(3) 流水線結(jié)構(gòu)
DSP執(zhí)行一條指令,需要通過(guò)取指、譯碼、取操作和執(zhí)行等幾個(gè)階段
在DSP中,采用流水線結(jié)構(gòu),在程序運(yùn)行過(guò)程中這幾個(gè)階段是重疊的, 這樣,在執(zhí)行本條指今的同時(shí),還依次完成了后面3條指今的取操作數(shù)、 譯碼和取指,將指今周期降低到最小值。
利用這種流水線結(jié)構(gòu),加上執(zhí)行重復(fù)操作,就能保證數(shù)字信號(hào)處理中用 得最多的乘法累加運(yùn)算可以在單個(gè)指令周期內(nèi)完成。
(4)多處理單元
DSP內(nèi)部一般都包括有多個(gè)處理單元,如算術(shù)邏輯運(yùn)算單元(ALU)、輔助寄存器運(yùn)算單元(ARAU)、累加器(ACC)以及硬件乘法器(MUL)等。 它們可以在一個(gè)指令周期內(nèi)同時(shí)進(jìn)行運(yùn)算 例如,當(dāng)執(zhí)行一次乘法和累加的同時(shí),輔助寄存器單元已經(jīng)完成了下一 個(gè)地址的尋址工作,為下一次乘法和累加運(yùn)算做好了充分的準(zhǔn)備。因此, DSP在進(jìn)行連續(xù)的乘加運(yùn)算時(shí),每一次乘加運(yùn)算都是單周期的
DSP的這種多處理單元結(jié)構(gòu),特別適用于FIR和IIR濾波器
許多DSP的多處理單元結(jié)構(gòu)還可以將一些特殊的算法.例如FFT的位碼 倒置尋址和取模運(yùn)算等,在芯片內(nèi)部用硬件實(shí)現(xiàn)以提高運(yùn)行速度。
(5)特殊的DSP指令
為了更好地滿足數(shù)字信號(hào)處理應(yīng)用的需要,在DSP的指令系統(tǒng)中,設(shè)計(jì) 了一些特殊的DSP指令。
TMS320C25中的MAD(乘法、累加和數(shù)據(jù)移動(dòng))指令,具有執(zhí)行LT、 DMOV、MPY和APAC等4條指令的功能。
TMS320C54x中的FIRS和LM5指令,則專門(mén)用于系數(shù)對(duì)稱的F1R濾波器 和LMS算法。
(6)指令周期短
早期的DSP的指令周期約400ns,采用4us NMOs制造上藝.其運(yùn)算速 度為5MIPS(每秒執(zhí)行5百萬(wàn)條指令)
隨著集成電路工藝的發(fā)展,DSP廣泛采用亞微米CMOS制造工藝,其運(yùn)行速度越來(lái)越快[!--empirenews.page--]
TMS320C54x運(yùn)行速度可達(dá)100MIPS
TMS320C6203的時(shí)鐘為300MHZ,運(yùn)行速度達(dá)到2400MIPS
(7)運(yùn)算精度高
早期DSP的字長(zhǎng)為8位,后來(lái)逐步提高到16位、24位、32位
為了防止運(yùn)算過(guò)程中溢出,有的累加器達(dá)到40位
一批浮點(diǎn)DSP,例如TMS320C3x、TMS320C4x、ADSP21020等,則 提供了更大的動(dòng)態(tài)范圍
(8)硬件配置強(qiáng)
新一代DSP的接口功能愈來(lái)愈強(qiáng)
片內(nèi)具有串行口、主機(jī)接口(HPI)、DMA控制器、軟件控制的等待狀態(tài)產(chǎn)生器、鎖相環(huán)時(shí)鐘產(chǎn)生器
實(shí)現(xiàn)在片仿真符合IEEE 1149.1標(biāo)準(zhǔn)的測(cè)試訪問(wèn)口,更易于完成系統(tǒng)設(shè) 計(jì)
許多DSP芯片都可以工作在省電方式,使系統(tǒng)功耗降低
總結(jié)
DSP芯片在信號(hào)處理、圖像處理、儀器、聲音語(yǔ)言、控制、軍事、通訊、醫(yī)療、家用電器等領(lǐng)域有著廣泛的應(yīng)用。本文從制造工藝、存儲(chǔ)器容量、運(yùn)行速度、運(yùn)算精度和動(dòng)態(tài)范圍、開(kāi)發(fā)工具等方面詳細(xì)介紹了DSP芯片的現(xiàn)狀和發(fā)展,并對(duì)DSP芯片的特點(diǎn)也作了簡(jiǎn)單介紹。