一種高性能浮點DSP芯片TMS320C6713及其最小系統的設計
(1)處理速度快,工作主頻最高可達到300 MHz,峰值運算能力為2 400 MIPS/1 800 MFLOPS;
(2)硬件支持IEEE格式的32 bit單精度與64 bit雙精度浮點操作;
(3)集成了32×32 bit的乘法器,其結果可為32 bit或64 bit;
(4)TMS320C62X指令無需任何改變即可在TMS320C6713上運行。
1結構特點
TMS320C6713是TI新推出的高速浮點DSP,工作主頻200 MHz,其單指令執(zhí)行周期僅5 ns;具有強大的定點浮點運算能力,運算速度可達1 600 MIPS/1 200 MFLOPS。與TMS320其他系列DSPs相比,C6000系列DSPs最主要的特點是在體系結構上采用了VelociTI超長指令字VLIW(Very long Instruction Word)結構,VLIW體系結構中,是由一個超長的機器指令字來驅動內部的多個功能單元的(這也是VLIW名字的由來)。每個指令字包含多個字段(指令),字段之間相互獨立,各自控制一個功能單元,因此可以單周期發(fā)射多條指令,實現很高的指令級并行效率。C6000的VLIW采用了類RISC指令集,使用大統一的寄存器堆,結構規(guī)整,具有潛在的易編程性和良好的編譯性能,在科學應用領域可以發(fā)揮良好的性能。
TMS320C6713是一種支持浮點運算的DSP芯片,是德州儀器公司設計的用于高端處理的長指令、多功能的DSP芯片。其內部結構功能模塊如圖1所示,它主要包括中央處理器CPU、片內存儲器和片內集成外設3部分。
1.1 CPU內核的功能單元
TMS320C6713的CPU是最新采用VelociTI體系結構的DSP芯片。VelociTI是高性能、先進的VLIW結構,多個功能單元并行工作,共享公用的大型寄存器組,同時執(zhí)行的各種操作是由VLIW的長指令分配模塊進行同步協調的,這種結構使其成為多通道、多功能以及高性能應用的首選器件。CPU內核作為DSP芯片的運算和控制中心,包括以下幾部分:(1)程序取指令單元、指令分配單元、指令譯碼單元;(2)2個數據通道A、B,每個通道中包括一個由16個32 bit寄存器組成的寄存器組和4個功能單元:①算術和邏輯運算單元(.L)②分支、位操作和算術運算單元(.S)③乘法操作單元(.M)④裝載/存儲和算術單元(.D);(3)控制寄存器;(4)控制邏輯;⑸測試、在線仿真接口和中斷控制。
1.2 片內存儲器
TMS320C6713的芯片內部存儲器采用兩級高速緩存結構,如圖1所示,包括:4 KB的第一級高速程序緩存(L1P)、4 KB第一級高速數據緩存(L1D)、和第二級總共256 KB片內存儲容量(64 KB的L2統一緩存/映射RAM和192 KB的附加L2 RAM)。
無論是TMS320C6713還是TMS320C6713B都應用了雙層的Cache結構,對外具有強有力的驅動能力。第一層為4 KB的程序緩沖區(qū)和可雙向尋址的數據緩沖區(qū),第二層有256 KB的程序和數據緩沖區(qū),其中64 KB為存儲區(qū),剩下為SRAM區(qū),這種獨特的二級緩存結構大大提高了CPU的工作效率。
1.3 片內集成外設
TMS320C6713的芯片內部集成了許多外圍設備接口,可以方便地連接片外存儲器、主機、串行設備等外設。所有外部接口都是由一些信號線和控制寄存器組成,開發(fā)人員對接口設計的主要工作就是完成接口連線和寫控制寄存器兩項工作,使得擴展外設變得更加容易。
C6713片內集成的一個32 bit的外部存儲器接口EMIF(External Memory Interface),可以外擴8 bit、16 bit、32 bit并行存儲器。內部的16個獨立的擴展直接存儲器訪問通道EDMA(Enhanced Direct-Memory-Access)大大提高了存儲器訪問的效率,EDMA面向實時信號處理,可以在CPU后臺高效完成存儲空間中數據的轉移,具有高效的傳輸速率,C621x和671x的數據傳輸率可高達1 200 MB/s。2個McASP(multichannel audio serial port);2個McBSP(multichannel buffered serial port),可以模擬幾乎所有形式的串行接口;2個I2C總線接口;2個32 bit的通用定時器;16通道通用I/O口GPIO(general-purpose input/output);一個16 bit的主機接口HPI(Host-Port Interface);還包括程序和數據存儲器控制器、中斷控制器、定時器、時鐘發(fā)生器、PLL(鎖相環(huán)控制發(fā)生器)及掉電邏輯等功能單元。
2 TMS320C6713 DSP硬件最小系統設計
TMS320C6713(主頻225 MHz)是C67X系列中一款典型且應用廣泛的DSP芯片,其硬件最小系統所要完成的主要功能包括:進行基本信號采集、數據運算及數據、程序存儲;音頻信號的采集、處理及輸入、輸出;與主機間的通信及數據、程序傳輸,同時配備了外部擴展接口,方便對系統的功能擴展以實現更廣泛的嵌入式應用。將以上主要功能分成如圖2所示的功能模塊:音頻處理模塊、數據處理模塊、電源轉換供電模塊。
[!--empirenews.page--]2.1音頻處理模塊
在音頻處理模塊中,本系統采用TI公司生產的音頻處理芯片TLV320AIC34,它是一款高性能的立體聲音頻編解碼器,并同時集成了高度的模擬功能,再配以相關的輔助電路完成音頻信號的初始處理,它具有麥克風輸入、音頻線輸入2種輸入方式及音頻線輸出、揚聲器輸出2種輸出方式。音頻處理芯片TLV320AIC34采集的音頻信號經DSP芯片或其自身進行一定的調制處理后傳到計算機主機或直接由TLV320AIC34將DSP芯片處理過的信號傳送出去。
2.2 數據處理模塊
在數據處理模塊中,系統中的DSP芯片、程序存儲器和數據存儲器3塊芯片是整個模塊電路的核心。該模塊的功能是使用DSP芯片的EMIF(外部存儲器接口),完成與外部數據存儲器(SDRAM)數據傳輸和程序存儲器(FLASHROM)程序讀寫任務,實現數據的實時計算處理及存儲;具有硬件中斷和復位功能;并通過JTAG接口電路與硬件仿真器相連接后再接到計算機主機,實現與計算機的數據通信;使用McBSP(多路緩沖串行口)完成串行數據接收和發(fā)送工作,實現對音頻處理模塊的控制和數據交換功能。同時還對DSP芯片未使用的引腳進行處理,將全部引出為日后功能的擴展提供基礎。
2.3 電源供電模塊
在電源供電模塊中,為實現硬件之間的良好匹配,本系統采用TI公司的2塊電源芯片TPS54350。它的輸入電壓為5 V,分別為音頻處理模塊和數據處理模塊提供3.3 V電源電壓并為數據處理模塊提供1.26 V芯片內核電壓,同時具備掉電復位和電源電壓無法達到額定值時的自動復位功能。
3 TMS320C6713的硬件最小系統PCB設計注意事項
3.1音頻處理模塊PCB設計注意事項
音頻處理模塊主要完成音頻信號的采集處理,TLV320AIC34音頻處理芯片將采集到的信號作初步處理,也可以將信號傳送給DSP芯片由其作進一步的處理。元件布局走線時應注意:
(1)4個模擬信號的插頭布置在電路板的邊緣,對于每個通道傳送過程中的電阻、電容要適當置在對應的信號傳輸通道上。處理之后的信號在拉入音頻芯片相應引腳時,走線距離不能太遠,以免受到不必要的干擾。
(2)采用兩層電路板走線,具體為在表層走模擬和數字信號,底層主要是用來進行大面積鋪地,起信號屏蔽作用。將模擬信號與數字信號完全分開,分成兩個不同的區(qū)域,避免相互干擾。
3.2 數據處理模塊PCB設計注意事項
作為以DSP芯片為核心的高頻數據處理模塊,在進行PCB設計時更要謹慎,需要注意以下幾點:
(1)考慮到信號走線的順利通暢,盡可能不受干擾,故在設計電路板層的布局時要分層,為此設置2個電源層DSPIO_3.3 V、DSP_CVDD和一個接地層GND,另外設置3個信號層并保證其都盡可能靠近接地層,從而使信號的傳輸質量效果最佳。
(2)在元件布局時,應盡量保證DSP芯片和存儲器之間的距離盡可能近些,這樣可以減少制板費并避免走線過長導致信號線受到寄生電感的干擾而使信號的質量下降甚至完全失效。所以采用的排阻也要盡可能接近存儲器,以保證信號可靠穩(wěn)定。
(3)對于JTAG模塊,它包含標準的14腳插座以及未使用的EMU2-EMU5引腳,仿真及邊界掃描工作模式的設定,將這3個部分全部以標準插座的形式引出,并盡可能放置在電路板的一側靠近邊緣的地方。
(4)在走線過程中,盡可能保持信號線的長度近似相等,這樣才會盡可能地保證信號傳送的同步性,避免出現延時現象。走線應盡可能向一個方向,盡量避免出現經常性的折返,以防止傳輸信號的質量受到影響。其次是未用引腳的引出應依據其功能將其分為2個標準的2×20的插座。
3.3 電源轉換供電模塊PCB設計注意事項
電源轉換供電模塊主要提供DSPIO_3.3 V和DSP_CVDD 2種電壓,設計時采用2層電路板來實現電源轉換供電模塊的功能。具體是表層為電源、信號層走線,所有的信號布線盡可能安排在表層,在底層走少量信號線。底層主要是作為接地層,并做大面積鋪地處理,同時表層要求接地的部分就近大量打孔,將接地信號直接就近連接底層作接地處理。依據其工作原理,將5 V電壓分為兩路通道進行轉換,走線時注意電源線和通道的走線寬度以達到承受電流要求,同時也注意電磁噪聲信號的干擾。
TMS320C6713是美國德州儀器公司開發(fā)的新型浮點DSP芯片,具有非常高的運行速度、集成度和良好的擴展性。由于其出色的運算能力、高效的指令集、智能外設、大容量的片內存儲器和大范圍的尋址能力,適合于對運算能力和存儲量有高要求的應用場合。特別是在專業(yè)音頻產品、混頻器、音頻合成器、儀器/放大器建模、音頻會議和廣播、生物辨識、醫(yī)療、工業(yè)、數字成像、語音識別和分組等領域有著廣泛的應用。
參考文獻
[1] Texas Instruments. TMS320C6713 hardware designer’s resource guide[R]. 2004.
[2] Texas Instruments.TMS320C6000 CPU and instruction set reference guide[R]. 2006.
[3] 李方慧,王飛,何佩琨. TMS320C6000系列DSPs的原理與應用(第二版)[M].北京:電子工業(yè)出版社,2003.
[4] 趙加祥.DSP系統設計和BIOS編程及應用實例[M].北京:機械工業(yè)出版社,2007.
[5] 劉志剛,黃峰.DSP最小應用系統的設計[J].電子工程師. 2006,32(2):33-36.
[6] 盧鈞,吳劍秋. 高速DSP系統PCB板可靠性設計[J]. 國外電子測量技術.2005(7):5-7.