用RapidIO提高DSP陣列的性能
“采用SERDES(串行/解串器)技術(shù)后只需少量引腳就能獲得很高的帶寬。由于硬件全部承擔(dān)了協(xié)議棧的處理,RapidIO減少了原來(lái)僅用于在系統(tǒng)中傳輸數(shù)據(jù)的寶貴DSP周期?!盨hippen說(shuō),“例如,多個(gè)飛思卡爾公司的StarCorebased MSC8144四內(nèi)核器件可以通過(guò)RapidIO連接,從而可很容易地為無(wú)線基站、視頻譯碼或包交換電話應(yīng)用創(chuàng)建計(jì)算資源?!?/p>
另外值得一提的是,RapidIO協(xié)議要求半導(dǎo)體器件全局性共享內(nèi)存,而且可以從多個(gè)端點(diǎn)直接訪問(wèn)存儲(chǔ)器。像PCI等協(xié)議通常使用一個(gè)公共的存儲(chǔ)器映射,該映射必須在所有連接器件之間共享。
那么,當(dāng)你必須同時(shí)使用PCI和RapidIO時(shí)該怎么辦呢?在這種情況下可以考慮使用Micro Memory公司的CoSine系列器件,這些器件允許橋接PCI/PCI-X/PCI-Express和SRIO,而且提供一個(gè)多端口雙倍數(shù)據(jù)速率(DDR)控制器,允許數(shù)據(jù)在PCI和SRIO之間實(shí)時(shí)傳送。
系統(tǒng)拓?fù)漕愋透鶕?jù)特定應(yīng)用需求會(huì)有所變化。串行RapidIO是最佳選擇,因?yàn)樗哂袩o(wú)可比擬的靈活性,允許開發(fā)人員將DSP網(wǎng)絡(luò)安排成環(huán)形、網(wǎng)格或星型拓?fù)洌苑奖阈阅苌?jí)。另外,SRIO可以為拓?fù)渲衅渌麯SP器件的級(jí)聯(lián)通信提供更多可用帶寬。
“隨著系統(tǒng)提出日益矛盾的處理性能要求,如尺寸、重量、處理能力和功耗,F(xiàn)PGA開始被用于執(zhí)行很多DSP應(yīng)用中常見的繁重的轉(zhuǎn)換和數(shù)據(jù)精簡(jiǎn)任務(wù)?!盡icro Memory公司產(chǎn)品行銷總監(jiān)Mike Jadon指出。
“不過(guò),我們的許多客戶正在異構(gòu)性處理方法中找到最佳平衡點(diǎn),這種方法要求FPGA與PowerPC等通用處理器(GPP)一起使用。”Jadon補(bǔ)充道。
“將異構(gòu)性處理與串行RapidIO等可擴(kuò)展交換結(jié)構(gòu)互連結(jié)合起來(lái)已被證明是最有效的方法,可以從技術(shù)上乃至成本和上市時(shí)間上滿足客戶的項(xiàng)目要求?!?/p>
RapidIO很快被包括摩托羅拉、飛思卡爾、TI和Tundra半導(dǎo)體公司在內(nèi)的領(lǐng)先嵌入式半導(dǎo)體器件供應(yīng)商所采納。像Alcatel、EMC、愛(ài)立信和朗訊等OEM廠商也在系統(tǒng)中廣泛采用RapidIO。
“單片DSP場(chǎng)”
如果你需要的所有計(jì)算能力靠單個(gè)芯片就能輕易實(shí)現(xiàn),而不需要購(gòu)買多個(gè)DSP并用RapidIO或其它方法將它們連接起來(lái),你覺(jué)得如何?如果你覺(jué)得這聽起來(lái)還不錯(cuò)的話,那就看看下面這兩個(gè)器件吧,它們能使你的工作更加輕松。Ambric半導(dǎo)體公司的Am2000整體平行定點(diǎn)TeraOps解決方案采用全局異步、局部同步(GALS)架構(gòu),適用于高性能的視頻和圖像處理市場(chǎng)。Am2000 IC在異步消息通道結(jié)構(gòu)中采用了一整套并行、多指令、多數(shù)據(jù)(MIMD)陣列(塊)的32位精簡(jiǎn)指令集(RISC)處理器和存儲(chǔ)器(圖2)。
圖2:Ambric Am2000器件結(jié)構(gòu)中包含了一個(gè)由兩個(gè)帶DSP擴(kuò)展指令的RISC核(SRD)和兩個(gè)不帶DSP擴(kuò)展指令的RISC核(SR)組成的計(jì)算單元(CU),因此一共有4個(gè)CPU核(左)和一個(gè)由4個(gè)1KB RAM塊和一個(gè)動(dòng)態(tài)信道互連組成的RAM單元(右)。
Ambric公司最出名的是它的結(jié)構(gòu)化對(duì)象編程模型,可提供相當(dāng)簡(jiǎn)化的平臺(tái)供快速開發(fā)和調(diào)試嵌入式設(shè)備使用。它還向我們表明為什么面向?qū)ο缶幊?OOP)不再只是軟件開發(fā)人員的專利。
你現(xiàn)在也可以借助Eclips集成開發(fā)環(huán)境(IDE)和Java的優(yōu)勢(shì)并利用古老的OOP技術(shù)進(jìn)行應(yīng)用開發(fā),然后這種架構(gòu)可以利用傳統(tǒng)但優(yōu)秀的分而治之技術(shù)進(jìn)行處理。未用的處理器及其相關(guān)RAM是整體并行架構(gòu)的關(guān)鍵優(yōu)勢(shì),因?yàn)樗鼈兛捎糜谡{(diào)試,而對(duì)功能或性能不產(chǎn)生損害。
Cell處理器也在不斷進(jìn)步
接下來(lái),我們將探討東芝、索尼和IBM共同努力開發(fā)的Cell寬帶引擎架構(gòu),或簡(jiǎn)稱Cell。Cell處理器的“核心”是功能強(qiáng)大的RISC 6?位雙線程IBM PowerPC內(nèi)核,“核糖體(ribosome)”是一套8個(gè)32位協(xié)同處理單元(SPE),這些單元都是專用協(xié)處理器。每個(gè)SPE都是一個(gè)浮點(diǎn)單元,能夠快速處理單精度和雙精度算術(shù)運(yùn)算。
Cell的“內(nèi)質(zhì)網(wǎng)(endoplasmic reticulum)”由兩條高速總線組成。第一條用于Cell內(nèi)通信,稱為基本接口總線(EIB)。第二條被稱為FlexIO總線,用于兩個(gè)或以上Cell處理器連接在一起時(shí)Cell間的通信。
目標(biāo)應(yīng)用包括高清晰度顯示器、記錄設(shè)備、娛樂(lè)系統(tǒng)、數(shù)字成像系統(tǒng)和物理仿真(如科學(xué)和結(jié)構(gòu)化工程建模)。Mercury計(jì)算機(jī)系統(tǒng)公司準(zhǔn)備開發(fā)多個(gè)集成有Cell處理器的服務(wù)器類系統(tǒng)。東芝計(jì)劃開發(fā)基于Cell的高清晰電視。
除此之外,索尼宣布從2006年11月底開始銷售人們高度關(guān)注的帶Cell處理器的PlayStation 3?,F(xiàn)在,面對(duì)一臺(tái)運(yùn)行頻率達(dá)4GHz、理論上處理能力可達(dá)256GFLOPS并且可能比PC還強(qiáng)大得多的游戲機(jī),游戲愛(ài)好者怎么會(huì)輕易放棄擁有這樣一臺(tái)游戲機(jī)的機(jī)會(huì)呢?