串行RapidIO提升模塊化基站設(shè)計(jì)
事實(shí)上,客戶認(rèn)為基站價(jià)格每年必須下降 80%。為了盡可能具成本效益地提供高帶寬要求的服務(wù),服務(wù)提供商也要求吞吐量有顯著的增加——保證 10 Gbps。這就產(chǎn)生了一個(gè),如何解決降低成本和提高性能這一明顯矛盾的問題?
將來,模塊化必將降低制造成本和設(shè)備升級(jí)成本,以滿足更嚴(yán)格的要求。然而,隨著符合標(biāo)準(zhǔn)的特定應(yīng)用系統(tǒng)元件(ASSC)的部署,模塊化也可以滿足顯著增長(zhǎng)的系統(tǒng)性能需求。結(jié)果如何呢?更高的吞吐量可以增加任何給定時(shí)隙的服務(wù)容量,從而可以降低服務(wù)的單位成本。
那么,我們?cè)鯓訉?shí)現(xiàn)模塊化呢?利用更低成本的標(biāo)準(zhǔn)元件來代替相對(duì)昂貴的基于蜂窩和 FPGA 的 ASIC 器件來實(shí)現(xiàn)該目標(biāo)尚有很長(zhǎng)一段路。但是,如果這些標(biāo)準(zhǔn)元件在沒有采用定制設(shè)計(jì)接口的條件下進(jìn)行互操作,就需要標(biāo)準(zhǔn)接口。定制設(shè)計(jì)接口是標(biāo)準(zhǔn)元件有效使用的天敵,并可阻礙制造商最大限度地利用模塊化的能力。
串行 RapidIO 是為解決嵌入式系統(tǒng)中此問題而設(shè)計(jì)的一種開放標(biāo)準(zhǔn)接口。在實(shí)現(xiàn)板上
本文將介紹在模塊化 3G 基站設(shè)計(jì)中,兩種串行 RapidIO ASSC 的使用如何將性能提高 20%,以及根據(jù)基站設(shè)計(jì)師的說法,與其它解決方案相比如何降低 50% ~ 75% 的材料成本(BOM)。特別是,我們描述了一個(gè)標(biāo)準(zhǔn)的 ASSC——10 Gbps 串行緩沖器,它可消除基站嚴(yán)重的吞吐量瓶頸 —— 幀樣本比較瓶頸;同時(shí)還討論了怎樣用另一個(gè)標(biāo)準(zhǔn) ASSC,即預(yù)處理交換器,通過減輕數(shù)字信號(hào)處理器(DSP)負(fù)載來提高系統(tǒng)性能。
幀樣本比較瓶頸
今天的無線基站必須多次處理同一套數(shù)據(jù)來解碼不同的信息。例如在 3G 系統(tǒng)中同樣的硬件模塊(DSP 或碼片率處理 ASIC)需要獲得 10 ms的樣本幀數(shù)據(jù)來首先執(zhí)行隨機(jī)存取通道(RACH)解碼,然后執(zhí)行數(shù)據(jù)通道(DCH),而同樣的數(shù)據(jù)都要被集群中所有的 DSP 訪問。
然而,射頻(RF)環(huán)境的干擾會(huì)導(dǎo)致數(shù)據(jù)的失真、破壞以及數(shù)據(jù)包的丟失。為此,基站必須對(duì)數(shù)據(jù)進(jìn)行時(shí)域比較,以提高實(shí)時(shí)處理算法程序的效率,來彌補(bǔ)這些錯(cuò)誤和損失,基站需要對(duì)以前的幀樣本(n-1)和當(dāng)前的幀樣本(n)進(jìn)行對(duì)比。但是,在 3G 基站等較高數(shù)據(jù)吞吐量的系統(tǒng)中,樣本都是相當(dāng)大的,并且系統(tǒng)吞吐量會(huì)因執(zhí)行如此大的樣本比較而受到限制。
幀樣本比較問題通常消耗寶貴的系統(tǒng)資源來實(shí)現(xiàn)所需的速度,并且限制基站系統(tǒng)以具競(jìng)爭(zhēng)力的價(jià)格支持增值服務(wù)的能力。3G、4G 及以上的下一代無線基礎(chǔ)設(shè)施需要 10 Gbps的基站數(shù)據(jù)處理速度,以使傳送到獨(dú)立終端的傳輸數(shù)目最多。
可行但又不太理想的幾種辦法
有限的本地存儲(chǔ)能力是瓶頸?;旧希珼SP 本地存儲(chǔ)器沒有足夠的容量在一個(gè)操作中執(zhí)行這種比較。解決這個(gè)問題的一種方法是將大數(shù)據(jù)樣本分成若干片段進(jìn)行單獨(dú)處理,然后再將這些結(jié)果整合起來。不過,這會(huì)影響基帶的吞吐量并降低性能。無論如何,這些本地存儲(chǔ)器應(yīng)該專門用于高速緩存和程序代碼。如果將它們用于另外的用途將導(dǎo)致需要更多板上其它地方的存儲(chǔ)器,同時(shí)還會(huì)產(chǎn)生器件和空間成本以及存儲(chǔ)器管理等問題。當(dāng)然,基站制造商可以通過增加 DSP 的數(shù)量或提高速度來部分地彌補(bǔ)性能的下降。但是,這種增量的方法并不能解決根本問題 —— 存儲(chǔ)大量數(shù)據(jù)樣本并迅速將它們傳遞給 DSP 進(jìn)行處理。
由于存儲(chǔ)容量是我們面臨的一個(gè)挑戰(zhàn),我們可以在板上增加一個(gè)本地存儲(chǔ)器作為緩沖器來饋入其它本地存儲(chǔ)器。這將使存儲(chǔ)管理變得復(fù)雜,只不過是減輕瓶頸問題的權(quán)宜之計(jì),而不能解決這個(gè)問題。
另一種選擇是,我們可以使用復(fù)制的并行存儲(chǔ)器。然而,這將使器件和板卡空間非常昂貴,并會(huì)顯著增加 BOM。此外,由于吞吐量需求增加,電路板需要進(jìn)行重新設(shè)計(jì)以容納更大的存儲(chǔ)器。因此,這種方案不易于進(jìn)行擴(kuò)展。 [!--empirenews.page--]
還有一種方法是采用 FPGA 連接基帶交換器將數(shù)據(jù)存儲(chǔ)在共享系統(tǒng)存儲(chǔ)器中,這是一種具有高設(shè)計(jì)成本、更高風(fēng)險(xiǎn)和更高 BOM的定制設(shè)計(jì)。此外,定制器件采用具有標(biāo)準(zhǔn)接口規(guī)范的標(biāo)準(zhǔn)器件會(huì)破壞模塊的主要啟動(dòng)程序。解決這個(gè)問題的基本架構(gòu)方法就是使數(shù)據(jù)并行。但是,這將顯著增加器件的輸入和輸出量。此外,它明顯需要占據(jù)更多的電路板面積,并可能潛在地減少給定電路板所支持的通道數(shù)量。最終結(jié)果是將大幅增加 BOM 和服務(wù)交付單位成本。
最后,所有這些純存儲(chǔ)解決方案并沒有引入智能的系統(tǒng)數(shù)據(jù)處理。因此,定制電路必須可以發(fā)現(xiàn)丟失的數(shù)據(jù)包,同時(shí)用虛擬信息包來填補(bǔ)空隙,從而保持信息包同步性。集成了所需智能的標(biāo)準(zhǔn)樣本比較解決方案就可一舉兩得。
適當(dāng)?shù)慕鉀Q方案
基于對(duì)上面一些方案的評(píng)估分析,我們列舉出一個(gè)最佳解決方案應(yīng)該具備的性能如下:
● 解決方案必須包括一個(gè)有足夠能力存儲(chǔ)大量數(shù)據(jù)樣本的存儲(chǔ)器。
● 為了“未來驗(yàn)證”該設(shè)計(jì),存儲(chǔ)器必須可以擴(kuò)展。
● 存儲(chǔ)器和DSP集群之間必須是串行接口,以使I/O數(shù)量最少。
● 存儲(chǔ)器的串行接口必須足夠快,可以10 Gbps 板卡級(jí)吞吐量饋入 DSP。
● 串行接口必須滿足DSP廠商采用的行業(yè)標(biāo)準(zhǔn)規(guī)范。
● 器件必須采用智能數(shù)據(jù)處理,以消除對(duì)必須是定制設(shè)計(jì)的專用器件的需求。
● 器件必須消除任何和全部定制方法 —— 必須是標(biāo)準(zhǔn)的特定應(yīng)用系統(tǒng)元件。
換句話說,該解決方案是一種具有內(nèi)置智
由串行RapidIO激活的串行緩沖器的容量為18MB,并可通過可選的四倍數(shù)據(jù)速率(QDR)方法擴(kuò)展至 90MB,有助于以10 Gbps 速率實(shí)現(xiàn)大型、連續(xù)幀樣本的實(shí)時(shí)比較。
10 Gbps性能和高存儲(chǔ)容量可保證DSP在基站應(yīng)用中以大約15ms的數(shù)據(jù)在一次執(zhí)行中實(shí)時(shí)進(jìn)行全幀計(jì)算。這種器件僅需要16個(gè) I/O 引腳,不僅可使I/O數(shù)量最少,還可實(shí)現(xiàn)與 FPGA 的直接連接。
該串行緩沖器包含智能監(jiān)控和可以自動(dòng)識(shí)別和補(bǔ)償丟失數(shù)據(jù)包以維持?jǐn)?shù)據(jù)同步的控制電路。此外,它還可以作為一個(gè)主節(jié)點(diǎn),確定何時(shí)向何處發(fā)送數(shù)據(jù),并開始數(shù)據(jù)傳輸而無需 DSP 其它幫助。
提升數(shù)字處理吞吐量
解決了樣本比較問題,我們可以看看另一個(gè)使用串行 RapidIO ASSC 的方面,即處理性能本身。當(dāng)然,增加 DSP 的數(shù)量和/或性能都會(huì)增加系統(tǒng)吞吐量。但是,通過使 DSP 的負(fù)載處于最佳狀態(tài)就可以簡(jiǎn)單地增加吞吐量。這就是預(yù)處理交換芯片的作用。
預(yù)處理交換芯片位于 RF 背板和 DSP之間,在數(shù)據(jù)到達(dá) DSP 之前進(jìn)行攔截。交換芯片有助于對(duì)有效負(fù)載數(shù)據(jù)進(jìn)行信息包處理,并在 DSP 執(zhí)行無線運(yùn)算之前對(duì)有效負(fù)載進(jìn)行優(yōu)化。該器件可以在交換信息包的同時(shí)預(yù)處理數(shù)據(jù)。然后輸出信息包會(huì)以組播方式傳送至 DSP 集群。這種預(yù)處理器件不僅可提供預(yù)處理功能,而且還可以根據(jù)帶寬、流量和調(diào)用數(shù)據(jù)實(shí)現(xiàn) DSP 配置的軟件確定“隨時(shí)可編程”的修改。因此,這種交換芯片使系統(tǒng)可動(dòng)態(tài)地調(diào)整、開始和關(guān)閉路徑,以滿足帶寬變化的需要。與以往的無線基站架構(gòu)不同,這種預(yù)處理芯片提供了在未來能夠很好利用的內(nèi)在擴(kuò)展性。
這種交換芯片可以進(jìn)行定制,以適用于基于蜂窩的芯片或 FPGA。然而,該應(yīng)用是采用標(biāo)準(zhǔn)接口規(guī)范的標(biāo)準(zhǔn)器件的理想選擇。大量的 ASSC 測(cè)試表明:它可將 DSP 負(fù)載減少 20%,從而有效地提高 DSP 的能力。此外,取代老式結(jié)構(gòu)的 FPGA 和雙端口存儲(chǔ)器可以降低成本和設(shè)計(jì)的復(fù)雜性。
開發(fā)具有串行緩沖器和預(yù)處理交換芯片的基站
基站設(shè)計(jì)者表示,與其它解決方案相比,串行緩沖器和預(yù)處理交換芯片的組合不僅使 DSP 的負(fù)載降低了 20%,而且可使材料成本下降 50% ~ 75%。采用兩個(gè)器件組合的基站電路板請(qǐng)參考圖1。
顯然,成功設(shè)計(jì)的先決條件是這兩個(gè) ASSC 組合與 DSP 進(jìn)行無縫互操作。為了實(shí)現(xiàn)這樣的操作,基站設(shè)計(jì)者可使用一個(gè)由主要元件廠商共同開發(fā)的開發(fā)平臺(tái)。根據(jù)這樣的平臺(tái)就可著手進(jìn)行軟件編程和實(shí)現(xiàn)早期原型,從而加速上市時(shí)間。該開發(fā)平臺(tái)包括 4 個(gè)交換連接的超高性能 DSP、預(yù)處理交換芯片,以及支持其它包括串行緩沖器的串行 RapidIO 端點(diǎn)的子卡擴(kuò)展端口。同時(shí)也包括加速安裝、初始化和現(xiàn)場(chǎng)案例執(zhí)行所需的所有軟件。該平臺(tái)有 3 個(gè)千兆以太網(wǎng)背板、1個(gè)線路 I/O;每個(gè) DSP 有多達(dá) 128 MB的 DRAM DDR2;閃存(串行高速)和 I2C;系統(tǒng)主引導(dǎo) JTAG、MMC;用于其它應(yīng)用的 IPMI MMC控制;以及 1 個(gè)獨(dú)立操作的局部功率選擇。
總結(jié)
模塊化設(shè)計(jì)需要使用具有標(biāo)準(zhǔn)接口的標(biāo)準(zhǔn)元件。串行緩沖器可以解決幀樣本比較問題,預(yù)處理交換芯片可以解決吞吐量密集的數(shù)據(jù)處理和交換問題。采用串行 RapidIO 的組合可為用戶提供完整的處理和存儲(chǔ)解決方案,幫助其具成本效益地向終端客戶提供先進(jìn)的 DSP 密集無線服務(wù),如視頻、語音和數(shù)據(jù)。此外,它還可解決無線基礎(chǔ)設(shè)施中日益增長(zhǎng)的吞吐量局限性問題;與其它解決方案相比,可將 DSP 負(fù)載減少 20%,降低材料成本 50% ~ 75%。