當前位置:首頁 > 嵌入式 > 嵌入式軟件
[導讀]基于FPGA的雙緩沖模式PCI Express總線設計方案

引言

  近年來軟件無線電(SDR)得到了飛速的發(fā)展,在很多領域已顯示出其優(yōu)越性。本文的項目背景是通過軟件無線電方式實現數字音頻廣播(DAB)的基帶信號處理,這要求軟件無線電平臺具有高速實時數字信號處理與傳輸能力。高速可編程邏輯器件(FPGA)和豐富的IP核提供了能高效實現軟件無線電技術的理想平臺。

  PCIE總線方案論證

  PCIE是第3代I/O總線互聯技術,如今已成為個人電腦和工業(yè)設備中主要的標準互聯總線。與傳統(tǒng)的并行PCI總線相比,PCIE采用串行總線點對點連接,具有更高的傳輸速率和可擴展性。例如本文采用的8通道1代PCIE 2.0硬核的理論傳輸速率是4 GB/s[1],其總線位寬亦可根據需求選擇×1、×2、×4和×8通道。與其他的串行接口(如RapidIO和Hypertransport)相比,PCIE具有更好的性能和更高的靈活性[2].

  1.1  PCIE總線實現方式

  目前,PCI Express總線的實現方式主要有兩種:基于專用接口芯片ASIC和基于IP核的可編程邏輯器件FPGA方案。前者通常采用ASIC+FPGA/DSP的組合方式,專用PCIE接口芯片(如PEX8311)避免用戶過多地接觸PCIE協(xié)議,降低了開發(fā)難度;但其硬件電路設計復雜,功能固定,靈活性和可擴展性較差。后者使用IP核實現PCIE協(xié)議,用戶可以開發(fā)其所需的功能和驅動,具有可編程性和可重配置能力;另外,單片FPGA降低了成本和電路復雜程度,更符合片上系統(tǒng)(SoC)的設計思想。本文采用Xilinx公司Virtex6 FPGA和PCIE集成塊,實現雙緩沖模式的高速PCIE接口設計。

  1.2  雙緩沖與單緩沖比較

  以寫操作(數據從FPGA到內存)為例,雙緩沖PCIE系統(tǒng)框圖如圖1所示。為描述方便,將該FPGA片上系統(tǒng)命名為SRSE(Software Radio System with PCI Express)。

圖1  雙緩沖PCIE系統(tǒng)框圖

  PC端的驅動程序在系統(tǒng)內存上為SRSE分配了兩個緩沖區(qū)(WR_BUF1/2)用于數據存儲,這兩個緩沖區(qū)的地址信息分別存儲在FPGA端的DMA寄存器(DAM_Reg1/2)中。Root Complex連接CPU、內存和PCIE器件,它代表CPU產生傳輸請求[3];PCIE核是Xilinx公司提供的集成塊程序,實現PCIE協(xié)議的處理;DMA(直接存儲器訪問)引擎用于實現DSP核和PCIE器件間的高速數據存儲與交換;DSP(數字信號處理)核是用戶設計的算法或應用程序。以圖1為例,DSP核將產生的數據寫入TX_FIFO,DMA引擎將數據以傳輸層數據包(TLP)的形式發(fā)送至PCIE核,其中數據包的頭信息來自寄存器DMA_Reg1.當SRSE將數據寫入緩沖區(qū)WR_BUF1時,驅動分配另外一塊緩沖區(qū)WR_BUF2并將該緩沖區(qū)的地址信息寫入寄存器DMA_Reg2中;當DMA引擎發(fā)出WR_BUF1的寫操作消息中斷(MSI)后,DMA控制器將數據包的頭信息切換至DMA_Reg2,驅動將緩沖區(qū)切換至WR_BUF2,繼續(xù)傳輸數據。

  圖2  PCIE總線中斷延遲測量

  與雙緩沖相對應的是單緩沖模式。以寫操作為例,驅動程序每次在內存上分配一個緩沖區(qū)WR_BUF,該緩沖區(qū)的地址信息存儲在DMA寄存器DMA_Reg中。當寫滿緩沖區(qū)WR_BUF時,DMA引擎會產生MSI中斷,并通過PCIE核通知驅動程序。驅動分配新的緩沖區(qū),并將該緩沖區(qū)地址通過PCIE總線寫入DMA寄存器DMA_Reg中。中斷的傳輸和DMA寄存器的更新會產生一定延時,這需要較大的TX_FIFO來存取延時期間DSP核產生的數據。

  為精確測量中斷延時時間,搭建了基于DELL T3400型PC和ML605開發(fā)套件的平臺,通過ChipScope觀察的波形結果如圖2所示。DMA中斷發(fā)生在時刻0(mwr_done:0?﹥1);然后PCIE核向驅動發(fā)出MSI中斷,驅動程序查詢中斷寄存器發(fā)生在時刻2241(irq_wr_accessed:1?﹥0);驅動程序分配新的內存緩沖區(qū),然后更新DMA寄存器發(fā)生在時刻2802(wr_dma_buff0_rdy:0?﹥1)。在這2802個時鐘周期內,PCIE器件無法將數據寫入內存。PCIE的時鐘頻率為250 MHz,所以中斷延時T=2802×(1/250 MHz)=11.2 μs.假定DSP核產生數據的速率為200 MB/s,中斷延時期間將產生11.2 μs×200 MB/s=2241 B大小的數據??紤]到其他不可預測因素,如中斷堵塞等,為了不丟失數據,TX_FIFO至少需要幾KB的空間。這對于FPGA內寶貴的硬件資源(如Block RAM)來說是嚴峻的挑戰(zhàn)。

  與單緩沖模式相比,雙緩沖模式優(yōu)點歸納如下:

  ① 更新緩沖區(qū)不會引入中斷延時,這意味著較小的FIFO即可滿足需求,節(jié)約了硬件資源。

 ?、?雙緩沖模式延長了驅動程序處理中斷的時間,也使緩沖區(qū)數據的處理更加容易,丟包率大大減小。

 ?、?數據的傳輸和內存緩沖區(qū)的數據處理可以并行處理,系統(tǒng)的實時性得到保證。

  ④ 雙緩沖更適合Scatter/Gather DMA,取代block DMA,從而提高內存效率。

  2  軟件無線電平臺設計

  軟件無線電基于可編程、可重構的通用硬件平臺,通過加載不同的軟件實現不同的無線電功能,廣泛應用于軍用和民用領域。為了能夠實現復雜的算法,其平臺需要具備高速數據交換和實時信號處理的能力。該設計參考Xilinx ML605開發(fā)套件,基于Xilinx Virtex6 LX240T FPGA芯片,通過增加相應的模塊搭建通用的軟件無線電平臺。

  軟件無線電原理框圖如圖3所示。信號獲取模塊采用兩片ADC和DAC以實現IQ兩路信號的數模轉換;通信模塊由以太網和USBRS232接口組成;擴展卡可以是射頻發(fā)射機或接收機,通過擴展卡接口與母板相連;JTAG接口提供在線編程和內部測試功能;存儲器件包括512 MB DDR3內存和128 MB平臺Flash,分別用于動態(tài)數據存儲和配置FPGA;人機接口由LED/LCD、按鍵和開關等元件組成,實現人機對話;200 MHz有源晶振和SMA時鐘接口組成時鐘輸入模塊,向FPGA提供時鐘基準;8通道PCIE接口和IP核實現平臺與PC間高速數據交換。

  圖3  軟件無線電原理框圖

 3  雙緩沖模式PCIE總線設計

  3.1  PCIE驅動設計

  PC端基于Linux(Ubuntu 10.10)操作系統(tǒng)。該操作系統(tǒng)免費開源,安全穩(wěn)定靈活,適合低成本軟件開發(fā)。驅動程序包含數據流接口和控制接口。數據流接口用于Linux用戶空間和SRSE平臺間高速的數據交換;控制接口使用戶可以觀察和配置SRSE平臺寄存器,例如通過控制接口,用戶可以在PC端改變SRSE平臺的調諧頻率等參數。數據流接口是雙向獨立的,支持雙/單工,即可以同時讀和寫數據。以數據發(fā)送(從PC到SRSE)為例,用戶空間調用write()函數將任意數量的數據發(fā)送至驅動,驅動整理數據碎片以滿足PCIE對數據對齊和傳輸塊數據量的要求。當數據滿足4096字節(jié),驅動將數據塊發(fā)送至Root Complex并保留已發(fā)送數據的列表,等待接收來自SRSE平臺的寫操作中斷。PCIE驅動數據接收的原理如圖4所示。當用戶空間調用read()函數或者驅動接收到來自PCIE設備的數據時,驅動初始化讀操作。驅動程序將保持阻塞(blocking),直到用戶空間調用read()函數,并且已接收到足夠的數據包,從而能夠填滿read()請求的數據量。碎片整理模塊對已接收的數據進行整理,然后將數據塊返回至用戶空間,并通知其解除驅動阻止。[!--empirenews.page--]

  圖4  PCIE驅動中的數據接收

  3.2  PCIE核配置

  Virtex6 PCIE Endpoint Block[4]集成了傳輸層(TL)、數據鏈路層(DLL)和物理層(PL)協(xié)議,它完全符合PCIE基本規(guī)范,可配置性增加了設計的靈活性,降低了成本。其功能框圖與接口如圖5所示。其中收發(fā)器通過PCIE總線與Root Complex實現數據包的傳遞,PCIE總線由系統(tǒng)接口和PCIE接口組成;系統(tǒng)接口由復位和時鐘信號組成,PCIE接口由8條差分傳輸和接收對組成(8lane)。TX/RX Block RAM用來存儲來自DMA引擎和系統(tǒng)內存的數據,其大小可以通過Xilinx Core Generator配置。傳輸接口為用戶提供了產生和接收TLP的機制;物理層接口使用戶能夠觀測和控制鏈路的狀態(tài);配置接口使用戶能夠觀察和配置PCIE終端的配置空間,即DMA寄存器;中斷接口實現DMA與PCIE核之間的中斷傳輸。用戶通過這些接口設計符合其需要的DMA引擎。

  圖5  PCIE功能框圖與接口

  本文使用Xilinx CORE Generator生成PCIE核,其主要配置參數如表1所列。

  表1  PCIE核主要配置參數

  3.3  總線主控DMA傳輸

  參考Xilinx應用實例XAPP1052[5],本文設計的DMA結構框圖如圖6所示,各部分功能介紹如下:

 ?、?發(fā)射引擎。發(fā)射引擎產生傳輸層數據包(TLP)并通過傳輸接口發(fā)送至PCIE核,數據包的數據來自TX_FIFO,頭信息來自DMA控制/狀態(tài)寄存器,也負責驅動對DMA寄存器的讀取。

  ② 接收引擎。接收引擎將來自上位機的數據包解碼并轉存至RX_FIFO中,也接收來自驅動的配置信息并將寄存器值寫入DMA控制/狀態(tài)寄存器中。

  ③ DMA控制/狀態(tài)寄存器。該模塊是DMA的主控制器,控制著DMA復位、讀寫等操作;內存緩沖區(qū)的地址信息和TLP包長度等信息也存儲在該寄存器中。

 ?、?MSI中斷控制器。該模塊產生讀寫中斷,然后通過中斷接口通知PCIE核,進而通知驅動程序。

 ?、?TX/RX_FIFO.通過Xilinx Core Generator將FIFO配置為獨立時鐘異步模式,實現不同時鐘域的數據緩沖和位寬轉換。本文PCIE時鐘為250 MHz、位寬64位,而DSP核時鐘為200 MHz、位寬32位。

 ?、?PCIE核。該模塊為例化的PCIE集成塊,框圖和參數詳見圖5和表1.

 ?、?DSP核。該模塊為用戶設計的算法或者功能模塊,例如通過Simulink調用Xilinx庫實現某種功能。

  圖6  DMA結構框圖

  3.4  雙緩沖PCIE協(xié)議

  以寫操作為例,雙緩沖PCIE協(xié)議如圖7所示。初始化時,驅動程序在內存中分配兩塊緩沖區(qū)Buff 1a/2a,然后將Buff 1a的地址信息寫入DMA控制/狀態(tài)寄存器DMA_Reg1(圖1)中并開始寫操作;DMA引擎將FIFO中的數據以數據包的形式通過PCIE總線發(fā)送至緩沖區(qū)Buff 1a中,期間驅動程序將Buff 2a的地址信息發(fā)送至DMA控制/狀態(tài)寄存器DMA_Reg2中;當Buff 1a寫操作完成時,MSI中斷控制器產生MSI中斷并通知驅動,此時驅動和DMA控制器同時切換緩沖區(qū),即驅動將緩沖區(qū)切換至Buff 2a,DMA控制器將TLP頭信息切換至DMA_Reg2,如此繼續(xù)傳輸數據。

  圖7  雙緩沖PCIE操作協(xié)議(寫操作)

  將MSI中斷與新緩沖區(qū)配置間的時間間隔稱為中斷延時,如圖2和圖7所示。雙緩沖模式的引入消除了中斷延時的影響,使SRSE在中斷延時期間仍能傳輸數據,節(jié)約了硬件資源,驅動程序也有更多時間來處理緩沖區(qū)的數據。

  4  PCIE調試與性能

  提供了Root Port的Test Bench,它可以模擬PC和驅動程序,如初始化DMA引擎、產生下行數據流并發(fā)送至PCIE設備,也可以接收來自PCIE設備的上行數據流等,使整個系統(tǒng)(PCIE核+DMA引擎+DSP核)可以在Modelsim SE環(huán)境下仿真。這大大縮短了開發(fā)周期,提高了開發(fā)效率。功能仿真通過后,使用Xilinx ISE 軟件完成代碼的輸入、綜合、實現、驗證和下載。

  硬件平臺為DELL T3400型PC和Xilinx ML605開發(fā)套件。PC端基于Ubuntu 10.10操作系統(tǒng)運行驅動程序,FPGA端DSP核(圖6)通過Matlab Simulink調用Xilinx元件庫實現。本文DSP核由32位計數器和加法器組成:計數器將值寫入TX_FIFO,PC端檢測接收數據以驗證寫操作(SRSE→PC);同樣地,PC端產生+1計數值并將數據寫入RX_FIFO,DSP核的加法器用來驗證讀操作(PC→SRSE)。

  結語

  本文設計了基于Xilinx Virtex6 FPGA的通用軟件無線電平臺,利用C語言開發(fā)了基于Linux系統(tǒng)的驅動程序,利用Verilog語言設計基于Xilinx PCIE硬核的雙緩沖DMA控制器。雙緩沖消除了中斷延時的影響,節(jié)約了硬件資源,提高了數據傳輸速度。

 

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉