基于PCD656的高速PCI總線接口的設(shè)計與實現(xiàn)
現(xiàn)代雷達信號處理具有數(shù)據(jù)量大、實時性高等特點,而總線傳輸?shù)男蕸Q定了系統(tǒng)的性能,目前普遍使用標準化的PCI總線技術(shù),以便升級更新。為加快產(chǎn)品開發(fā)和降低設(shè)計難度,一般有兩種解決方法:采用通用的PCI芯片或IP核。目前常用的PCI芯片如PCD054、PCD052等雖然性能穩(wěn)定、使用方便,但它們只適用33 MHz、32位總線接口,受時序設(shè)計和應(yīng)用程序效率等影響,總線傳輸速度約穩(wěn)定在70 MB·s-1;使用IP核雖可以兼容66 Hz、64位總線且節(jié)省板卡面積,但其價格昂貴不利于高校及中小企業(yè)推廣使用。而PCI9656適用于66 MHz、64位的PCI總線,因此逐漸成為總線開發(fā)的主流元器件,使得總線傳輸速度達到了150 MB·s-1甚至更高。
本文利用高效PCI芯片和FPGA設(shè)計了一款64位總線傳輸接口電路,傳輸速度達到212 MB·s-1,較以往總線傳輸速度有了較大地提高,滿足了目前高速數(shù)據(jù)傳輸系統(tǒng)的要求。
1 PCI總線接口架構(gòu)
本系統(tǒng)主要由PCI9656和FPGA構(gòu)成,系統(tǒng)框圖如圖1所示。當(dāng)主機發(fā)起讀寫操作時PCI9656需要響應(yīng)其操作,并將相應(yīng)命令發(fā)送到FPGA進行處理,F(xiàn)PGA進行處理后將數(shù)據(jù)和命令通過PCI9656回傳給主機。PCI9656與主機之間的通信需要相應(yīng)的設(shè)備驅(qū)動程序支持,而FPGA響應(yīng)主機命令則需要配置相應(yīng)的局部時序。因此,本設(shè)計主要的工作為設(shè)備驅(qū)動程序的開發(fā)和FPGA局部時序的設(shè)計。
圖1 總體傳輸系統(tǒng)框圖
2 PCI9656性能概述
PCI9656是PLX公司推出的一款兼容32位和64位PCI總線標準的橋接芯片,采用PLX數(shù)據(jù)流水線結(jié)構(gòu)(Data Pipe Architecture),內(nèi)部配有DMA控制器、可編程主模式傳輸及從模式傳輸;內(nèi)部有PCI優(yōu)先判決器,可以支持外部7個外部主控器;可由本地中斷信號LINTi和LINTo生成一個PCI中斷信號INTA;本地時鐘獨立于PCI時鐘工作;支持位寬為8位、16位和32位的66,MHz本地總線。PCI9656寄存器與PCI9054寄存器兼容,可容易地進行基于32位PCI總線與基于64位PCI總線的軟件移植。
PCI 9656具有6條獨立的數(shù)據(jù)通道,分別支持Direct Master、Direct Slave以及DMA功能模式下的數(shù)據(jù)傳輸。
?。?)Direct Master模式。用于局部總線到PCI(CompactPCI)的數(shù)據(jù)傳輸,主控設(shè)備在局部總線端。16 QWord(128 Byte)和32 QWords(256Byte)的FIFO各應(yīng)用于數(shù)據(jù)的讀、寫通道。
?。?)Direct Slave模式。用于PCI(CompactPCI)到局部總線的數(shù)據(jù)傳輸,主控設(shè)備在PCI端。16QWords(128 Byte)和32 QWords(256 Byte)的FIFO各應(yīng)用于數(shù)據(jù)的讀、寫通道。
?。?)DMA模式。DMA傳輸時PCI9656同時是PCI和局部總線的主控設(shè)備,PCI 9656有兩條DMA通道(Channel 0、Channel 1),每條通道都由一DMA控制器和32 QWords(256 Byte)雙向FIFO組成。其DMA方式有常規(guī)的塊模式(Block Mode)、集散模式(Scatter/Gather Mode)和命令模式(Demand Mode)。
在局部總線端,根據(jù)不同的處理器PCI9656有3種工作模式。
?。?)M模式。支持Motorola 32 bit的處理器,提供了可與MPC850/860 PowerQUICC直接相連的接口。
?。?)C模式。適合大多數(shù)處理器的通用模式,比如常用的FPGA,在本設(shè)計中采用此模式。
?。?)J模式。與C模式類似,但其地址線與數(shù)據(jù)線復(fù)用。
3 總線設(shè)備驅(qū)動開發(fā)
在Windows環(huán)境下開發(fā)PCI設(shè)備驅(qū)動程序主要有兩種模型,即WinDriver和WDM。本設(shè)計使用了WDM驅(qū)動模型。開發(fā)PCI設(shè)備驅(qū)動程序WDM需要處理:硬件訪問、中斷處理和DMA傳輸3方面問題。
3.1 硬件訪問
X86處理器有兩種獨立的映射空間:I/O空間和內(nèi)存空間,I/O空間只能通過I/O指令來訪問,KIoRange類封裝了對I/O空間的操作命令。對于設(shè)計的PCI設(shè)備,可以通過實例化KIoRange類來對I/O空間進行相應(yīng)的操作。
對于PCI設(shè)備可以使用KMemoryRange類對內(nèi)存進行相應(yīng)操作,具體操作與KIoRange類對I/O空間的操作相似。
3.2 中斷處理
驅(qū)動程序使用KInterrupt類來實現(xiàn)對中斷操作的處理,其中包括中斷的初始化、將一個中斷服務(wù)例程連接到一個中斷和解除其連接等。
中斷服務(wù)例程不是KInterrupt類的成員函數(shù),這是為了減少中斷延遲時間。中斷處理需要中斷服務(wù)例程和延遲過程調(diào)用例程,在中斷服務(wù)例程中,首先判斷該中斷是否是自己設(shè)備產(chǎn)生的,若不是,則返回False;若是,則請求一個延遲過程調(diào)用例程(DPC)。
3.3 DMA傳輸
PCI9656使用DMA方式進行數(shù)據(jù)傳輸。實現(xiàn)DMA傳輸需要3個類:KDmaAdapter,KDmaTransfer和KCommonDmaBuffer。其中,KDmaAdapter類用于建立一個DMA適配器,它說明了DMA通道的特性,如總線寬度,單次傳輸最大個數(shù)等,需要注意的是本設(shè)備使用的是64位總線寬度,因此需要特別指出;KDmaTransfer類用于DMA傳輸控制,如傳輸開始、傳輸字節(jié)數(shù)等;KCommonDmaBuffer類用于申請系統(tǒng)提供的公共緩沖區(qū)。具體DMA傳輸設(shè)置如下
(1)實例化三個類
OnDmaReady例程中獲取傳輸?shù)奈锢韮?nèi)存的地址和字節(jié)數(shù),然后設(shè)置相應(yīng)的DMA寄存器值開始DMA傳輸。DMA傳輸結(jié)束后,應(yīng)使m_CmxentTm-nsfer無效并刪除。具體流程如圖2所示。
圖2 DMA傳輸流程
4 局部總線端設(shè)計
本設(shè)計中,局部總線端采用了C模式。C模式下可配置3種數(shù)據(jù)傳輸方式:單周期方式(Single Cycle Mode)、4字方式(Brust-4 Mode)和連續(xù)突發(fā)傳輸方式(Continuous Mode),在本設(shè)計中采用了連續(xù)突發(fā)方式,可以有效地提高輸出效率。
PCI9656在局部總線為為主設(shè)備,始終占用局部總線,局部總線端的FPGA始終響應(yīng)PCI9656的操作。方案中使用PCI9656的DMA傳輸模式,在本地端不需要進行地址譯碼,因此可以對PCI9656的控制信號進行簡化處理,PCI9656的局部端主要控制信號如下
ADS#:一次總線訪問開始;
Blast#:總線訪問結(jié)束;
LW/R#:讀寫控制信號;
Ready#:從設(shè)備準備好信號,有效時表示總線訪問進行中;
LHOLD:PCI9656占用本地總線申請信號;
LHOLDA:占用本地總線應(yīng)答信號;
Wait#:主設(shè)備傳輸暫停信號;
EOT#:數(shù)據(jù)傳輸異常中止信號,用于FIFO溢出或空時中斷數(shù)據(jù)傳輸;
Lint#:用于引起CompaetPCI總線端的中斷信號;
LRST#:本地總線復(fù)位信號;
CCS#:配置寄存器選擇信號。
在DMA傳輸過程中主要關(guān)心的信號可簡化為:ADS#、Blast#、LW/R#、Ready#、LHOLD、LHOLDA,如圖3所示。
圖3 PCI局部總線控制時序
圖3中,lclk為本地總線時鐘,當(dāng)PCI9656要發(fā)起一次DMA操作時,先發(fā)送lhold信號申請本地總線,若本地總線空閑則FPGA發(fā)出lholda信號響應(yīng)PCI9656,然后PCI有效ads_n信號以示總線傳輸開始,F(xiàn)PGA使ready_n有效以示總線傳輸正在進行中,此時本地數(shù)據(jù)通過局部數(shù)據(jù)線傳送到PCI總線,或著數(shù)據(jù)由PCI總線傳送到局部邏輯。一次傳輸結(jié)束時PCI使blast_n信號有效并使lhold信號無效,然后FPGA使lholda信號和ready_n信號無效,一次DMA傳輸完成。傳輸中若是DMA讀操作則lwr信號拉低,若為寫操作則拉高。
本地總線位寬為32位,因此本地總線理論速度為264MB·s-1,由于應(yīng)用程序的效率問題和傳輸中一些無效狀態(tài)的存在,目前PCI總線平均速率達到212 MB·s-1,可以滿足目前高速數(shù)據(jù)采集、傳輸對總線傳輸速度的要求。
PCI9656本地總線時序設(shè)計中需要注意blast_n信號有效說明為突發(fā)傳輸最后一個時鐘周期,此時ready_n信號仍然為有效,否則會造成總線等待;在正常讀寫訪問中CCS#信號應(yīng)置高,否則總線訪問將指向配置空間而非內(nèi)存或I/O空間。
5 結(jié)束語
利用PCI9656和FPGA實現(xiàn)了一種高速PCI總線接口,較全面地論述了總線驅(qū)動開發(fā)和局部時序設(shè)計的過程。這種設(shè)計提高了總線傳輸速度,為高速數(shù)據(jù)采集系統(tǒng)的實現(xiàn)創(chuàng)造了條件。