基于FPGA的NoC驗(yàn)證平臺的構(gòu)建
半導(dǎo)體工藝技術(shù)進(jìn)入深亞微米時代后,基于總線系統(tǒng)芯片SoC(Svstem on Chip)的體系結(jié)構(gòu)在物理設(shè)計(jì)、通信帶寬以及功耗等方面無法滿足未來多IP體系發(fā)展的需求。片上網(wǎng)絡(luò)NoC(Netwotlk on Chip)是一種新的系統(tǒng)芯片體系結(jié)構(gòu),其核心思想是將計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)移植到系統(tǒng)芯片設(shè)計(jì)中來,從體系結(jié)構(gòu)上徹底解決總線架構(gòu)帶來的問題。
研究人員從拓?fù)浣Y(jié)構(gòu)、路由算法、交換策略以及流控機(jī)制等多個方面對NoC進(jìn)行研究,但是如何構(gòu)建NoC驗(yàn)證平臺,快速得到NoC的性能也一直是NoC研究的重點(diǎn)。
在過去的幾年里,一些研究機(jī)構(gòu)提出了對于NoC不同抽象層次的驗(yàn)證方法的研究,一般的NoC驗(yàn)證是基于軟件的仿真和建模,如:用C、C++、SvstemC進(jìn)行系統(tǒng)級建模仿真,這樣驗(yàn)證很靈活,但在仿真時間上卻開銷很大。本文提出的基于FPGA的NoC驗(yàn)證平臺在仿真速度方面是一般基于HDL的軟件仿真的16 000倍,而基于PC機(jī)編寫的NoC軟件更增強(qiáng)了該平臺的靈活性和實(shí)用性。
1 驗(yàn)證平臺架構(gòu)
該驗(yàn)證平臺采用模塊化設(shè)計(jì),可以很容易地對不同的NoC進(jìn)行功能驗(yàn)證和性能*估。圖1給出了該驗(yàn)證平臺的基本架構(gòu)。
它主要包括3個模塊:
1)模擬IP核模塊 該模塊包含有數(shù)據(jù)流量產(chǎn)生器TG(Traffic Generator)模塊及數(shù)據(jù)流量接收器TR(Traffic Receiver)模塊。TG模擬產(chǎn)生NoC網(wǎng)絡(luò)中各個IP節(jié)點(diǎn)可能產(chǎn)生的數(shù)據(jù)流量,TR用于收集NoC運(yùn)行過程中的各種信息。TG/R作為一個IP節(jié)點(diǎn)和待測NoC中的每個交換節(jié)點(diǎn)相連接。
2)微處理器MPU及其接口MPI模塊 PC機(jī)通過MPU(FPGA中自帶的NiosⅡ軟核)和MPI實(shí)現(xiàn)對NoC各IP核中TG內(nèi)部各個配置寄存器的配置,并將TR中各個寄存器的內(nèi)容讀取到PC機(jī)中進(jìn)行處理。本模塊和模擬IP核模塊構(gòu)成FPGA硬件平臺。
3)NoC軟件模塊 完成對NoC的配置以及NoC系統(tǒng)的性能統(tǒng)計(jì)。PC機(jī)通過MPU與FPGA進(jìn)行通信,實(shí)現(xiàn)對NoC的配置并從FPGA中得到數(shù)據(jù)并進(jìn)行后端處理,以圖形的方式顯示給用戶,供用戶對所設(shè)計(jì)的NoC進(jìn)行*估。同時PC機(jī)可以監(jiān)控NoC運(yùn)行的情況。
FPGA采用Ahera公司Stratix IV系列中的EP4SGX230KF40C2,該器件能夠提供高速的時鐘信號和大量的片內(nèi)資源,并具有大量外圍接口電路可供使用,這為基于FPGA的驗(yàn)證提供了強(qiáng)有力的保證。
1.1 流量產(chǎn)生器TG
該平臺中的TG是一個可重用的軟核,用戶可以通過為配置寄存器寫入不同的配置信息使其產(chǎn)生不同的流量并注入NoC中。TR用于接收數(shù)據(jù)信息,并統(tǒng)計(jì)發(fā)包數(shù)和收包數(shù)。
記錄延時信息,統(tǒng)計(jì)誤碼個數(shù)。圖2給出了TG、TR和MPI以及NoC之間的數(shù)據(jù)流向。
在片上網(wǎng)絡(luò)中,流量的分布由以下2方面決定:1)流量的源/目的節(jié)點(diǎn)對的分布,即空間位置上的通信概率分布,稱為空間分布;2)流量注入網(wǎng)絡(luò)時,注入網(wǎng)絡(luò)的時間間隔在時間上呈現(xiàn)的概率分布,稱為時間分布。為了使該平臺達(dá)到*價NoC性能的目的,流量產(chǎn)生器TG將從空間分布和時間分布的不同,模擬出不同的流量。
空間分布主要包括:1)給定目標(biāo)地址:即配置TG產(chǎn)生發(fā)往確定目標(biāo)地址的數(shù)據(jù)包;2)均勻分布:即配置TG產(chǎn)生均勻的發(fā)往網(wǎng)絡(luò)中各個節(jié)點(diǎn)的數(shù)據(jù)包,類似于網(wǎng)絡(luò)中的廣播現(xiàn)象;3)熱點(diǎn)分布:即配置TG產(chǎn)生發(fā)往網(wǎng)絡(luò)中一些特定的數(shù)據(jù)交換相對頻繁的節(jié)點(diǎn)的數(shù)據(jù)包;4)局部分布:即配置TG產(chǎn)生發(fā)往網(wǎng)絡(luò)中某一局部的網(wǎng)絡(luò)距離較近的節(jié)點(diǎn)的數(shù)據(jù)包;5)矩陣轉(zhuǎn)換地址分布:即按照矩陣X,Y向量轉(zhuǎn)置的特點(diǎn)。配置TG產(chǎn)生發(fā)往與發(fā)送節(jié)點(diǎn)地址相對應(yīng)的節(jié)點(diǎn)的數(shù)據(jù)包。
時間分布主要包括:1)確定時間間隔:即配置TG每過一定數(shù)目的時鐘周期發(fā)送1個數(shù)據(jù)包,直到停止發(fā)包為止;2)自相似流量模型:即ON-OFF流量模型。即配置TG在一段時間內(nèi)發(fā)送數(shù)據(jù)包,在一段時間內(nèi)停止發(fā)包。此類流量模型就是模擬現(xiàn)實(shí)中在某一段時間突發(fā)很大的流量,而在另外的時間段不產(chǎn)生流量;3)隨機(jī)分布:即配置TG在發(fā)送1個數(shù)據(jù)包之間的間隔是1個隨機(jī)時鐘周期數(shù)。
空間分布和時間分布一般會交錯配置使用,那么組合之后可以產(chǎn)生十幾種不同的流量模型。另外,數(shù)據(jù)包的格式可以是用戶指定的數(shù)據(jù),也可以是偽隨機(jī)序列PRBS(Pseudo Random Binary Sequences)。數(shù)據(jù)包的大小亦可由用戶指定,以數(shù)據(jù)片為單位,最小的數(shù)據(jù)包包含4片,最大的數(shù)據(jù)包包含511片。那么將流量模型和數(shù)據(jù)格式以及數(shù)據(jù)包的大小組合起來,就會產(chǎn)生種類更為豐富的流量模型。
流量產(chǎn)生器TG內(nèi)部設(shè)有多個配置寄存器,包括:發(fā)包使能寄存器,發(fā)包間隔寄存器,發(fā)包地址和數(shù)據(jù)寄存器以及發(fā)包類型寄存器。這些寄存器統(tǒng)一編址,用戶可以通過配置這些寄存器控制TG工作。
1.2 流量接收器TR
流量接收器TR用于收集收發(fā)包數(shù)目,收發(fā)包的收據(jù)片,并且統(tǒng)計(jì)誤碼和時延信息。為了達(dá)到此目的,TR內(nèi)部設(shè)有多個只讀寄存器,包括:發(fā)包個數(shù)寄存器.收包個數(shù)寄存器,發(fā)包數(shù)據(jù)寄存器,收包數(shù)據(jù)寄存器,中斷寄存器,誤碼計(jì)數(shù)器以及延時寄存器,延時寄存器可以保存最近80個包的延時信息。這些寄存器統(tǒng)一編址,可以通過訪問這些寄存器來讀取各種用于功能驗(yàn)證和性能*估的原始數(shù)據(jù)。
1.3 微處理器MPU及微處理器接口MPI
微處理器MPU是在QuartusⅡ軟件的SOPC Builder工具中定制的。它包括1個NiosⅡ處理器IP核和外圍的一些并行輸入輸出接口。NiosIⅡ系列嵌入式處理器是一款通用的RISC結(jié)構(gòu)的CPU,使用32位指令集結(jié)構(gòu)(ISA)的二進(jìn)制代碼兼容。將NiosⅡ處理器嵌入到FPGA硬件平臺中,配合整個系統(tǒng)實(shí)現(xiàn)驗(yàn)證的功能。該平臺在所定制的NiosⅡ處理器的外圍還加入讀信號、寫信號、地址信號、輸入數(shù)據(jù)信號、輸出數(shù)據(jù)信號和中斷信號等,來完成PC機(jī)和FPGA硬件平臺之間的數(shù)據(jù)通信。
NiosⅡ處理器外圍還包括一個鎖相環(huán)(PLL)軟核,用于提供NoC電路中所需要的各種時鐘頻率。微處理器MPU與TG/R通信時,讀寫控制時鐘作為突發(fā)時鐘,頻率一般比較低。而NoC中交換節(jié)點(diǎn)之間的數(shù)據(jù)交換會由于特定電路的不同,工作時鐘頻率會大小不同,那么根據(jù)此工作頻率,PLL產(chǎn)生相應(yīng)的時鐘信號配合其工作。MPU處理器僅占Stratix IVEP4SGX230KF40C2器件2 820個邏輯資源LE (Logic Element)(即1%)。因此使用非常高效。
該平臺還提供一個通用的微處理器接口MPI,用于保障MPU和TG/R之間的數(shù)據(jù)通信,也為MPU和TG/R的重復(fù)使用提供了統(tǒng)一接口。
1.4 NoC軟件
NoC軟件主要完成對FPGA硬件平臺的初始化配置和信息收集及統(tǒng)計(jì)處理。根據(jù)功能劃分為2部分:
1)NoC測試部分 其基本功能包括對FPGA硬件平臺的各個IP中TG內(nèi)部配置寄存器的初始化配置,啟動產(chǎn)生數(shù)據(jù)流并注入到NoC中,同時對NoC的運(yùn)行情況進(jìn)行監(jiān)控,并實(shí)時收集與功能驗(yàn)證和性能*估相關(guān)的信息。該軟件是在NiosⅡ的集成開發(fā)環(huán)境(IDE)下用C語言設(shè)計(jì)開發(fā)的,在GNU的編譯器下編譯之后形成可以下載到MPU上直接運(yùn)行的二進(jìn)制文件。
2)NoC性能統(tǒng)計(jì)處理部分 該部分的主要功能是借助于第三方繪圖工具按照NoC性能統(tǒng)計(jì)規(guī)則對收集到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,并以圖表的方式直觀顯示NoC的基本功能和統(tǒng)計(jì)學(xué)性能。
以上兩部分都是在PC機(jī)上開發(fā)完成的,可應(yīng)用于對不同NoC的測試與驗(yàn)證。這為基于FPGA的硬件驗(yàn)證平臺增強(qiáng)了靈活性和實(shí)用性。
2 仿真驗(yàn)證流程
該驗(yàn)證平臺的驗(yàn)證流程包括FPGA硬件平臺的構(gòu)建和對該硬件平臺的初始化配置以及NoC運(yùn)行之后的信息收集和統(tǒng)計(jì)處理。仿真驗(yàn)證流程如圖3所示。
其流程簡述如下:1)根據(jù)硬件架構(gòu)思想和模塊化設(shè)計(jì)策略將用HDL語言描述的NoC連接到FPGA硬件平臺;2)初始化配置FPGA硬件平臺,在PC機(jī)上編寫NoC測試軟件,并通過Jtag線下載到MPU上運(yùn)行,配置TG產(chǎn)生指定流量,并注入到NoC中;3)當(dāng)FPGA平臺運(yùn)行時,即當(dāng)數(shù)據(jù)在NoC各個交換節(jié)點(diǎn)之間傳送或停止傳送時,用戶可以隨時改變配置以產(chǎn)生不同的流量,來測試NoC在不同流量下的性能,并隨時*測試平臺的運(yùn)行情況;4)將TR收集到的數(shù)據(jù)在NiosⅡIDE的控制臺顯示,并保存數(shù)據(jù)。然后對收集到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,并以圖形的方式直觀顯示待測NoC的性能。
3 NoC性能統(tǒng)計(jì)處理
在驗(yàn)證平臺中,采用PC機(jī)對NoC中運(yùn)行之后相關(guān)的數(shù)據(jù)進(jìn)行處理,并借助于第三方工具將處理結(jié)果以圖形方式顯示,以直觀表示NoC的性能。該平臺對于課題組設(shè)計(jì)的Mesh結(jié)構(gòu)的NoC進(jìn)行了功能驗(yàn)證和性能*估。
主要處理包括平均網(wǎng)絡(luò)吞吐量和最近收到的80個數(shù)據(jù)包從發(fā)送端到接收端的網(wǎng)絡(luò)平均延時以及誤碼統(tǒng)計(jì),下面簡單介紹性能*估的方法:
1)網(wǎng)絡(luò)平均吞吐量 對于TR收集到的收包個數(shù)通過PC讀取之后,繪制性能曲線圖。以歸一化仿真時間為基準(zhǔn),以相同時間段中收集的數(shù)據(jù)包數(shù)目作為網(wǎng)絡(luò)總吞吐量。
式中,總運(yùn)行時間xlO%表示取歸一化時延的l/l0。
圖4給出了在不同流量模型下,每包4個數(shù)據(jù)片時,所設(shè)計(jì)NoC的網(wǎng)絡(luò)平均吞吐量。
2)平均網(wǎng)絡(luò)延遲 對于TR收集到的最近80個數(shù)據(jù)包從發(fā)送端到接收端的延遲信息,以歸一化仿真時間為基準(zhǔn),計(jì)算平均網(wǎng)絡(luò)延遲:
式中,P是發(fā)包總數(shù),每個包的延遲為Li,那么Latency就是一段時間內(nèi)的平均網(wǎng)絡(luò)延遲。
圖5給出了在不同流量模型下,在相同仿真時間段中接收到的數(shù)據(jù)包的平均網(wǎng)絡(luò)延遲。圖6給出了在相同的流量模型-均勻地址,自相似流量模型下,在相同仿真時間段中,對于每包分片不同時的平均網(wǎng)絡(luò)延遲。
3)誤碼統(tǒng)計(jì) 表l給出了誤碼個數(shù)統(tǒng)計(jì)表,這里所設(shè)計(jì)的NoC是有保障服務(wù),因此,在NoC運(yùn)行過程中并不產(chǎn)生誤碼。驗(yàn)證結(jié)果與實(shí)際設(shè)計(jì)相一致。
4 結(jié)束語
本文提出了一種基于FPGA的NoC驗(yàn)證平臺。詳細(xì)討論了該驗(yàn)證平臺中FPGA硬件平臺和NoC軟件的基本功能,并闡述了TG/R,MPU,MPI以及NoC軟件的可重用性等特點(diǎn)。通過一個實(shí)例仿真驗(yàn)證的結(jié)果說明了該驗(yàn)證平臺的基本功能和優(yōu)越性。目前正在開發(fā)不同參數(shù)化的流量模型,以便將該平臺用于對各種不同NoC的驗(yàn)證。(電子設(shè)計(jì)工程 作者:韓高飛 杜慧敏 蔣 林 韓俊剛)
參考文獻(xiàn):
[1].RISCdatasheethttp://www.dzsc.com/datasheet/RISC_1189725.html.
來源:凌空幻生0次