基于AMBA架構(gòu)的SoC系統(tǒng)事務(wù)級建模
1.引言
隨著集成電路制造技術(shù)的發(fā)展,VLSI 已經(jīng)進(jìn)入了SoC(System-on-Chip )片上系統(tǒng)時代。對于復(fù)雜的片上系統(tǒng)而言,系統(tǒng)驗證占整個設(shè)計時間的60%-70%,其中涉及到軟件與硬件的協(xié)同工作等等。傳統(tǒng)的系統(tǒng)驗證在RTL 級進(jìn)行,RTL 提供更精確接近實現(xiàn)的同時,也加長了驗證時間以及此時發(fā)現(xiàn)問題再修改帶來的成本增加,所以非常有必要地在盡可能早地進(jìn)行有效的系統(tǒng)驗證。
SystemC 作為一種系統(tǒng)描述語言應(yīng)運而生,它支持從系統(tǒng)級到門級的描述,解決了傳統(tǒng)片上系統(tǒng)設(shè)計方法中不同級別使用不同描述語言帶來的過渡問題,而其事務(wù)級(TransacTIon-Level,TL)建模仿真方法可以在早期有效地進(jìn)行系統(tǒng)驗證,同時速度較RTL 級仿真更快。
目前,事務(wù)級建模得到廣泛的使用和認(rèn)同,Synopsys 公司現(xiàn)已提供關(guān)于AMBA 架構(gòu)的事務(wù)級模型,以供進(jìn)行由AMBA 架構(gòu)組成的SoC 系統(tǒng)的事務(wù)級建模仿真所用。
2.SystemC 事務(wù)級建模
SystemC 由C++衍生而來,在C++基礎(chǔ)上添加硬件擴展庫和仿真庫構(gòu)成,從而使SystemC 可以建模不同抽象級別的包括軟件和硬件的復(fù)雜電子系統(tǒng),既可以描述純功能模型和系統(tǒng)體系結(jié)構(gòu),也可以描述軟硬件的具體實現(xiàn)。
在使用SystemC 進(jìn)行高層次建模時,引出一個新的概念——TLM(Transaction-Level Model )事務(wù)級模型,該建模方法創(chuàng)建一可執(zhí)行平臺模型,對系統(tǒng)進(jìn)行仿真,但其不僅僅是功能級描述,仿真也具有一定時序。
事務(wù)級模型建模因不考慮很多底層細(xì)節(jié),所以進(jìn)行建模時間短,并且可以將重點放在如何通信,而不是通信在更底層如何實現(xiàn);事務(wù)級建模可以使用事件驅(qū)動,由一事件可以驅(qū)動一系列行為,因此建??梢栽谠缙谶M(jìn)行。所以,SystemC 事務(wù)級模型具有建模效率高和仿真速度快的優(yōu)點。另外,SystemC 事務(wù)級建模作為高層次建模方法,還具有如下特點:
–模型之間依靠時鐘和(動態(tài))事件同步;
–模型內(nèi)部是周期精確的;
–模塊pin 沒有明確進(jìn)行建模實現(xiàn),但可通過適配器外部實現(xiàn);
–模塊之間通過端口(port)和層次化通道(hierarchy channel )進(jìn)行通信。
上述特點描述中,端口(port)和層次化通道(hierarchy channel )概念為SystemC 事務(wù)級建模引入的新概念:
. 接口(inteRFace):定義一組方法來實現(xiàn)設(shè)計目標(biāo),但不實現(xiàn)這些方法;
. 通道(channel): 實現(xiàn)接口定義的方法;根據(jù)通道內(nèi)部所實現(xiàn)方法的情況,又分為基本 通道和層次化通道;基本通道中沒有可見的結(jié)構(gòu),不包括進(jìn)程,也不能直接訪問其他的基本通道;層次化通道則包括模塊、進(jìn)程等,可以直接訪問其他的通道;
. 端口(port):總是與一定的接口類型相關(guān)聯(lián),端口也只能連接到實現(xiàn)了該類接口的通道上,通過端口模塊和進(jìn)程來訪問通道內(nèi)定義的接口方法; 通過接口又引出接口方法調(diào)用(interface-method-call,IMC) 的概念,是指一個進(jìn)程通過端口調(diào)用通道內(nèi)實現(xiàn)的接口方法。方法在接口中定義,在通道內(nèi)實現(xiàn),但在進(jìn)程內(nèi)執(zhí)行?;谝陨细拍?,提出一種事務(wù)級建模思想:
?、僭O(shè)備若僅作為被訪問者,如存儲器、FIFO 等,那么只需要定義接口,以備被訪問,實現(xiàn)接口方法,此設(shè)備作為基本通道存在;
②設(shè)備若僅作為訪問者,如CPU,那么只需要定義端口,來訪問其他設(shè)備;
?、墼O(shè)備若既可作為訪問者和被訪問者,如總線,那么它就需要同時定義端口和接口,同時也要實現(xiàn)接口,這也就是層次化通道,接口用來被訪問,端口用來發(fā)起訪問。
對于SoC 設(shè)計而言,事務(wù)級建模屬于架構(gòu)型設(shè)計。在架構(gòu)的事務(wù)級建模中,模塊在共享的通信通道(如總線)彼此進(jìn)行交易。同時在進(jìn)行系統(tǒng)的SystemC 事務(wù)級建模中,可以有效地對軟件部分進(jìn)行描述,結(jié)合其進(jìn)行協(xié)同仿真。所以,對所設(shè)計的系統(tǒng)使用事務(wù)級模型進(jìn)行仿真時,不僅系統(tǒng)架構(gòu)可以找到系統(tǒng)級的瓶頸并能有效解決,而且軟件開發(fā)者也可以評估軟件的運行吞吐量,同時也可以研究在系統(tǒng)背景下軟件和硬件模型之間的交互。
3.CoCentric System Studio(CCSS)內(nèi)事務(wù)級建模仿真
CCSS 是Synopsys 公司提供的一SystemC 仿真平臺,支持使用完全事務(wù)級模型進(jìn)行設(shè)計、分析、調(diào)試驗證SoC 架構(gòu)。
事務(wù)級仿真中,對于源代碼的調(diào)試,CCSS 內(nèi)嵌調(diào)試軟件DDD。使用事務(wù)級模型組建系統(tǒng),在編譯之后的系統(tǒng)仿真中,當(dāng)系統(tǒng)工作運行到將要調(diào)試的特定模塊部分,則可以將該模塊部分調(diào)入DDD,進(jìn)行普通設(shè)置斷點的調(diào)試,顯示該模塊的執(zhí)行情況以及對系統(tǒng)的影響。對于系統(tǒng)中整體特定模塊而言,可以在實例上設(shè)置斷點、在連線上設(shè)置數(shù)據(jù)監(jiān)控點(data watch point)、在端口和參數(shù)上設(shè)置層次監(jiān)控點(level watch point)。仿真進(jìn)行時,仿真控制面板上的Level Watch 中,可以改變參數(shù)值,以得出不同參數(shù)值的仿真情況。若觀察波形,則可以調(diào)入Virsim 波形仿真軟件。
此外,對于整個系統(tǒng)的事務(wù)級仿真,更需要一些直接明確的數(shù)據(jù)來對系統(tǒng)性能進(jìn)行評估,例如需要知道系統(tǒng)中發(fā)送數(shù)據(jù)的數(shù)目,某一時刻系統(tǒng)的狀態(tài)、發(fā)生的事件等等。CCSS 提供的監(jiān)控器(monitor )可以解決這一問題。
對于監(jiān)控系統(tǒng)仿真情況,CCSS 提供了3 種類型的監(jiān)控器,分別為表格、消息以及數(shù)據(jù)類型。程序中設(shè)置此三種監(jiān)控器,對期望的系統(tǒng)行為進(jìn)行監(jiān)控,調(diào)整系統(tǒng)參數(shù)帶來的性能改變也可以清晰顯示。根據(jù)記錄結(jié)果,觀察系統(tǒng)弱點,以此為出發(fā)點進(jìn)行改進(jìn)系統(tǒng)。
圖1 總結(jié)出系統(tǒng)的TLM 建立及仿真流程,TLM 建模思想見部分2 中描述,在整個系統(tǒng)仿真、修改過程中,驗證平臺(testbench )保持不變從而減少工作量,同時系統(tǒng)修改前后的性能也有更好的可比性。
4.具體實例
這部分給出一例子,結(jié)合數(shù)據(jù)來說明由TLM 組建的系統(tǒng)在CCSS 中進(jìn)行仿真的方法及特點。如圖2 所示一簡單IP 路由系統(tǒng)。該系統(tǒng)實現(xiàn)簡單路由尋址,分析數(shù)據(jù)屬于本地地址還是其他地址。該系統(tǒng)有四個主設(shè)備:DMA 控制器、路由分析(Router)、本地輸出(Local)、其他輸出(Forward)模塊,兩個從設(shè)備:存儲器(Memory)、仲裁(Arbiter)模塊。
遵循部分2 中所敘述思想對系統(tǒng)中模塊進(jìn)行事務(wù)級建模。
IP 數(shù)據(jù)包產(chǎn)生(IP Packet Generator )模塊這里為testbench,IP 數(shù)據(jù)包分析(IP Packet Parser)模塊分析接收來的IP 包,然后送入DMA 控制器,DMA 控制器再將數(shù)據(jù)送入存儲器中,路由分析模塊進(jìn)行路由分析,本地輸出模塊為本地地址端口輸出、其他輸出模塊為其他地址端口輸出。
初步系統(tǒng)設(shè)計,對于Router 模塊,考慮使用軟件或者硬件實現(xiàn),具體根據(jù)系統(tǒng)性能結(jié)果決定。
探測系統(tǒng)性能,在此主要分析IP 包丟失率。鑒于存儲器的大小直接關(guān)系整個系統(tǒng)的成本,同時系統(tǒng)的路由延遲(latency )關(guān)系到系統(tǒng)性能??梢酝瑫r考慮該兩項對IP 包的丟失的影響。對于使用硬件實現(xiàn)Router 模塊,路由延遲范圍值在1-40 時間單位之間;而使用軟件實現(xiàn)范圍值則在3000-7000 時間單位之間。
整個系統(tǒng)中使用三種類型的監(jiān)控器進(jìn)行驗證系統(tǒng)行為,在IP Packet Parser 模塊內(nèi)考察IP 包丟失情況,分析存儲器大小和系統(tǒng)延遲帶來的影響。改變存儲器大小和延遲大小,根據(jù)IP Packet Parser 模塊內(nèi)監(jiān)控器記錄得出結(jié)果。如圖3 所示。
結(jié)合圖3,可以看出,當(dāng)存儲器容量一定時,延遲越大,系統(tǒng)性能也就越差,也就是說,這種情況下,系統(tǒng)為了達(dá)到較好的性能,就需要使用硬件實現(xiàn)Router 模塊。使用軟件實現(xiàn)Router 模塊雖然可以降低成本,但是帶來的是系統(tǒng)性能的降低;提高存儲器容量可以對此進(jìn)行補償,但是同時也增加了一定的成本。所以需要同時考慮兩方面的因素,進(jìn)行折衷選擇。
另外一方面,在延遲latency = 1 時,即使用硬件實現(xiàn)路由分析模塊時,系統(tǒng)在存儲器容量大于20K 以后,性能幾乎沒有提高,這時,考慮到到系統(tǒng)瓶頸,重點將不放在延遲及存儲器大小,而轉(zhuǎn)為分析系統(tǒng)架構(gòu)的原因。
5.結(jié)論
SystemC 語言中TLM 具有建模效率高、仿真速度快的特點,本文結(jié)合其特點給出了一種建模思想。CoCentric System Studio(CCSS )支持完全的TLM 仿真,并且支持各種調(diào)試,可以明確分析系統(tǒng)性能,給出仿真流程。結(jié)合例子來說明在CCSS 內(nèi)進(jìn)行TL 建模組建系統(tǒng)并仿真,可以得出對系統(tǒng)改進(jìn)的指導(dǎo)結(jié)果。