基于AMBA架構的SoC系統(tǒng)事務級建模簡介
1.引言
隨著集成電路制造技術的發(fā)展,VLSI 已經進入了SoC(System-on-Chip )片上系統(tǒng)時代。對于復雜的片上系統(tǒng)而言,系統(tǒng)驗證占整個設計時間的60%-70%,其中涉及到軟件與硬件的協(xié)同工作等等。傳統(tǒng)的系統(tǒng)驗證在RTL 級進行,RTL 提供更精確接近實現(xiàn)的同時,也加長了驗證時間以及此時發(fā)現(xiàn)問題再修改帶來的成本增加,所以非常有必要地在盡可能早地進行有效的系統(tǒng)驗證。
SystemC 作為一種系統(tǒng)描述語言應運而生,它支持從系統(tǒng)級到門級的描述,解決了傳統(tǒng)片上系統(tǒng)設計方法中不同級別使用不同描述語言帶來的過渡問題,而其事務級(TransacTIon-Level,TL)建模仿真方法可以在早期有效地進行系統(tǒng)驗證,同時速度較RTL 級仿真更快。
目前,事務級建模得到廣泛的使用和認同,Synopsys 公司現(xiàn)已提供關于AMBA 架構的事務級模型,以供進行由AMBA 架構組成的SoC 系統(tǒng)的事務級建模仿真所用。
2.SystemC 事務級建模
SystemC 由C++衍生而來,在C++基礎上添加硬件擴展庫和仿真庫構成,從而使SystemC 可以建模不同抽象級別的包括軟件和硬件的復雜電子系統(tǒng),既可以描述純功能模型和系統(tǒng)體系結構,也可以描述軟硬件的具體實現(xiàn)。
在使用SystemC 進行高層次建模時,引出一個新的概念——TLM(Transaction-Level Model )事務級模型,該建模方法創(chuàng)建一可執(zhí)行平臺模型,對系統(tǒng)進行仿真,但其不僅僅是功能級描述,仿真也具有一定時序。
事務級模型建模因不考慮很多底層細節(jié),所以進行建模時間短,并且可以將重點放在如何通信,而不是通信在更底層如何實現(xiàn);事務級建??梢允褂檬录寗樱梢皇录梢则寗右幌盗行袨?,因此建??梢栽谠缙谶M行。所以,SystemC 事務級模型具有建模效率高和仿真速度快的優(yōu)點。另外,SystemC 事務級建模作為高層次建模方法,還具有如下特點:
–模型之間依靠時鐘和(動態(tài))事件同步;
–模型內部是周期精確的;
–模塊pin 沒有明確進行建模實現(xiàn),但可通過適配器外部實現(xiàn);
–模塊之間通過端口(port)和層次化通道(hierarchy channel )進行通信。
上述特點描述中,端口(port)和層次化通道(hierarchy channel )概念為SystemC 事務級建模引入的新概念:
. 接口(inteRFace):定義一組方法來實現(xiàn)設計目標,但不實現(xiàn)這些方法;
. 通道(channel): 實現(xiàn)接口定義的方法;根據通道內部所實現(xiàn)方法的情況,又分為基本 通道和層次化通道;基本通道中沒有可見的結構,不包括進程,也不能直接訪問其他的基本通道;層次化通道則包括模塊、進程等,可以直接訪問其他的通道;
. 端口(port):總是與一定的接口類型相關聯(lián),端口也只能連接到實現(xiàn)了該類接口的通道上,通過端口模塊和進程來訪問通道內定義的接口方法; 通過接口又引出接口方法調用(interface-method-call,IMC) 的概念,是指一個進程通過端口調用通道內實現(xiàn)的接口方法。方法在接口中定義,在通道內實現(xiàn),但在進程內執(zhí)行?;谝陨细拍睿岢鲆环N事務級建模思想:
①設備若僅作為被訪問者,如存儲器、FIFO 等,那么只需要定義接口,以備被訪問,實現(xiàn)接口方法,此設備作為基本通道存在;
②設備若僅作為訪問者,如CPU,那么只需要定義端口,來訪問其他設備;
③設備若既可作為訪問者和被訪問者,如總線,那么它就需要同時定義端口和接口,同時也要實現(xiàn)接口,這也就是層次化通道,接口用來被訪問,端口用來發(fā)起訪問。
對于SoC 設計而言,事務級建模屬于架構型設計。在架構的事務級建模中,模塊在共享的通信通道(如總線)彼此進行交易。同時在進行系統(tǒng)的SystemC 事務級建模中,可以有效地對軟件部分進行描述,結合其進行協(xié)同仿真。所以,對所設計的系統(tǒng)使用事務級模型進行仿真時,不僅系統(tǒng)架構可以找到系統(tǒng)級的瓶頸并能有效解決,而且軟件開發(fā)者也可以評估軟件的運行吞吐量,同時也可以研究在系統(tǒng)背景下軟件和硬件模型之間的交互。[!--empirenews.page--]
3.CoCentric System Studio(CCSS)內事務級建模仿真
CCSS 是Synopsys 公司提供的一SystemC 仿真平臺,支持使用完全事務級模型進行設計、分析、調試驗證SoC 架構。
事務級仿真中,對于源代碼的調試,CCSS 內嵌調試軟件DDD。使用事務級模型組建系統(tǒng),在編譯之后的系統(tǒng)仿真中,當系統(tǒng)工作運行到將要調試的特定模塊部分,則可以將該模塊部分調入DDD,進行普通設置斷點的調試,顯示該模塊的執(zhí)行情況以及對系統(tǒng)的影響。對于系統(tǒng)中整體特定模塊而言,可以在實例上設置斷點、在連線上設置數(shù)據監(jiān)控點(data watch point)、在端口和參數(shù)上設置層次監(jiān)控點(level watch point)。仿真進行時,仿真控制面板上的Level Watch 中,可以改變參數(shù)值,以得出不同參數(shù)值的仿真情況。若觀察波形,則可以調入Virsim 波形仿真軟件。
此外,對于整個系統(tǒng)的事務級仿真,更需要一些直接明確的數(shù)據來對系統(tǒng)性能進行評估,例如需要知道系統(tǒng)中發(fā)送數(shù)據的數(shù)目,某一時刻系統(tǒng)的狀態(tài)、發(fā)生的事件等等。CCSS 提供的監(jiān)控器(monitor )可以解決這一問題。
對于監(jiān)控系統(tǒng)仿真情況,CCSS 提供了3 種類型的監(jiān)控器,分別為表格、消息以及數(shù)據類型。程序中設置此三種監(jiān)控器,對期望的系統(tǒng)行為進行監(jiān)控,調整系統(tǒng)參數(shù)帶來的性能改變也可以清晰顯示。根據記錄結果,觀察系統(tǒng)弱點,以此為出發(fā)點進行改進系統(tǒng)。
圖1 總結出系統(tǒng)的TLM 建立及仿真流程,TLM 建模思想見部分2 中描述,在整個系統(tǒng)仿真、修改過程中,驗證平臺(testbench )保持不變從而減少工作量,同時系統(tǒng)修改前后的性能也有更好的可比性。
4.具體實例
這部分給出一例子,結合數(shù)據來說明由TLM 組建的系統(tǒng)在CCSS 中進行仿真的方法及特點。如圖2 所示一簡單IP 路由系統(tǒng)。該系統(tǒng)實現(xiàn)簡單路由尋址,分析數(shù)據屬于本地地址還是其他地址。該系統(tǒng)有四個主設備:DMA 控制器、路由分析(Router)、本地輸出(Local)、其他輸出(Forward)模塊,兩個從設備:存儲器(Memory)、仲裁(Arbiter)模塊。
遵循部分2 中所敘述思想對系統(tǒng)中模塊進行事務級建模。[!--empirenews.page--]
IP 數(shù)據包產生(IP Packet Generator )模塊這里為testbench,IP 數(shù)據包分析(IP Packet Parser)模塊分析接收來的IP 包,然后送入DMA 控制器,DMA 控制器再將數(shù)據送入存儲器中,路由分析模塊進行路由分析,本地輸出模塊為本地地址端口輸出、其他輸出模塊為其他地址端口輸出。
初步系統(tǒng)設計,對于Router 模塊,考慮使用軟件或者硬件實現(xiàn),具體根據系統(tǒng)性能結果決定。
探測系統(tǒng)性能,在此主要分析IP 包丟失率。鑒于存儲器的大小直接關系整個系統(tǒng)的成本,同時系統(tǒng)的路由延遲(latency )關系到系統(tǒng)性能??梢酝瑫r考慮該兩項對IP 包的丟失的影響。對于使用硬件實現(xiàn)Router 模塊,路由延遲范圍值在1-40 時間單位之間;而使用軟件實現(xiàn)范圍值則在3000-7000 時間單位之間。
整個系統(tǒng)中使用三種類型的監(jiān)控器進行驗證系統(tǒng)行為,在IP Packet Parser 模塊內考察IP 包丟失情況,分析存儲器大小和系統(tǒng)延遲帶來的影響。改變存儲器大小和延遲大小,根據IP Packet Parser 模塊內監(jiān)控器記錄得出結果。如圖3 所示。
結合圖3,可以看出,當存儲器容量一定時,延遲越大,系統(tǒng)性能也就越差,也就是說,這種情況下,系統(tǒng)為了達到較好的性能,就需要使用硬件實現(xiàn)Router 模塊。使用軟件實現(xiàn)Router 模塊雖然可以降低成本,但是帶來的是系統(tǒng)性能的降低;提高存儲器容量可以對此進行補償,但是同時也增加了一定的成本。所以需要同時考慮兩方面的因素,進行折衷選擇。
另外一方面,在延遲latency = 1 時,即使用硬件實現(xiàn)路由分析模塊時,系統(tǒng)在存儲器容量大于20K 以后,性能幾乎沒有提高,這時,考慮到到系統(tǒng)瓶頸,重點將不放在延遲及存儲器大小,而轉為分析系統(tǒng)架構的原因。
5.結論
SystemC 語言中TLM 具有建模效率高、仿真速度快的特點,本文結合其特點給出了一種建模思想。CoCentric System Studio(CCSS )支持完全的TLM 仿真,并且支持各種調試,可以明確分析系統(tǒng)性能,給出仿真流程。結合例子來說明在CCSS 內進行TL 建模組建系統(tǒng)并仿真,可以得出對系統(tǒng)改進的指導結果。