當(dāng)前位置:首頁 > 嵌入式 > Achronix半導(dǎo)體
[導(dǎo)讀]一個(gè)運(yùn)用NoC訪問片外GDDR6的例子

日益增長(zhǎng)的數(shù)據(jù)加速需求對(duì)硬件平臺(tái)提出了越來越高的要求,F(xiàn)PGA作為一種可編程可定制化的高性能硬件發(fā)揮著越來越重要的作用。近年來,高端FPGA芯片采用了越來越多的Hard IP去提升FPGA外圍的數(shù)據(jù)傳輸帶寬以及存儲(chǔ)器帶寬。但是在FPGA內(nèi)部,可編程邏輯部分隨著工藝提升而不斷進(jìn)步的同時(shí),內(nèi)外部數(shù)據(jù)交換性能的提升并沒有那么明顯,所以FPGA內(nèi)部數(shù)據(jù)的交換越來越成為數(shù)據(jù)傳輸?shù)钠款i。

為了解決這一問題,Achronix 在其最新基于臺(tái)積電(TSMC)7nm FinFET工藝的Speedster7t FPGA器件中包含了革命性的創(chuàng)新型二維片上網(wǎng)絡(luò)(2D NoC)。這種2D NoC如同在FPGA可編程邏輯結(jié)構(gòu)之上運(yùn)行的高速公路網(wǎng)絡(luò)一樣,為FPGA外部高速接口和內(nèi)部可編程邏輯的數(shù)據(jù)傳輸提供了大約高達(dá)27Tbps的超高帶寬。

作為Speedster7t FPGA器件中的重要?jiǎng)?chuàng)新之一,2D NoC為FPGA設(shè)計(jì)提供了幾項(xiàng)重要優(yōu)勢(shì),包括:

·提高設(shè)計(jì)的性能,讓FPGA內(nèi)部的數(shù)據(jù)傳輸不再成為瓶頸。

·節(jié)省FPGA可編程邏輯資源,簡(jiǎn)化邏輯設(shè)計(jì),由NoC去替代傳統(tǒng)的邏輯去做高速數(shù)據(jù)傳輸和數(shù)據(jù)總線管理。

·增加了FPGA的布線資源,對(duì)于資源占用很高的設(shè)計(jì)有效地降低布局布線擁塞的風(fēng)險(xiǎn)。

·實(shí)現(xiàn)真正的模塊化設(shè)計(jì),減小FPGA設(shè)計(jì)人員調(diào)試的工作量。

本文用了一個(gè)具體的FPGA設(shè)計(jì)案例,來體現(xiàn)上面提到的NoC在FPGA設(shè)計(jì)中的幾項(xiàng)重要作用。這個(gè)設(shè)計(jì)的主要目的是展示FPGA內(nèi)部的邏輯如何去訪問片外的存儲(chǔ)器。如圖1所示,本設(shè)計(jì)包含8個(gè)讀寫模塊,這8個(gè)讀寫模塊需要訪問8個(gè)GDDR6通道,這樣就需要一個(gè)8x8的AXI interconnect模塊,同時(shí)需要有跨時(shí)鐘域的邏輯去將每個(gè)GDDR6用戶接口時(shí)鐘轉(zhuǎn)換到邏輯主時(shí)鐘。除了圖1中的8個(gè)讀寫模塊外,紅色區(qū)域的邏輯都需要用FPGA的可編程邏輯去實(shí)現(xiàn)。

在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)

圖1 傳統(tǒng)FPGA實(shí)現(xiàn)架構(gòu)

對(duì)于AXI interconnect模塊,我們采用Github上開源的AXI4總線連接器來實(shí)現(xiàn),這個(gè)AXI4總線連接器將4個(gè)AXI4總線主設(shè)備連接到8個(gè)AXI4總線從設(shè)備,源代碼可以在參考文獻(xiàn)2的鏈接中下載。我們?cè)谶@個(gè)代碼的基礎(chǔ)上進(jìn)行擴(kuò)展,增加到8個(gè)AXI4總線主設(shè)備連接到8個(gè)AXI4總線從設(shè)備,同時(shí)加上了跨時(shí)鐘域邏輯。

為了進(jìn)行對(duì)比,我們用另外一個(gè)設(shè)計(jì),目的還是用這8個(gè)讀寫模塊去訪問8個(gè)GDDR6通道;不同的是,這次我們將8個(gè)讀寫模塊連接到Achronix的Speedster7t FPGA器件的2D NoC上,然后通過2D NoC去訪問8個(gè)GDDR6通道。如圖2所示:

在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)

圖2 Speedster7t 1500的實(shí)現(xiàn)架構(gòu)

首先,我們從資源和性能上做一個(gè)對(duì)比,如圖3所示:

在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)

圖3 資源占用和性能對(duì)比

從資源占用上看,用AXI總線連接器的設(shè)計(jì)會(huì)比用2D NoC的設(shè)計(jì)占用多出很多的資源,以實(shí)現(xiàn)AXI interconnect還有跨時(shí)鐘域的邏輯。這里還要說明一點(diǎn),這個(gè)開源的AXI interconnect實(shí)現(xiàn)的是一種最簡(jiǎn)單的總線連接器,并不支持2D NoC所能提供的所有功能,比如地址表映射,優(yōu)先級(jí)配置。

最重要的一點(diǎn)是AXI interconnect只支持阻塞訪問(blocking),不支持非阻塞訪問(non-blocking)。阻塞訪問是指發(fā)起讀或者寫請(qǐng)求以后,要等到本次讀或者寫操作完成以后,才能發(fā)起下一次的讀或者寫請(qǐng)求。而非阻塞訪問是指可以連續(xù)發(fā)起讀或者寫請(qǐng)求,而不用等待上次的讀或者寫操作完成。在提高GDDR6的訪問效率上面,阻塞訪問會(huì)讓讀寫效率大大下降。

如果用FPGA的可編程邏輯去實(shí)現(xiàn)完整的2D NoC功能,包括64個(gè)接入點(diǎn)、128bit位寬和400MHz的速率,大概需要850 k LE,等效于占用了Speedster7t 1500 FPGA器件56%的可編程資源。而2D NoC則可以提供 80個(gè)接入點(diǎn)、256bit位寬和2GHz速率,而且不占用FPGA可編程邏輯。

從性能上來看,使用AXI總線連接器的設(shè)計(jì)只能跑到157MHz,而使用NoC的設(shè)計(jì)則能跑到500MHz。如果我們看一下設(shè)計(jì)后端的布局布線圖,就會(huì)有更深刻的認(rèn)識(shí)。圖4所示的是使用AXI總線連接器的設(shè)計(jì)后端布局布線圖。

在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)

圖4 使用AXI interconnect的設(shè)計(jì)后端布局布線圖

從圖中可以看到,因?yàn)镚DDR6控制器分布在器件的兩側(cè)(圖中彩色高亮的部分),所以AXI總線連接器的布局基本分布在器件的中間,既不能靠近左邊,也不能靠近右邊,所以這樣就導(dǎo)致了性能上不去。如果增加pipeline的寄存器可以提高系統(tǒng)的性能,但是這樣會(huì)占用大量的寄存器資源,同時(shí)會(huì)給GDDR的訪問帶來很大的延時(shí)。

如果再看一下圖5中使用了2D NoC的布局布線圖,就會(huì)有很明顯的對(duì)比。首先,因?yàn)橛?D NoC實(shí)現(xiàn)了AXI總線連接器和跨時(shí)鐘域的模塊,這就節(jié)省了大量的資源;另外,因?yàn)?D NoC遍布在整個(gè)器件上,一共有80個(gè)接入點(diǎn),所以8個(gè)讀寫模塊可以由工具放置在器件的任何地方,而不影響設(shè)計(jì)的性能。

在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)

圖5 使用2D NoC設(shè)計(jì)的后端布局布線圖

從本設(shè)計(jì)的整個(gè)流程來看,使用2D NoC會(huì)極大的簡(jiǎn)化設(shè)計(jì),提高性能,同時(shí)節(jié)省大量的資源;FPGA設(shè)計(jì)工程師可以花更多的精力在核心模塊或者算法模塊設(shè)計(jì)上面,把總線傳輸、外部接口訪問仲裁和接口異步時(shí)鐘域的轉(zhuǎn)換等工作全部交給2D NoC吧。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉