當(dāng)前位置:首頁 > 廠商動(dòng)態(tài) > Achronix半導(dǎo)體
[導(dǎo)讀]為了適應(yīng)未來硬件加速、網(wǎng)絡(luò)加速對(duì)片外存儲(chǔ)器的帶寬需求,目前市面上的高端FPGA主要采用了兩種解決方法。第一種最常見的就是HBM2高帶寬存儲(chǔ)器,2016年1月,HBM的第二代技術(shù)HBM2正式成為工業(yè)標(biāo)準(zhǔn)。集成了HBM2存儲(chǔ)器的高端FPGA可以提供高達(dá)460GB/s的帶寬,但是因?yàn)镠BM2技術(shù)工藝要求高,目前芯片的良率和產(chǎn)量都會(huì)受到很大的影響,所以集成HBM2的高端FPGA成本一直居高不下。第二種是GDDR6存儲(chǔ)器,2018年,GDDR6發(fā)布,數(shù)據(jù)速率達(dá)到了16Gbps。Achronix看中了GDDR6在數(shù)據(jù)存儲(chǔ)中的帶寬優(yōu)勢(shì),在新一代7nm工藝的Speedster7t FPGA集成了GDDR6硬核控制器,最高可支持高達(dá)512GB/s的帶寬,同時(shí)可以有效地控制使用成本。

1. 概述

為了適應(yīng)未來硬件加速、網(wǎng)絡(luò)加速對(duì)片外存儲(chǔ)器的帶寬需求,目前市面上的高端FPGA主要采用了兩種解決方法。第一種最常見的就是HBM2高帶寬存儲(chǔ)器,2016年1月,HBM的第二代技術(shù)HBM2正式成為工業(yè)標(biāo)準(zhǔn)。集成了HBM2存儲(chǔ)器的高端FPGA可以提供高達(dá)460GB/s的帶寬,但是因?yàn)镠BM2技術(shù)工藝要求高,目前芯片的良率和產(chǎn)量都會(huì)受到很大的影響,所以集成HBM2的高端FPGA成本一直居高不下。第二種是GDDR6存儲(chǔ)器,2018年,GDDR6發(fā)布,數(shù)據(jù)速率達(dá)到了16Gbps。Achronix看中了GDDR6在數(shù)據(jù)存儲(chǔ)中的帶寬優(yōu)勢(shì),在新一代7nm工藝的Speedster7t FPGA集成了GDDR6硬核控制器,最高可支持高達(dá)512GB/s的帶寬,同時(shí)可以有效地控制使用成本。

2. Speedster7t FPGA中的GDDR6控制器

Achronix的Speedster7t FPGA集成了8個(gè)GDDR6的硬核,如圖1所示。

Speedster7t FPGA芯片中GDDR6硬核控制器詳解

圖1 Speedster7t FPGA架構(gòu)

每個(gè)GDDR6的硬核支持雙通道。總的帶寬是16Gbps x 16(位寬) x 2(通道) x 8(控制器)/8 = 512 GB/s,每個(gè)控制器有兩個(gè)獨(dú)立的訪問通道,每個(gè)通道的數(shù)據(jù)位寬為16位。這些GDDR6 控制器和PHY都是硬IP,無需消耗FPGA中的可編程邏輯資源,也無需面對(duì)布局布線所帶來的時(shí)序收斂挑戰(zhàn)。這些特征共同使GDDR6方案成為當(dāng)前高端FPGA性能和成本兼顧的絕佳選擇。

3. GDDR6子系統(tǒng)概述

Achronix Speedster7t GDDR6子系統(tǒng)包括GDDR6 PHY和GDDR6控制器,全部采用了硬核設(shè)計(jì)。整個(gè)子系統(tǒng)包括GDDR6 PHY IP、GDDR6控制器IP、時(shí)鐘和復(fù)位模塊,APB接口和AXI4用戶接口可以連接到二維片上網(wǎng)絡(luò)(2D NoC)或者內(nèi)部編程邏輯,如圖2所示。

Speedster7t FPGA芯片中GDDR6硬核控制器詳解

圖2 Speedster7t GDDR6子系統(tǒng)框圖

時(shí)鐘和復(fù)位模塊用來產(chǎn)生支持GDDR6 PHY和GDDR6控制器的時(shí)鐘以及所需的復(fù)位信號(hào),它的輸入時(shí)鐘來自于FPGA片上的PLL。對(duì)于數(shù)據(jù)速率為16Gbps的GDDR6,控制器時(shí)鐘為1GHz,PHY時(shí)鐘為500MHz,命令地址時(shí)鐘跑在2GHz,word clk也就是WCLK運(yùn)行在8GHz,其他速率需要的時(shí)鐘如表1所示。

GDDR6控制器IP支持兩個(gè)通道,每個(gè)通道為16bit位寬。兩個(gè)通道獨(dú)立訪問不同的GDDR6空間??刂破鞯挠脩艚涌跒闃?biāo)準(zhǔn)的AXI協(xié)議,可以連接到二維片上網(wǎng)絡(luò)上或者直接連到內(nèi)部的可編程邏輯。在另外一邊,控制器和PHY的接口為DFI4.0接口。

表1 GDDR6支持的時(shí)鐘頻率模式

Speedster7t FPGA芯片中GDDR6硬核控制器詳解

PHY IP用來連接器件外圍的高速GDDR6顆粒,它會(huì)像其他DRAM PHY一樣產(chǎn)生PRECHARGE、ACTIVE和REFRESH等命令。

APB全稱Advanced Peripheral Bus,字面上是先進(jìn)外圍總線的意思,該總線協(xié)議是ARM公司提出的AMBA總線結(jié)構(gòu)之一,已成為一種標(biāo)準(zhǔn)的片上總線結(jié)構(gòu)。APB總線接口工作在250MHz,用來配置GDDR6子系統(tǒng)的寄存器,Speedster7t FPGA的配置電路FCU可以在啟動(dòng)的時(shí)候通過APB總線接口配置GDDR6子系統(tǒng)的寄存器,用戶邏輯模塊也可以在FPGA運(yùn)行的時(shí)候通過APB總線接口動(dòng)態(tài)配置GDDR6子系統(tǒng)的寄存器。

4. GDDR6控制器結(jié)構(gòu)

GDDR6控制器模塊的詳細(xì)結(jié)構(gòu)如圖3所示。它包括主控部分和其他的一些子模塊,比如Multi-port front-end模塊,Reorder模塊,Read modify Write模塊,內(nèi)存測試模塊和內(nèi)存測試分析模塊。

MPFE模塊是前端多端口模塊,Speedster7t上的GDDR6控制器為每個(gè)通道提供了兩個(gè)MPFE端口,它們支持AXI4協(xié)議,每個(gè)端口能夠提供最大256Gbps的帶寬;其中一個(gè)AXI端口用于連接到二維片上網(wǎng)絡(luò)上,位寬為256位,時(shí)鐘是1GHz。另一個(gè)AXI端口用于直接連接到FPGA內(nèi)部的可編程邏輯資源,位寬為512位,時(shí)鐘是500MHz。

Reorder模塊用來調(diào)整發(fā)給GDDR6控制器的用戶請(qǐng)求的順序。Reorder模塊里有一個(gè)深度為64的隊(duì)列,用于緩存用戶請(qǐng)求,只要隊(duì)列不滿就可以接收新的用戶請(qǐng)求。在接收到用戶請(qǐng)求以后,Reorder模塊可以調(diào)整用戶請(qǐng)求的順序,進(jìn)而可以大大提高DRAM的訪問效率。用戶可以通過設(shè)置不同的參數(shù)來調(diào)整reorder的標(biāo)準(zhǔn),同時(shí)這個(gè)模塊也可以bypass掉,維持用戶請(qǐng)求的原來順序。

RMW模塊是讀-修改-寫的模塊,先讀出內(nèi)存中的數(shù)據(jù)內(nèi)容,然后修改單個(gè)或者多個(gè)bit以后再整體寫回。有了這個(gè)模塊,GDDR6控制器支持將地址mask的功能。

Mem Test和Mem Test Analyzer是用于內(nèi)存測試的模塊,Mem Test內(nèi)存測試模塊支持生成不同的數(shù)據(jù)類型去寫入GDDR6;Mem Test Analyzer內(nèi)存測試分析模塊將讀到的數(shù)據(jù)與期望的數(shù)據(jù)進(jìn)行比較,從而驗(yàn)證GDDR6的硬件接口和讀寫功能是否正常。

Speedster7t FPGA芯片中GDDR6硬核控制器詳解

圖3 Speedster7t GDDR6控制器框圖

GDDR6控制器支持兩種模式,正常x16模式和Clamshell x8模式。在x16模式下,控制器提供了每通道16位的雙通道接口,可以連接一個(gè)GDDR6顆粒。在Clamshell x8模式下,如圖4所示,控制器提供了每通道8位的雙通道接口,可以連接兩個(gè)GDDR6顆粒。Clamshell模式提供了一種在不改變控制器帶寬的情況下,通過在兩個(gè)GDDR6顆粒間share地址和命令總線將容量加倍的一種方法。

Speedster7t FPGA芯片中GDDR6硬核控制器詳解

圖4 GDDR6 Clamshell模式

后面我們還會(huì)繼續(xù)深入了解Speedster 7t FPGA上的一些其他特性,以及這些特性如何運(yùn)用在數(shù)據(jù)加速和網(wǎng)絡(luò)加速應(yīng)用中,敬請(qǐng)期待。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉