Imagination揭開全新PowerVR Furian GPU架構(gòu)的神秘面紗
Imagination Technologies 宣布推出新一代的 PowerVR Furian 架構(gòu),這是專為滿足下一代消費類設(shè)備持續(xù)演進的圖形與運算需求所設(shè)計的全新 GPU 架構(gòu)。
VR/AR 和 convertibles 等應(yīng)用需要更高的圖形分辨率與幀率,而 ADAS 與機器智能等新興應(yīng)用則需要更高的運算效率。專為這些應(yīng)用所設(shè)計的配件通常是采用14nm以下的先進制程。Furian 可通過多重方式來提升性能可擴展性,以滿足這些需求,同時采用可擴展的設(shè)計,并專注于在最后的制程階段輕松實現(xiàn)系統(tǒng)整合與布局 (layout)。憑借采用 Furian 架構(gòu),嵌入式產(chǎn)品將能以移動設(shè)備的功耗預算,在長時間內(nèi)提供高分辨率、沉浸式圖形內(nèi)容以及數(shù)據(jù)運算功能。
眾所周知, 多年來PowerVR Rogue 架構(gòu)已成為業(yè)界標竿;在此基礎(chǔ)之上,F(xiàn)urian 架構(gòu)專為強化能源效率所設(shè)計,并再次擴大了與競爭解決方案之間的業(yè)界領(lǐng)先的每微瓦性能差距。擁有 Furian 與 Rogue 兩個功能強大的架構(gòu),Imagination 將能滿足各種性能運算需求,提供業(yè)界最完整與高效的 GPU IP 內(nèi)核組合。
ABI Research 董事總經(jīng)理兼Video、OTT 和 AR/VR 副總裁 Sam Rosen 表示:“AR/VR 及機器學習等新興應(yīng)用已為 GPU 帶來了更嚴酷的新需求。針對這些應(yīng)用,GPU 必須能執(zhí)行傳統(tǒng)圖形渲染之外的更多任務(wù),包括大量的通用運算作業(yè)。對 GPU 微架構(gòu)來說,能在單一渲染畫面內(nèi)不同階段中善于混合圖形與運算工作負載是很重要的。通過 Furian架構(gòu),Imagination 再次以其深厚的 GPU 專業(yè)技術(shù)積淀,打造出一個專為支持這些下一代應(yīng)用的完美架構(gòu)。”
Imagination 公司 PowerVR 事業(yè)部執(zhí)行副總裁 Mark Dickinson 表示:“我們開發(fā) Furian架構(gòu) 就是為了應(yīng)對新型態(tài)的新興應(yīng)用,并專注于有效的可擴展性,從而擴展至好幾代的 PowerVR IP 內(nèi)核。我們非常興奮能開始推出第一款以 Furian 架構(gòu)為基礎(chǔ)的 8XT IP 內(nèi)核。這些內(nèi)核將進一步強化 PowerVR 在高端移動性能領(lǐng)域的領(lǐng)導地位。”
Furian 架構(gòu)的重要特性
Furian 架構(gòu)采用了多項使 PowerVR 得以建立技術(shù)領(lǐng)先地位的優(yōu)異特性,包括 Imagination 的分塊式延遲渲染 (TBDR) 技術(shù),它已在多款的 PowerVR GPU 上獲得證明,可提供最高效率的嵌入式圖形功能。
Furian 是專為以下特性所設(shè)計:
· 多重性能可擴展性:Furian允許多種方式來進行擴展,是專為達成最高效率的內(nèi)核利用率與性能密度所設(shè)計,以滿足各種市場與需求。針對低級與高級IP內(nèi)核的不同設(shè)計,無需因擴展而采取設(shè)計折衷。
· 簡易SoC與系統(tǒng)級集成:Furian已針對新的14nm以下制程進行了簡易布局的最佳化設(shè)計,因此能減少布局的時間與資源,并能更輕松地擴展至更高的性能點。
· 可延展性:Furian的設(shè)計方式能讓未來的特定功能流水線與GPU緊密集成,因而能提供那些以傳統(tǒng)CPU/GPU/DSP方式實現(xiàn)起來成本太高甚至不可行的功能,例如光線追蹤功能。
· GPU 運算:Furian是專為滿足多種應(yīng)用與市場日益提升的運算需求所設(shè)計,能夠高效使用包括 OpenCL® 2.0、Vulkan® 1.0 和 OpenVX 1.1* 等運算 API。Furian 增加了雙向的 GPU/CPU 一致性接口,可有效地分享數(shù)據(jù);并從內(nèi)核模式序列轉(zhuǎn)移至使用者模式序列,能降低延遲和 CPU 的運算執(zhí)行占用率。
重要的是,F(xiàn)urian 采用新的32寬 (32-wide) ALU 集簇設(shè)計,以提升性能密度與效率。在主要與次要的 ALU 流水線中的新增指令集架構(gòu) (ISA) 可實現(xiàn)更佳的資源利用率與效率,而多線程優(yōu)化能更高效和靈活地訪問片上本地運算內(nèi)存。
Furian的性能數(shù)據(jù)
性能密度、GPU效率、以及系統(tǒng)效率的提升可為下一代應(yīng)用提供更低功耗與更佳用戶體驗。與采用相同制程技術(shù)的 Series7XT Plus GPU 相比,具備類似芯片面積預算的內(nèi)核在相同的時間效率下,F(xiàn)urian 可達到:
· 35%的GFLOPS密度提升,提供更佳的運算與游戲性能效率
· 80%的填充率密度提升,提供更佳的UI與休閑游戲 (casual gaming) 性能效率
· 70-90%的游戲精度提升 ─ 真實世界應(yīng)用的結(jié)果甚至比預期的更高