驍龍芯片設(shè)計(jì)人員調(diào)動(dòng),高通作何打算?
高通公司曾將來(lái)自其旗艦級(jí)驍龍芯片(被數(shù)以百萬(wàn)計(jì)智能手機(jī)與平板設(shè)備所使用)開(kāi)發(fā)團(tuán)隊(duì)的工程師們調(diào)往其剛剛起步的數(shù)據(jù)中心處理器Centriq芯片部門(mén)。
這種關(guān)注重點(diǎn)的轉(zhuǎn)化意味著高通公司開(kāi)始將注意力集中在服務(wù)器領(lǐng)域,而就在今天(星期二)晚,相關(guān)成果終將亮相——Centriq內(nèi)部設(shè)計(jì)方案將在本屆于硅谷召開(kāi)的Hot Chips大會(huì)上公開(kāi)。
將眾多原本隸屬驍龍部門(mén)的工程師重新調(diào)往Centriq可能恰好解釋了為何高通公司決定將內(nèi)部設(shè)計(jì)的移動(dòng)Kryo核心替換為現(xiàn)成ARM Cortex核心——或者是經(jīng)過(guò)輕微調(diào)整的版本。事實(shí)上,高通公司已經(jīng)停止了全面定制化Kryo芯片的開(kāi)發(fā)工作。
當(dāng)然,仍有一部分移動(dòng)CPU設(shè)計(jì)師繼續(xù)留在驍龍研發(fā)團(tuán)隊(duì)當(dāng)中,而且工程師們亦可根據(jù)需求隨時(shí)被調(diào)回。根據(jù)我們掌握的情況,目前移動(dòng)開(kāi)發(fā)組仍然擁有充足的人手,能夠繼續(xù)推動(dòng)驍龍芯片家族的順利發(fā)展。這部分消息已經(jīng)得到了高通公司多位高管的證實(shí)。
去年年末,高通公司發(fā)布了驍龍835,這款高性能系統(tǒng)級(jí)芯片將從今年開(kāi)始由頂級(jí)Android智能手機(jī)過(guò)渡到Windows 10筆記本當(dāng)中。這款處理器并未采用內(nèi)部開(kāi)發(fā)的Kryo核心,而是選擇了經(jīng)過(guò)輕松調(diào)整的現(xiàn)成CPU計(jì)算核心——很可能是四Coretex-A53加四A72或者A73的組合,且由ARM公司提供授權(quán)。高通方面將其稱為“半定制”與“構(gòu)建在ARM Cortex技術(shù)之上”的方案。
今年5月,高通公司面向智能手機(jī)發(fā)布了更為高端的驍龍?zhí)幚砥鳎?60與630。然而,其中660采用了來(lái)自驍經(jīng)820系列的八個(gè)Kryo核心,而630則采用八個(gè)ARM Cortex-A53核心。
這并不是說(shuō)ARM公司的現(xiàn)成核心就不好。只是這種轉(zhuǎn)變意味著高通公司的其它設(shè)計(jì)方案——包括其GPU、DSP、機(jī)器學(xué)習(xí)功能以及調(diào)制解調(diào)器——必須得想辦法讓其移動(dòng)系統(tǒng)芯片煥發(fā)出獨(dú)特的光彩,從而在與其它同樣采用現(xiàn)成Cortex核心的廠商當(dāng)中脫穎而出。這對(duì)于高通公司無(wú)疑是重要的一步,特別是考慮到其核心業(yè)務(wù)正是移動(dòng)處理器與無(wú)線調(diào)制解調(diào)器芯片組。
值得一提的是,高通公司管理層表示,他們的想法是在正確的時(shí)間在移動(dòng)端采用正確的計(jì)算核心——這意味著現(xiàn)成Cortex CPU在表現(xiàn)上顯然優(yōu)于高通內(nèi)部設(shè)計(jì)的驍龍CPU。
轉(zhuǎn)向數(shù)據(jù)中心領(lǐng)域
本周二晚上,Centriq 2400設(shè)計(jì)藍(lán)圖將由高通公司高層人士在本屆于加利福尼亞州庫(kù)比蒂諾召開(kāi)的Hot Chips大會(huì)上向芯片工程師與計(jì)算機(jī)科學(xué)家們展示。我們此前曾經(jīng)介紹過(guò)這款采用10納米制程的ARMv8處理器產(chǎn)品線。高通公司曾在本周強(qiáng)調(diào)稱,盡管設(shè)計(jì)人員來(lái)自驍龍?zhí)幚砥鲌F(tuán)隊(duì),但Centriq從設(shè)計(jì)之初就專門(mén)面向云計(jì)算與服務(wù)器工作負(fù)載等場(chǎng)景。
Centriq原理圖
在這方面,很多朋友可能會(huì)對(duì)高通公司食言而肥的作法有所抱怨。在我們于上周看到的Hot Chips演示文稿當(dāng)中,該公司表示Centriq處理器采用“第五代定制化核心設(shè)計(jì)”,旨在“從根本上滿足云服務(wù)供應(yīng)商的實(shí)際需求”。
Centriq產(chǎn)品管理高級(jí)主管Chris Bergen解釋稱,這意味著現(xiàn)有工程師團(tuán)隊(duì),包括來(lái)自驍龍?zhí)幚砥鏖_(kāi)發(fā)組的成員,正在努力進(jìn)行其第五代定制化CPU設(shè)計(jì),且將從零開(kāi)始打造出一款服務(wù)器友好型系統(tǒng)芯片。
然而著眼于藍(lán)圖本身,可以肯定的是這絕不是一款加大版的智能手機(jī)CPU。
這款代號(hào)為Falkor的處理器擁有48個(gè)計(jì)算核心,且僅能運(yùn)行64位ARMv8代碼。其并不提供32位模式。這款系統(tǒng)芯片支持ARM的虛擬機(jī)管理程序權(quán)限等級(jí)(簡(jiǎn)稱EL2),可提供一套TrustZone(EL3)環(huán)境,且以可選方式包含AES、SHA1以及SHA2-256等加密算法的硬件加速能力。各計(jì)算核心被部署在一條環(huán)狀總線之上,類似于英特爾剛剛停止在其至強(qiáng)處理器上使用的設(shè)計(jì)思路。芯片巨頭并不喜歡以環(huán)狀結(jié)構(gòu)提升其芯片內(nèi)的計(jì)算核心數(shù)量,轉(zhuǎn)而選擇了網(wǎng)狀柵極——但高通方面則明顯更喜歡這種快速雙向頻段思路。
其共享三級(jí)緩存被附加在環(huán)狀結(jié)構(gòu)當(dāng)中,且看起來(lái)均勻分布在各計(jì)算核心之間。根據(jù)我們得到的消息,該環(huán)狀互連結(jié)構(gòu)的總傳輸帶寬至少可達(dá)每秒250 GB。另外,據(jù)稱這一環(huán)狀結(jié)構(gòu)還進(jìn)行了分段,我們認(rèn)為這代表著其中可能包含復(fù)數(shù)個(gè)環(huán)。因此,總計(jì)48個(gè)計(jì)算核心當(dāng)中可能有24個(gè)處于一套環(huán)內(nèi),而另外24個(gè)核心則處于另一套環(huán)中,并由各環(huán)狀體系將其對(duì)接在一起。
說(shuō)到高速緩存,高通公司今年之內(nèi)應(yīng)該會(huì)實(shí)現(xiàn)這款芯片的量產(chǎn),但并不會(huì)對(duì)緩存大小進(jìn)行提升。每個(gè)計(jì)算核心擁有一個(gè)24 KB的64字節(jié)行零級(jí)指令緩存,一個(gè)64 KB 64字節(jié)行一級(jí)I-緩存,外加32KB一級(jí)數(shù)據(jù)緩存。其余的二級(jí)與三級(jí)緩存大小目前仍不明確。這款芯片目前僅提供樣品,因此大家只能立足主流服務(wù)器芯片制造商英特爾公司的現(xiàn)有設(shè)計(jì)方案進(jìn)行研究。高通公司顯然不希望過(guò)早披露關(guān)鍵信息導(dǎo)致英特爾方面有所防備。
一級(jí)與零級(jí)緩存
其中零級(jí)緩存尤其值得關(guān)注:其作為一級(jí)I-緩存的擴(kuò)展充當(dāng)指令獲取緩沖區(qū)。換句話來(lái)說(shuō),其很像是那種典型的前端緩沖區(qū),每個(gè)周期會(huì)消耗四條指令,但具體作用則與緩存完全相同:例如,CPU可對(duì)其進(jìn)行無(wú)效化與刷新。二級(jí)緩存則負(fù)責(zé)容納數(shù)據(jù)與指令,且可實(shí)現(xiàn)128字節(jié)行八路運(yùn)行,一次命中的最低延遲為15個(gè)周期。
二級(jí)緩存
三級(jí)緩存擁有一項(xiàng)服務(wù)質(zhì)量功能,允許各虛擬機(jī)管理程序與內(nèi)核對(duì)虛擬機(jī)以及線程進(jìn)行組織,以便確保擁有較高優(yōu)先級(jí)的虛擬機(jī)能夠占用較其它虛擬機(jī)更高的緩存容量。該芯片亦可實(shí)現(xiàn)實(shí)時(shí)內(nèi)存壓縮,延遲為2到4個(gè)周期,且面向軟件開(kāi)放。根據(jù)我們得到的消息,128字節(jié)行可被壓縮為64字節(jié)行,并在可能的情況下進(jìn)行糾錯(cuò)。
當(dāng)高通公司提到48個(gè)計(jì)算核心時(shí),最終產(chǎn)品一定就是48個(gè)計(jì)算核心——不存在任何超線程或者其它類似的縮水作法。Falkor芯片可對(duì)共享的二級(jí)緩存進(jìn)行配對(duì)以實(shí)現(xiàn)雙工傳輸。每個(gè)計(jì)算核心皆可開(kāi)啟與關(guān)閉,具體取決于工作負(fù)載需求——相當(dāng)于由輕度睡眠(CPU時(shí)鐘關(guān)閉)到全速運(yùn)轉(zhuǎn)。其提供32條PCIe通道,6條DDR4內(nèi)存通道并配合有糾錯(cuò)功能。每通道擁有1到2個(gè)DIMM,外加SATA、USB、串行與通用IO接口。
功耗控制
更進(jìn)一步挖掘,可以發(fā)現(xiàn)其擁有可變長(zhǎng)度管道,意味著可在每周期內(nèi)最多發(fā)出三條指令外加一條直接分支。另外,其還擁有8條調(diào)度通道。其可實(shí)現(xiàn)無(wú)序執(zhí)行,并對(duì)資源進(jìn)行重命名。每個(gè)預(yù)測(cè)分支擁有一個(gè)0或1懲罰評(píng)分,一套16入口分支目標(biāo)指令緩存,外加一套三級(jí)分支目標(biāo)地址緩存。
Centriq的管道結(jié)構(gòu)
分支預(yù)測(cè)器
管道隊(duì)列
管道的負(fù)載存儲(chǔ)分段
可變長(zhǎng)度整數(shù)處理部分
這款芯片搭載有不可變片上ROM,其中包含一款啟動(dòng)加載程序,可用于驗(yàn)證通常被保存在閃存內(nèi)的外部固件,同時(shí)確保僅運(yùn)行合法代碼。處理器內(nèi)的安全控制器可容納來(lái)自主通、服務(wù)器制造商以及客戶的軟件驗(yàn)證用加密公鑰。因此,設(shè)備將僅在未從ROM或者早期啟動(dòng)加載程序中發(fā)現(xiàn)漏洞的前提下啟動(dòng)可信代碼并構(gòu)建信息來(lái)源。