架構(gòu)與ISA:移動(dòng)處理器的真正關(guān)鍵
掃描二維碼
隨時(shí)隨地手機(jī)看文章
我最近參加了the Linley Tech Mobile Conference (Linley Tech移動(dòng)技術(shù)研討會(huì)),這是每年在硅谷連續(xù)舉辦兩天的技術(shù)研討會(huì),聚焦于移動(dòng)處理議題。參與的廠商包括Synopsys、英特爾、GLOBALFOUNDRIES、高通(容我補(bǔ)充,這些都是Imagination日益壯大的生態(tài)系統(tǒng)伙伴)以及其他許多公司。
今年,在圣塔克拉拉熟悉的景色和Hyatt Regency酒店中,這場(chǎng)盛會(huì)再度登場(chǎng)。這是讓媒體、分析師、資深工程師和經(jīng)理人等眾多科技產(chǎn)業(yè)從業(yè)人員齊聚一堂的好地方。
我的簡(jiǎn)報(bào)是排在第三個(gè)議程,主題為移動(dòng)CPU。我解釋了為什么盡管所有的趨勢(shì)都朝高端軟件開發(fā)和抽象級(jí)發(fā)展,而不重視底層的CPU與GPU指令集架構(gòu)(ISA)。但是當(dāng)設(shè)計(jì)CPU、GPU和移動(dòng)裝置用的其他處理器時(shí),利用從一開始就為可擴(kuò)展性建構(gòu)的高效處理架構(gòu)還是會(huì)帶來顯著的差異。
功率和日益縮短的產(chǎn)品開發(fā)周期 ─ 移動(dòng)處理器的競(jìng)爭(zhēng)態(tài)勢(shì)
移動(dòng)產(chǎn)品開發(fā)目前面臨著兩個(gè)非常不同的挑戰(zhàn),這些挑戰(zhàn)限制了運(yùn)算技術(shù)進(jìn)展的腳步,并又返過來直接影響到移動(dòng)應(yīng)用處理本身。
一方面,功率是每一家主要處理器IP和芯片供應(yīng)商試圖主導(dǎo)市場(chǎng)的終極戰(zhàn)場(chǎng)。因此,系統(tǒng)設(shè)計(jì)人員必須謹(jǐn)慎在高效能和低功耗間取得平衡,這也影響著每個(gè)SoC設(shè)計(jì)的重大決定。此議題已經(jīng)主導(dǎo)了28納米設(shè)計(jì),并將會(huì)繼續(xù)影響20納米以下的SoC設(shè)計(jì)。但更重要的是,散熱議題已成為超越移動(dòng)應(yīng)用領(lǐng)域,從嵌入式運(yùn)算和移動(dòng)運(yùn)算擴(kuò)大到網(wǎng)絡(luò)、M2M和物聯(lián)網(wǎng)等各種市場(chǎng)的關(guān)鍵考慮方面。
我們?cè)庥龅牧硪粋€(gè)重大挑戰(zhàn)是產(chǎn)品開發(fā)周期越來越短。過去,18~24個(gè)月的開發(fā)周期是常態(tài),但現(xiàn)在我們看到有些客戶將時(shí)間縮短到每6~12個(gè)月就推出新款芯片。這需要投入龐大的設(shè)計(jì)工作,而且當(dāng)產(chǎn)品要滿足不同層級(jí)市場(chǎng)的需求時(shí),耗費(fèi)的研發(fā)精力會(huì)更大。
融合趨勢(shì)使得一些傳統(tǒng)以來不會(huì)快速推出新產(chǎn)品的市場(chǎng)也大幅加速了設(shè)計(jì)周期,像是智能電視、便攜式游戲機(jī)或連網(wǎng)汽車都需要采用最新科技,才能獲得已習(xí)慣于使用口袋卡片個(gè)人計(jì)算器的消費(fèi)者青睞。
不管是針對(duì)重復(fù)使用或是能夠更妥善地在單一芯片上分配不同的運(yùn)算資源,程序代碼可移植性都是解決低功耗與縮短開發(fā)周期挑戰(zhàn)的解決方案。這是異構(gòu)處理革命的基礎(chǔ),也是能將這一愿景變成現(xiàn)實(shí)的技術(shù),同時(shí)可避免程序代碼對(duì)低端硬件的依賴性。今天的CPU會(huì)執(zhí)行許多通用軟件,但是,現(xiàn)有SoC各功能方塊的利用率必須提升,才能適應(yīng)未來效能增加的需求。LLVM便是一個(gè)很好的例子,它免除了程序?qū)Φ讓覫SA的依賴,并能實(shí)現(xiàn)程序代碼橫跨不同裝置與架構(gòu)的可移植性目標(biāo)。
PowerVR GPU推升異構(gòu)處理效率
Imagination的PowerVR ‘Rogue’ 架構(gòu) 可為移動(dòng)裝置提供約1 TFLOPS的效能。定義系統(tǒng)效能和特性的一個(gè)重要部分現(xiàn)已與繪圖和這些高度平行處理器的運(yùn)算潛能有關(guān)。
傳統(tǒng)以來,繪圖效能主要是用來推動(dòng)裝置的顯示功能。
但由于繪圖處理具備了足夠的功能,所以提升SoC的效率將取決于發(fā)揮GPU的潛力。這可通過新的和增強(qiáng)的API、可擴(kuò)充軟件解決方案和統(tǒng)一的編程環(huán)境來實(shí)現(xiàn)。
重新認(rèn)識(shí)RISC架構(gòu)概念
盡管此趨勢(shì)已逐漸興起,CPU仍然是系統(tǒng)中主要且最常用的通用可編程單元。Imagination的MIPS架構(gòu)發(fā)展可追溯到30年前John Hennessy和他的團(tuán)隊(duì)將編譯程序理論的專業(yè)知識(shí)帶到單純的RISC架構(gòu)構(gòu)建中,推動(dòng)了優(yōu)化編譯程序的進(jìn)展。
30年之后,這樣的想法剛好與業(yè)界期望在運(yùn)行期間采用JIT/動(dòng)態(tài)編譯程序技術(shù),以向程序代碼可移植轉(zhuǎn)移的趨勢(shì)相同。MIPS ISA的特性包括每指令單一運(yùn)算、簡(jiǎn)易尋址模式、非預(yù)測(cè)執(zhí)行或非整數(shù)條件位等,可為現(xiàn)實(shí)世界帶來實(shí)際效益,以協(xié)助系統(tǒng)設(shè)計(jì)人員實(shí)現(xiàn)更高的效能,開發(fā)出高頻執(zhí)行的高端、超標(biāo)量、亂序CPU,并同時(shí)保持低功耗特性。
也就是說,盡管這些技術(shù)能讓業(yè)界脫離底層ISA的歷史包袱,但固有的架構(gòu)特性對(duì)動(dòng)態(tài)編譯效能、如何有效地將架構(gòu)構(gòu)建在芯片中,以及支持開放標(biāo)準(zhǔn)與操作系統(tǒng)來說,仍然非常重要。
proAptiv CPU是Imagination無須妥協(xié)的MIPS架構(gòu)如何能帶來高效能、低功耗CPU的最好例子。舉例來說,架構(gòu)中缺乏預(yù)測(cè)性指令可簡(jiǎn)化分支預(yù)測(cè)方法的建構(gòu),這是proAptiv CPU具備領(lǐng)先的同級(jí)預(yù)測(cè)效能的主要原因。
進(jìn)一步提升的架構(gòu)效率與微架構(gòu)設(shè)計(jì)選擇,使得此核心在推出時(shí)便能提供同類產(chǎn)品的最高CoreMark/MHz CPU分?jǐn)?shù),與競(jìng)爭(zhēng)性CPU方案相比,面積更是縮小了約60%。
移動(dòng)CPU ─ 不僅是應(yīng)用處理器
但應(yīng)用處理器不僅是移動(dòng)SoC中的CPU。其他的功能,像基帶中的通信處理,它與移動(dòng)裝置的網(wǎng)絡(luò)功能有關(guān),也非常重要,而且也能受益于其它的架構(gòu)特性。多線程處理器能以與單核心CPU相近的面積與功耗提供更高效能。
這能通過內(nèi)置的硬件調(diào)度器和輸出限定器(yield qualifier)?,來實(shí)現(xiàn)更佳的實(shí)時(shí)/確定性處理需求和服務(wù)質(zhì)量(QoS)。運(yùn)用我們的多線程和多核解決方案,客戶能用我們和合作伙伴共同開發(fā)的優(yōu)化LTE基帶堆棧和多家供應(yīng)商提供的多線程RTOS來建立優(yōu)異的基帶解決方案。與采用單線程的內(nèi)核相比,利用此技術(shù)能為L(zhǎng)TE流量提升37~53%的數(shù)據(jù)處理量。
總之,異構(gòu)運(yùn)算的基本技術(shù)已開始用來推動(dòng)移動(dòng)運(yùn)算的發(fā)展。Imagination提供廣泛的IP產(chǎn)品組合,以擁抱可擴(kuò)展、可移植、高度開放和標(biāo)準(zhǔn)導(dǎo)向的未來。我們相信,架構(gòu)(CPU、GPU或其他)應(yīng)根據(jù)它們的真實(shí)效能來相互競(jìng)爭(zhēng),產(chǎn)業(yè)將不再像過去一樣受限于單一ISA架構(gòu),而會(huì)有更快速的發(fā)展。