對稱多處理 (SMP) 的應(yīng)用優(yōu)勢分析
何謂 SMP?我們?yōu)槭裁葱枰?
對稱多處理 (SMP) 廣泛應(yīng)用于 PC 領(lǐng)域,能夠顯著提升臺式計算機(jī)的性能。SMP 能使單芯片上多個相同的處理子系統(tǒng)運行相同的指令集,而且都對存儲器、I/O 和外部中斷具有同等的訪問權(quán)限。操作系統(tǒng) (OS) 的單份拷貝就能控制所有內(nèi)核,使任何處理器都能運行所有的線程,而無需考慮內(nèi)核、應(yīng)用或中斷服務(wù)的區(qū)分。
圖 1:多重因素推動移動設(shè)備對 SMP 的需求不斷增長SMP 將推動移動應(yīng)用和設(shè)備不斷發(fā)展進(jìn)步,而這正是目前單核解決方案所無法實現(xiàn)的。SMP 能激活執(zhí)行任務(wù)所需的某個特定內(nèi)核或多個內(nèi)核,從而使 OEM 廠商能夠?qū)崿F(xiàn)高度可擴(kuò)展的性能與電源,充分滿足當(dāng)今業(yè)界最流行的應(yīng)用以及未來潛在的創(chuàng)新應(yīng)用。無障礙 Web 瀏覽等大量新型應(yīng)用對移動設(shè)備提出了更高的峰值計算性能要求。目前的單核解決方案無法滿足這一需求,只有 SMP 才能在移動設(shè)備的空間尺寸及電源限制條件下實現(xiàn)上述性能需求。我們固然可通過增加單核解決方案的尺寸來滿足性能需求,但若增加功耗則對移動設(shè)備來說是不可接受的。SMP 正是滿足此類需求的唯一架構(gòu)技術(shù)??梢灶A(yù)見,高級移動應(yīng)用將像現(xiàn)在的 PC 應(yīng)用一樣復(fù)雜,而 PC 領(lǐng)域開發(fā)的線程技術(shù)也將有望移植到移動手持終端上。推動 PC 處理器不斷發(fā)展的挑戰(zhàn)(例如單內(nèi)核芯片性能略有提高就需要大幅加大硅芯片技術(shù)的復(fù)雜性)也同樣推動移動手持終端轉(zhuǎn)向多內(nèi)核架構(gòu)。此外,在較大型的單內(nèi)核解決方案上實現(xiàn)更高性能會使成本和復(fù)雜性直線上升,從而因更復(fù)雜的設(shè)計和驗證過程最終導(dǎo)致產(chǎn)品上市時間拖延。PC 市場是促進(jìn) SMP 技術(shù)推廣的催化劑,目前許多 PC 都內(nèi)置了雙核乃至四核處理器。ARM Ltd. 一直積極推動 SMP 技術(shù)向手持終端市場發(fā)展,并推出了 Cortex™-A9 MPCore 架構(gòu)。為了支持最新系列的 SMP 內(nèi)核,諸如 Linux 和 Symbian 等操作系統(tǒng)紛紛增加了對 SMP 的支持。SMP 將為采用一至四核乃至更多內(nèi)核的產(chǎn)品提供高度可擴(kuò)展的產(chǎn)品發(fā)展規(guī)劃,滿足未來需求。SMP 高度可擴(kuò)展的發(fā)展規(guī)劃可全面滿足從低到高各級設(shè)備的需求,幫助開發(fā)人員充分利用現(xiàn)有的軟件投資,確保推出的產(chǎn)品能夠迎合不同市場對各種性能級別的需求。移動局限性
要想獲得成功,SMP 就必須克服眾多移動設(shè)備自身存在的局限問題,而尺寸、成本以及功耗屬于最顯而易見的問題。消費者期望獲得可方便地裝入口袋或錢包中的超小型移動設(shè)備,而且一次充電就能全天無憂。此外,移動設(shè)備的成本也是市場必須考慮的問題。SMP 可全面解決上述移動技術(shù)面臨的局限問題,確保設(shè)備滿足消費者的要求。SMP 將幫助高級應(yīng)用提高運行效率,不過我們也必須注意,增加的內(nèi)核不能在功耗方面造成消極影響。在 SMP 設(shè)備中采用新技術(shù)必須確保功耗不超過單內(nèi)核的水平。隨著移動手持終端開始支持過去只有 PC 才具備的 Web 瀏覽、多媒體和 WLAN 連接等功能,以及語音和藍(lán)牙等標(biāo)準(zhǔn)移動功能,用戶對性能的需求越來越高。不過,在移動環(huán)境中,提升性能不僅必須確保高效性,而且還必須根據(jù)實際需求滿足相應(yīng)的功耗要求。只有根據(jù)不同的使用情況優(yōu)化功耗和性能,才能最大限度地延長電池工作時間并實現(xiàn)最高性能。SMP 使智能電話能夠集成 PC 以及傳統(tǒng)電話的功能,讓單部移動設(shè)備滿足用戶對功耗與性能的需求。ARM 目前在移動設(shè)備市場上占據(jù)主導(dǎo)地位,因而我們既需要支持傳統(tǒng)代碼,又需要支持功能豐富的工具。展望未來,SMP 將必須確保支持可實現(xiàn)正常工作的傳統(tǒng)代碼,同時還要節(jié)約功耗,提高性能。我們必須解決的最后一個移動局限問題,就是在盡可能減小芯片尺寸的同時提供足夠大的存儲器高速緩存,以確保多內(nèi)核工作不會出現(xiàn)死機(jī)問題。如果單內(nèi)內(nèi)核設(shè)備需要的高速緩存量為 N,那么多內(nèi)核設(shè)備保持良好性能所需的緩存量就應(yīng)為 4*N。此外,我們還要考慮數(shù)據(jù)一致性和系統(tǒng)存儲器一致性等其他存儲器設(shè)計問題,才能確保所有處理器都能在準(zhǔn)確時間存取當(dāng)時的數(shù)據(jù)。ARM Cortex-A9 MPCore
圖 2:ARM® Cortex™-A9 MPCore™為移動設(shè)備實現(xiàn)可擴(kuò)展的功率與性能為了滿足移動手持設(shè)備市場對可擴(kuò)展功率與性能的需求,ARM 推出了 Cortex-A9 MPCore 架構(gòu)。該架構(gòu)與 ARM Cortex-A8 相比,可將處理效率提高 20% (IPC),從而幫助設(shè)計人員以更低的頻率完成更多的工作。Cortex-A9 MPCore 可在一個群集中支持多達(dá) 4 個內(nèi)核,能夠為客戶設(shè)計產(chǎn)品、滿足特定需求提供高度的靈活性。Cortex-A9 MPCore 包含豐富的特性,如:高效超標(biāo)量管線能夠以低功耗實現(xiàn)優(yōu)異的峰值性能; [!--empirenews.page--]
NEON 媒體處理引擎可加速媒體處理功能;
比前代 ARM FPU 性能提高一倍的浮點單元;
優(yōu)化的 1 級高速緩存可最大限度地降低時延與功耗;
Thumb®-2 技術(shù)可將存儲器要求降低 30%;
TrustZone® 技術(shù)支持可靠的安全應(yīng)用;
L2 高速緩存控制器支持低時延、高帶寬存儲器存取;
CoreSight™ 多內(nèi)核調(diào)試與跟蹤架構(gòu)可在開發(fā)調(diào)試期間提高可視性。
Cortex-A9 MPCore 內(nèi)核比 Cortex-A8 更小,在降低功耗的同時提高了處理效率??蓴U(kuò)展峰值性能與高級電源管理相結(jié)合,使 Cortex-A9 MPCore 性能超過了同類單內(nèi)核架構(gòu),并可為多內(nèi)核設(shè)計提供明顯的優(yōu)勢。Cortex-A9 MPCore 不但能夠?qū)崿F(xiàn)可擴(kuò)展至多個市場的統(tǒng)一平臺,同時還可充分利用通用軟件開發(fā)來降低研發(fā)成本,加速產(chǎn)品上的市進(jìn)程。
SMP 賦予應(yīng)用與產(chǎn)品的優(yōu)勢
目前,制造商希望投資于一款能夠使其在不同級別產(chǎn)品中充分利用與擴(kuò)展、并同時滿足未來需求的平臺。SMP 能夠以真正的性能可擴(kuò)展性全面滿足這一需求。與只能提高單個內(nèi)核速度的前代解決方案不同,SMP 將為整個多內(nèi)核實現(xiàn)真正的可擴(kuò)展性,為每一款產(chǎn)品實現(xiàn)性能與功耗的最佳組合。SMP 將允許制造商在統(tǒng)一的平臺上以更高的性能支持如上網(wǎng)本等未來產(chǎn)品。一旦 SMP 的軟件開發(fā)完成,設(shè)計人員便可根據(jù)未來需要添加多個處理器,而且這對軟件將保持透明。SMP 設(shè)計可為制造商滿足未來應(yīng)用需求打下堅實的基礎(chǔ)。
SMP 軟件的影響
SMP 可為各個層面的軟件大幅提高性能。對于不支持 SMP 的軟件,我們可使用操作系統(tǒng)任務(wù)管理器在每個內(nèi)核上啟動進(jìn)程來實現(xiàn)并行工作。并行進(jìn)程執(zhí)行自然會提升性能,雖然其效率不如線程級處理那么高,但也不會對應(yīng)用開發(fā)人員造成更多的設(shè)計麻煩。
圖 3:SMP 可在軟件的進(jìn)程與線程層面上提高性能隨著移動設(shè)備性能的不斷提升,用戶應(yīng)用的復(fù)雜性也在不斷增加,在此情況下,應(yīng)用程序應(yīng)更多地以并行方式進(jìn)行編寫(如采用線程方式),因此,我們便可充分發(fā)揮 SMP 的真正優(yōu)勢與增益。線程構(gòu)成進(jìn)程,不必反復(fù)返回操作系統(tǒng)尋求資源。應(yīng)用開發(fā)人員不但要采用并行方式進(jìn)行軟件設(shè)計,而且還必須注意進(jìn)程中線程的互動方式。 某些應(yīng)用本身就是多線程的,從而使 SMP 能夠?qū)崿F(xiàn)更高的性能,更快的響應(yīng)時間以及更出色的整體用戶體驗。如 Google 的 Chrome 等 web 瀏覽器就采用了多線程技術(shù),因此能夠與 SMP 技術(shù)實現(xiàn)高度互補。預(yù)計這些 PC web 瀏覽器所使用的這種技術(shù)也將用于移動領(lǐng)域。 Symbian 和 Linux 移動操作系統(tǒng)均全面支持 SMP。這種支持針對移動環(huán)境進(jìn)行了專門優(yōu)化,將使所有處理器內(nèi)核的單一操作系統(tǒng)內(nèi)核映像以及調(diào)度器中的負(fù)載平衡能夠幫助確定在哪個內(nèi)核上運行哪個任務(wù)或線程。 在處理原有軟件時,我們必須注意正確的任務(wù)同步,以避免系統(tǒng)鎖死。在 SMP 系統(tǒng)中,操作系統(tǒng)可在安排低優(yōu)先級任務(wù)運行在一個不同內(nèi)核上的同時,讓一個具有較高優(yōu)先級的任務(wù)運行在另一個內(nèi)核上。如果軟件包含不明確的同步,則會產(chǎn)生導(dǎo)致鎖死情況的錯誤判斷。通過正確使用信號量、互斥量以及自旋鎖等軟件技術(shù),SMP 內(nèi)核的編程軟件將可實現(xiàn) SMP 的全部優(yōu)勢。 SMP 系統(tǒng)上的開發(fā)與調(diào)試工具至關(guān)重要。設(shè)計人員需要進(jìn)一步了解芯片情況才能緊跟軟件處理技術(shù)。在多個內(nèi)核上同時運行多個線程的情況下,功能強(qiáng)大的新型工具將可幫助制造商快速向市場推出令人驚奇的全新產(chǎn)品。[!--empirenews.page--]
SMP 的高級電源管理
SMP 提供的可擴(kuò)展電源優(yōu)勢可用來擴(kuò)展內(nèi)核頻率與工作內(nèi)核的數(shù)量。Cortex-A9 MPCore 能夠分別啟用與關(guān)閉不同的內(nèi)核。如果內(nèi)核處于開啟狀態(tài),則必須運行在相同的時鐘頻率下。因此,為了高效使用 SMP 內(nèi)核的電源管理,必須通過測試來確定以下兩種選項的性能與功耗基準(zhǔn):一、在關(guān)閉其它內(nèi)核的同時,以最高時鐘頻率在單個內(nèi)核上全速運行進(jìn)程;二、多內(nèi)核同時運行進(jìn)程,但運行的時鐘頻率降低。SMP 采用的其它電源管理技術(shù)還包括動態(tài)電壓與頻率縮放 (DVFS),可根據(jù)所需的性能來調(diào)節(jié)匹配系統(tǒng)的頻率與電壓。操作系統(tǒng)可實現(xiàn)負(fù)載平衡,這也有助于改善電源管理,并幫助設(shè)計人員針對功耗來優(yōu)化系統(tǒng)。TI OMAP 4 平臺是業(yè)界率先推出的、基于 ARM Cortex-A9 MPCore 的雙內(nèi)核架構(gòu)之一。該架構(gòu)與專業(yè)處理引擎進(jìn)行了平衡,可實現(xiàn)無與倫比的移動多媒體性能。
圖 4:TI 全新 OMAP 4 平臺為移動設(shè)備帶來 SMPOMAP 4 平臺的主要特性包括:內(nèi)核 ARM Cortex-A9 MPCore SMP 通用處理器,可提高性能與效率;
IVA 3 硬件加速器,可實現(xiàn)真正的 1080p 多標(biāo)準(zhǔn)高清錄制與回放功能;
影像信號處理器 (ISP) 支持高質(zhì)量影像與視頻捕獲,可實現(xiàn)堪比 SLR 的數(shù)字高性能,捕獲 2000 萬像素的靜態(tài)影像;
Imagination Technologies POWERVR™ SGX540 3D 影像內(nèi)核支持 3D 用戶界面,可實現(xiàn)更大的顯示屏、逼真的圖像以及直觀易用的觸摸屏等應(yīng)用;
音頻后端 (ABE) 處理器可為顯著降低功耗提供虛擬低功耗音頻芯片;
靈活的系統(tǒng)支持:
復(fù)合型 TV 輸出
HDMI v1.3 輸出可驅(qū)動高清顯示屏
色彩豐富的更大顯示屏支持
外設(shè)接口:MIPI 串行攝像機(jī)和串行顯示屏接口、MIPI® SLIMbusSM、MMC/SD、USB 2.0 移動高速、UART 以及 SPI 等
支持各大操作系統(tǒng):Linux(包括 Android 和 LiMo)、Microsoft Windows Mobile 和 Symbian;
45 納米移動工藝技術(shù)可提高性能與電源效率;
優(yōu)化的電源與音頻管理配套芯片:TWL6030 和 TWL6040
TI 是唯一一家可為 SMP 提供所有主要移動操作系統(tǒng)支持的公司,這些操作系統(tǒng)包括 Symbian、Linux 以及 Microsoft Windows Mobile 等。OMAP 4 平臺是移動產(chǎn)業(yè)有關(guān) SMP 轉(zhuǎn)型的領(lǐng)先解決方案,其架構(gòu)專為優(yōu)化 SMP 性能而精心設(shè)計。例如,我們在設(shè)計時對存儲器架構(gòu)、高速緩存量以及存儲器接口等給予了充分的考慮,能夠以最低的延遲實現(xiàn)最佳性能。OMAP 4 配套提供的 TI 綜合軟件套件專為 SMP 編寫,可充分發(fā)揮 SMP 架構(gòu)內(nèi)在的處理性能增強(qiáng)與省電優(yōu)勢。OMAP 4 平臺采用市場上最先進(jìn)高效的電源管理技術(shù),可進(jìn)一步節(jié)省電源。該處理器充分利用 TI SmartReflex™ 2 的電源和性能管理技術(shù),可提供各種智能、自適應(yīng)性軟硬件技術(shù),能夠根據(jù)器件工作情況、操作模式以及溫度等動態(tài)控制電壓、頻率與電源,具體包括:動態(tài)電壓與頻率縮放 (DVFS);
自適應(yīng)電壓縮放 (AVS);
動態(tài)電源切換 (DPS);
靜態(tài)漏電管理 (SLM);
自適應(yīng)體偏壓 (ABB);
針對速度較慢器件的順向偏壓 (FBB)
逆向偏壓 (RBB),可為速度較快的器件減少漏電
OMAP 4 平臺充分利用 TI 在移動設(shè)備領(lǐng)域的專業(yè)知識與豐富經(jīng)驗,可為當(dāng)前及未來應(yīng)用提供基于 SMP 的最新處理器解決方案。OMAP 4 SMP 的強(qiáng)大功能
OMAP 4 SMP 的強(qiáng)大功能
圖 5:OMAP 4 SMP 可實現(xiàn)類似 PC 的 Web 瀏覽體驗在第二個使用案例中,一位消費者正在使用手機(jī)欣賞 H.264 視頻。這種多媒體應(yīng)用案例通常不適用于多線程處理技術(shù),因此最好采用單內(nèi)核工作。在本例中,OMAP 4 將兩個內(nèi)核之中的一個關(guān)閉,并讓另一個內(nèi)核在更高頻率下工作,從而可提供出色的多媒體內(nèi)容。由于只有一個內(nèi)核工作,因而可降低功耗。
圖 6:OMAP 4 實現(xiàn)出色的多媒體內(nèi)容結(jié)論
SMP 對滿足新一代移動設(shè)備的高性能與低功耗需求將至關(guān)重要。SMP 具有可擴(kuò)展的功率與性能,能夠為單內(nèi)核解決方案提供獨特的優(yōu)勢。未來應(yīng)用將更多地使用多線程技術(shù),這將推動 SMP 成為我們的首選平臺。TI 的 OMAP 4 平臺是率先提供 SMP 技術(shù)的產(chǎn)品,不但能夠?qū)崿F(xiàn)可擴(kuò)展的通用處理性能,同時還可提升多媒體處理領(lǐng)域(影像、圖像、音頻與視頻)的功能。我們必須注意,SMP 不會吸收這些多媒體領(lǐng)域的功能,這些多媒體領(lǐng)域需要可在最低功耗下實現(xiàn)最高性能的專門引擎。OMAP 4 可提供 SMP 的優(yōu)化組合,能夠與非對稱多處理技術(shù) (AMP) 配合工作。TI OMAP 4 平臺是在移動設(shè)備中推進(jìn) SMP 技術(shù)的領(lǐng)先解決方案,可支持未來奇妙的應(yīng)用。當(dāng)前對 SMP 進(jìn)行投資,將來就可實現(xiàn)無縫的軟件重復(fù)使用,OEM 廠商也可在各個層次的產(chǎn)品上實現(xiàn)其設(shè)計方案的擴(kuò)展,并全面滿足未來的長遠(yuǎn)需求。