對稱多處理 (SMP) 的應用優(yōu)勢
何謂 SMP?我們?yōu)槭裁葱枰?
對稱多處理 (SMP) 廣泛應用于 PC 領域,能夠顯著提升臺式計算機的性能。SMP 能使單芯片上多個相同的處理子系統(tǒng)運行相同的指令集,而且都對存儲器、I/O 和外部中斷具有同等的訪問權限。操作系統(tǒng) (OS) 的單份拷貝就能控制所有內(nèi)核,使任何處理器都能運行所有的線程,而無需考慮內(nèi)核、應用或中斷服務的區(qū)分。
圖 1:多重因素推動移動設備對 SMP 的需求不斷增長SMP 將推動移動應用和設備不斷發(fā)展進步,而這正是目前單核解決方案所無法實現(xiàn)的。SMP 能激活執(zhí)行任務所需的某個特定內(nèi)核或多個內(nèi)核,從而使 OEM 廠商能夠實現(xiàn)高度可擴展的性能與電源,充分滿足當今業(yè)界最流行的應用以及未來潛在的創(chuàng)新應用。無障礙 Web 瀏覽等大量新型應用對移動設備提出了更高的峰值計算性能要求。目前的單核解決方案無法滿足這一需求,只有 SMP 才能在移動設備的空間尺寸及電源限制條件下實現(xiàn)上述性能需求。我們固然可通過增加單核解決方案的尺寸來滿足性能需求,但若增加功耗則對移動設備來說是不可接受的。SMP 正是滿足此類需求的唯一架構技術??梢灶A見,高級移動應用將像現(xiàn)在的 PC 應用一樣復雜,而 PC 領域開發(fā)的線程技術也將有望移植到移動手持終端上。推動 PC 處理器不斷發(fā)展的挑戰(zhàn)(例如單內(nèi)核芯片性能略有提高就需要大幅加大硅芯片技術的復雜性)也同樣推動移動手持終端轉向多內(nèi)核架構。此外,在較大型的單內(nèi)核解決方案上實現(xiàn)更高性能會使成本和復雜性直線上升,從而因更復雜的設計和驗證過程最終導致產(chǎn)品上市時間拖延。PC 市場是促進 SMP 技術推廣的催化劑,目前許多 PC 都內(nèi)置了雙核乃至四核處理器。ARM Ltd. 一直積極推動 SMP 技術向手持終端市場發(fā)展,并推出了 Cortex™-A9 MPCore 架構。為了支持最新系列的 SMP 內(nèi)核,諸如 Linux 和 Symbian 等操作系統(tǒng)紛紛增加了對 SMP 的支持。SMP 將為采用一至四核乃至更多內(nèi)核的產(chǎn)品提供高度可擴展的產(chǎn)品發(fā)展規(guī)劃,滿足未來需求。SMP 高度可擴展的發(fā)展規(guī)劃可全面滿足從低到高各級設備的需求,幫助開發(fā)人員充分利用現(xiàn)有的軟件投資,確保推出的產(chǎn)品能夠迎合不同市場對各種性能級別的需求。移動局限性
要想獲得成功,SMP 就必須克服眾多移動設備自身存在的局限問題,而尺寸、成本以及功耗屬于最顯而易見的問題。消費者期望獲得可方便地裝入口袋或錢包中的超小型移動設備,而且一次充電就能全天無憂。此外,移動設備的成本也是市場必須考慮的問題。SMP 可全面解決上述移動技術面臨的局限問題,確保設備滿足消費者的要求。SMP 將幫助高級應用提高運行效率,不過我們也必須注意,增加的內(nèi)核不能在功耗方面造成消極影響。在 SMP 設備中采用新技術必須確保功耗不超過單內(nèi)核的水平。隨著移動手持終端開始支持過去只有 PC 才具備的 Web 瀏覽、多媒體和 WLAN 連接等功能,以及語音和藍牙等標準移動功能,用戶對性能的需求越來越高。不過,在移動環(huán)境中,提升性能不僅必須確保高效性,而且還必須根據(jù)實際需求滿足相應的功耗要求。只有根據(jù)不同的使用情況優(yōu)化功耗和性能,才能最大限度地延長電池工作時間并實現(xiàn)最高性能。SMP 使智能電話能夠集成 PC 以及傳統(tǒng)電話的功能,讓單部移動設備滿足用戶對功耗與性能的需求。ARM 目前在移動設備市場上占據(jù)主導地位,因而我們既需要支持傳統(tǒng)代碼,又需要支持功能豐富的工具。展望未來,SMP 將必須確保支持可實現(xiàn)正常工作的傳統(tǒng)代碼,同時還要節(jié)約功耗,提高性能。我們必須解決的最后一個移動局限問題,就是在盡可能減小芯片尺寸的同時提供足夠大的存儲器高速緩存,以確保多內(nèi)核工作不會出現(xiàn)死機問題。如果單內(nèi)內(nèi)核設備需要的高速緩存量為 N,那么多內(nèi)核設備保持良好性能所需的緩存量就應為 4*N。此外,我們還要考慮數(shù)據(jù)一致性和系統(tǒng)存儲器一致性等其他存儲器設計問題,才能確保所有處理器都能在準確時間存取當時的數(shù)據(jù)。ARM Cortex-A9 MPCore
圖 2:ARM® Cortex™-A9 MPCore™為移動設備實現(xiàn)可擴展的功率與性能為了滿足移動手持設備市場對可擴展功率與性能的需求,ARM 推出了 Cortex-A9 MPCore 架構。該架構與 ARM Cortex-A8 相比,可將處理效率提高 20% (IPC),從而幫助設計人員以更低的頻率完成更多的工作。Cortex-A9 MPCore 可在一個群集中支持多達 4 個內(nèi)核,能夠為客戶設計產(chǎn)品、滿足特定需求提供高度的靈活性。Cortex-A9 MPCore 包含豐富的特性,如:高效超標量管線能夠以低功耗實現(xiàn)優(yōu)異的峰值性能; [!--empirenews.page--]
NEON 媒體處理引擎可加速媒體處理功能;
比前代 ARM FPU 性能提高一倍的浮點單元;
優(yōu)化的 1 級高速緩存可最大限度地降低時延與功耗;
Thumb®-2 技術可將存儲器要求降低 30%;
TrustZone® 技術支持可靠的安全應用;
L2 高速緩存控制器支持低時延、高帶寬存儲器存取;
CoreSight™ 多內(nèi)核調(diào)試與跟蹤架構可在開發(fā)調(diào)試期間提高可視性。
Cortex-A9 MPCore 內(nèi)核比 Cortex-A8 更小,在降低功耗的同時提高了處理效率??蓴U展峰值性能與高級電源管理相結合,使 Cortex-A9 MPCore 性能超過了同類單內(nèi)核架構,并可為多內(nèi)核設計提供明顯的優(yōu)勢。Cortex-A9 MPCore 不但能夠實現(xiàn)可擴展至多個市場的統(tǒng)一平臺,同時還可充分利用通用軟件開發(fā)來降低研發(fā)成本,加速產(chǎn)品上的市進程。
SMP 賦予應用與產(chǎn)品的優(yōu)勢
目前,制造商希望投資于一款能夠使其在不同級別產(chǎn)品中充分利用與擴展、并同時滿足未來需求的平臺。SMP 能夠以真正的性能可擴展性全面滿足這一需求。與只能提高單個內(nèi)核速度的前代解決方案不同,SMP 將為整個多內(nèi)核實現(xiàn)真正的可擴展性,為每一款產(chǎn)品實現(xiàn)性能與功耗的最佳組合。SMP 將允許制造商在統(tǒng)一的平臺上以更高的性能支持如上網(wǎng)本等未來產(chǎn)品。一旦 SMP 的軟件開發(fā)完成,設計人員便可根據(jù)未來需要添加多個處理器,而且這對軟件將保持透明。SMP 設計可為制造商滿足未來應用需求打下堅實的基礎。
SMP 軟件的影響
SMP 可為各個層面的軟件大幅提高性能。對于不支持 SMP 的軟件,我們可使用操作系統(tǒng)任務管理器在每個內(nèi)核上啟動進程來實現(xiàn)并行工作。并行進程執(zhí)行自然會提升性能,雖然其效率不如線程級處理那么高,但也不會對應用開發(fā)人員造成更多的設計麻煩。
圖 3:SMP 可在軟件的進程與線程層面上提高性能隨著移動設備性能的不斷提升,用戶應用的復雜性也在不斷增加,在此情況下,應用程序應更多地以并行方式進行編寫(如采用線程方式),因此,我們便可充分發(fā)揮 SMP 的真正優(yōu)勢與增益。線程構成進程,不必反復返回操作系統(tǒng)尋求資源。應用開發(fā)人員不但要采用并行方式進行軟件設計,而且還必須注意進程中線程的互動方式。 某些應用本身就是多線程的,從而使 SMP 能夠實現(xiàn)更高的性能,更快的響應時間以及更出色的整體用戶體驗。如 Google 的 Chrome 等 web 瀏覽器就采用了多線程技術,因此能夠與 SMP 技術實現(xiàn)高度互補。預計這些 PC web 瀏覽器所使用的這種技術也將用于移動領域。 Symbian 和 Linux 移動操作系統(tǒng)均全面支持 SMP。這種支持針對移動環(huán)境進行了專門優(yōu)化,將使所有處理器內(nèi)核的單一操作系統(tǒng)內(nèi)核映像以及調(diào)度器中的負載平衡能夠幫助確定在哪個內(nèi)核上運行哪個任務或線程。 在處理原有軟件時,我們必須注意正確的任務同步,以避免系統(tǒng)鎖死。在 SMP 系統(tǒng)中,操作系統(tǒng)可在安排低優(yōu)先級任務運行在一個不同內(nèi)核上的同時,讓一個具有較高優(yōu)先級的任務運行在另一個內(nèi)核上。如果軟件包含不明確的同步,則會產(chǎn)生導致鎖死情況的錯誤判斷。通過正確使用信號量、互斥量以及自旋鎖等軟件技術,SMP 內(nèi)核的編程軟件將可實現(xiàn) SMP 的全部優(yōu)勢。 SMP 系統(tǒng)上的開發(fā)與調(diào)試工具至關重要。設計人員需要進一步了解芯片情況才能緊跟軟件處理技術。在多個內(nèi)核上同時運行多個線程的情況下,功能強大的新型工具將可幫助制造商快速向市場推出令人驚奇的全新產(chǎn)品。[!--empirenews.page--]
SMP 的高級電源管理
SMP 提供的可擴展電源優(yōu)勢可用來擴展內(nèi)核頻率與工作內(nèi)核的數(shù)量。Cortex-A9 MPCore 能夠分別啟用與關閉不同的內(nèi)核。如果內(nèi)核處于開啟狀態(tài),則必須運行在相同的時鐘頻率下。因此,為了高效使用 SMP 內(nèi)核的電源管理,必須通過測試來確定以下兩種選項的性能與功耗基準:一、在關閉其它內(nèi)核的同時,以最高時鐘頻率在單個內(nèi)核上全速運行進程;二、多內(nèi)核同時運行進程,但運行的時鐘頻率降低。SMP 采用的其它電源管理技術還包括動態(tài)電壓與頻率縮放 (DVFS),可根據(jù)所需的性能來調(diào)節(jié)匹配系統(tǒng)的頻率與電壓。操作系統(tǒng)可實現(xiàn)負載平衡,這也有助于改善電源管理,并幫助設計人員針對功耗來優(yōu)化系統(tǒng)。TI OMAP 4 平臺是業(yè)界率先推出的、基于 ARM Cortex-A9 MPCore 的雙內(nèi)核架構之一。該架構與專業(yè)處理引擎進行了平衡,可實現(xiàn)無與倫比的移動多媒體性能。
圖 4:TI 全新 OMAP 4 平臺為移動設備帶來 SMPOMAP 4 平臺的主要特性包括:內(nèi)核 ARM Cortex-A9 MPCore SMP 通用處理器,可提高性能與效率;
IVA 3 硬件加速器,可實現(xiàn)真正的 1080p 多標準高清錄制與回放功能;
影像信號處理器 (ISP) 支持高質(zhì)量影像與視頻捕獲,可實現(xiàn)堪比 SLR 的數(shù)字高性能,捕獲 2000 萬像素的靜態(tài)影像;
Imagination Technologies POWERVR™ SGX540 3D 影像內(nèi)核支持 3D 用戶界面,可實現(xiàn)更大的顯示屏、逼真的圖像以及直觀易用的觸摸屏等應用;
音頻后端 (ABE) 處理器可為顯著降低功耗提供虛擬低功耗音頻芯片;
靈活的系統(tǒng)支持:
復合型 TV 輸出
HDMI v1.3 輸出可驅動高清顯示屏
色彩豐富的更大顯示屏支持
外設接口:MIPI 串行攝像機和串行顯示屏接口、MIPI® SLIMbusSM、MMC/SD、USB 2.0 移動高速、UART 以及 SPI 等
支持各大操作系統(tǒng):Linux(包括 Android 和 LiMo)、Microsoft Windows Mobile 和 Symbian;
45 納米移動工藝技術可提高性能與電源效率;
優(yōu)化的電源與音頻管理配套芯片:TWL6030 和 TWL6040
TI 是唯一一家可為 SMP 提供所有主要移動操作系統(tǒng)支持的公司,這些操作系統(tǒng)包括 Symbian、Linux 以及 Microsoft Windows Mobile 等。OMAP 4 平臺是移動產(chǎn)業(yè)有關 SMP 轉型的領先解決方案,其架構專為優(yōu)化 SMP 性能而精心設計。例如,我們在設計時對存儲器架構、高速緩存量以及存儲器接口等給予了充分的考慮,能夠以最低的延遲實現(xiàn)最佳性能。OMAP 4 配套提供的 TI 綜合軟件套件專為 SMP 編寫,可充分發(fā)揮 SMP 架構內(nèi)在的處理性能增強與省電優(yōu)勢。OMAP 4 平臺采用市場上最先進高效的電源管理技術,可進一步節(jié)省電源。該處理器充分利用 TI SmartReflex™ 2 的電源和性能管理技術,可提供各種智能、自適應性軟硬件技術,能夠根據(jù)器件工作情況、操作模式以及溫度等動態(tài)控制電壓、頻率與電源,具體包括:動態(tài)電壓與頻率縮放 (DVFS);
自適應電壓縮放 (AVS);
動態(tài)電源切換 (DPS);
靜態(tài)漏電管理 (SLM);
自適應體偏壓 (ABB);
針對速度較慢器件的順向偏壓 (FBB)
逆向偏壓 (RBB),可為速度較快的器件減少漏電
OMAP 4 平臺充分利用 TI 在移動設備領域的專業(yè)知識與豐富經(jīng)驗,可為當前及未來應用提供基于 SMP 的最新處理器解決方案。OMAP 4 SMP 的強大功能
OMAP 4 SMP 的強大功能
圖 5:OMAP 4 SMP 可實現(xiàn)類似 PC 的 Web 瀏覽體驗在第二個使用案例中,一位消費者正在使用手機欣賞 H.264 視頻。這種多媒體應用案例通常不適用于多線程處理技術,因此最好采用單內(nèi)核工作。在本例中,OMAP 4 將兩個內(nèi)核之中的一個關閉,并讓另一個內(nèi)核在更高頻率下工作,從而可提供出色的多媒體內(nèi)容。由于只有一個內(nèi)核工作,因而可降低功耗。
圖 6:OMAP 4 實現(xiàn)出色的多媒體內(nèi)容結論
SMP 對滿足新一代移動設備的高性能與低功耗需求將至關重要。SMP 具有可擴展的功率與性能,能夠為單內(nèi)核解決方案提供獨特的優(yōu)勢。未來應用將更多地使用多線程技術,這將推動 SMP 成為我們的首選平臺。TI 的 OMAP 4 平臺是率先提供 SMP 技術的產(chǎn)品,不但能夠實現(xiàn)可擴展的通用處理性能,同時還可提升多媒體處理領域(影像、圖像、音頻與視頻)的功能。我們必須注意,SMP 不會吸收這些多媒體領域的功能,這些多媒體領域需要可在最低功耗下實現(xiàn)最高性能的專門引擎。OMAP 4 可提供 SMP 的優(yōu)化組合,能夠與非對稱多處理技術 (AMP) 配合工作。TI OMAP 4 平臺是在移動設備中推進 SMP 技術的領先解決方案,可支持未來奇妙的應用。當前對 SMP 進行投資,將來就可實現(xiàn)無縫的軟件重復使用,OEM 廠商也可在各個層次的產(chǎn)品上實現(xiàn)其設計方案的擴展,并全面滿足未來的長遠需求。