多核技術(shù)瞄準(zhǔn)新興應(yīng)用,差異化戰(zhàn)略漸成共識
為加快上市時間并同時實現(xiàn)產(chǎn)品差異化,使用業(yè)界標(biāo)準(zhǔn)內(nèi)核來開發(fā)SoC不失為一種明智的選擇。但隨著消費(fèi)電子、人機(jī)界面、數(shù)字多媒體等新興應(yīng)用的涌現(xiàn),業(yè)界對多核技術(shù)的期望值也在節(jié)節(jié)攀升。而在嵌入式領(lǐng)域,不斷提高處理器主頻的做法已經(jīng)不能滿足不斷增加的性能要求,而且勢必造成功耗的增加。由于嵌入式系統(tǒng)的成本/功耗限制比PC更為嚴(yán)格,這就使得多核在嵌入式SoC領(lǐng)域有了充分的用武之地。
NXP Cortex-M4/M0雙核微控制器
多核方案一般包括對稱多處理(Symmetrical Multi-Processing)、非對稱多處理(Asymmetric Multi-Processing)和混合多處理(Bound Multi-Processing)三種。日前,恩智浦半導(dǎo)體(NXP)就宣布推出全球首款采用ARM Cortex-M4和Cortex-M0雙核架構(gòu)的非對稱數(shù)字信號控制器LPC4000系列。“這種組合方式開創(chuàng)了業(yè)界ARM Cortex構(gòu)架處理器研發(fā)的先河?!痹摴靖笨偛敏呷蛭⒖刂破鳟a(chǎn)品線總經(jīng)理Geoff Lees表示,“我們將工程師最需要的處理器單元進(jìn)行了整合,而且不需要他們編寫額外的算法來分配核與核之間的運(yùn)算關(guān)系。這對于那些糾結(jié)于到底是采用一個還是兩個Cortex-M4進(jìn)行設(shè)計的工程師來說,非對稱構(gòu)架是最好的選擇。”
作為提供全系列ARM內(nèi)核微控制器產(chǎn)品廠商,32位ARM MCU毫無疑問將承擔(dān)更多為NXP攻城拔寨的重任。來自NXP方面的消息稱,在LPC4000系列中,M4作為主處理器融合了微控制器基本功能,如集成的中斷控制器、低功耗模式、低成本調(diào)試和易用性,以及高性能數(shù)字信號處理功能,包括單周期MAC、單指令多數(shù)據(jù)(SIMD)技術(shù)、飽和算法、浮點(diǎn)運(yùn)算單元。而M0則作為協(xié)處理器,用來分擔(dān)Cortex-M4處理器大量數(shù)據(jù)移動和I/O處理任務(wù),減小Cortex-M4帶寬占用,使得后者可以全力處理數(shù)字信號控制應(yīng)用中的數(shù)字計算。
“非對稱雙核架構(gòu)降低了功耗、成本和系統(tǒng)復(fù)雜性,為開發(fā)人員提供了單一芯片解決方案,讓軟件分配變得更簡單?!盙eoff進(jìn)一步解釋說,“目前我們推出的產(chǎn)品只是M4+一個M0構(gòu)架,未來隨著用戶需求的逐步增加,我們還有可能繼續(xù)增加作為協(xié)處理器的M0數(shù)量,變成一個M4 + N個M0的結(jié)構(gòu)?!?/FONT>
Geoff還特別強(qiáng)調(diào)了LPC4000系列獨(dú)有的可配置外設(shè)功能,包括可配置狀態(tài)機(jī)定時器、SPI閃存接口和串行GPIO接口。其中可配置狀態(tài)機(jī)定時器由狀態(tài)機(jī)和定時器陣列構(gòu)成,可實現(xiàn)多種復(fù)雜功能,包括事件控制的PWM波形生成、ADC同步和死區(qū)控制;SPI閃存接口能夠為絕大部分SPI和quad-SPI閃存制造商提供無縫高速的存儲器映射連接方法;而首次采用的串行GPIO接口則允許開發(fā)人員連接任何非標(biāo)準(zhǔn)串行接口以及多種標(biāo)準(zhǔn)仿真串行接口,比如:I2S、TDM多通道音頻、I2C等接口。該系列部分產(chǎn)品的其他外設(shè)包括2個HS USB控制器、片內(nèi)HS PHY、支持硬件TCP/IP校驗的10/100T以太網(wǎng)控制器和高分辨率彩色LCD控制器。
此外,LPC4000系列還采用了優(yōu)化的256位寬度閃存架構(gòu),具備264 KB SRAM以及雙塊存儲器架構(gòu),可支持1MB閃存安全編程和存儲器分區(qū)。同時,LPC4000系列的標(biāo)準(zhǔn)特性還包括含有啟動代碼和片內(nèi)軟件驅(qū)動的32 KB ROM、AES-128解密、8通道通用DMA控制器,2個具有最高采樣率為400k/s的10位ADC/DAC、馬達(dá)控制PWM和正交編碼器接口、4個UART、2個Fast-mode Plus I2C、I2S、2個SSP/SPI、智能卡接口、4個定時器、窗口看門狗定時器、報警定時器、具有256字節(jié)電池供電備份寄存器的超低功耗RTC以及最多146個通用I/O引腳。
至于為何選擇推出雙ARM內(nèi)核構(gòu)架,Geoff認(rèn)為,DSP+ARM構(gòu)架的產(chǎn)品主要面向中高端應(yīng)用,而NXP則希望通過Cortex-M4 + Cortex-M0的雙核架構(gòu)打開馬達(dá)控制,工業(yè)自動化,汽車配件以及嵌入式音頻等領(lǐng)域。
LPC4000系列結(jié)構(gòu)框圖
TI DSP/ARM Integra處理器
與NXP LPC4000系列的市場訴求不同,TI日前針對工業(yè)控制、航空電子、視覺應(yīng)用和高端測量測試等需要較強(qiáng)運(yùn)算和信號處理能力的領(lǐng)域,推出了集成DSP+ARM架構(gòu)的Integra系列處理器C6A816x。
“有很多算法在DSP平臺可以實現(xiàn),在ARM上也可以;但有些特定的算法,如數(shù)據(jù)濾波、圖像處理等放在DSP上運(yùn)行的效率會高很多,可能達(dá)到60%以上”,TI數(shù)字信號處理系統(tǒng)業(yè)務(wù)拓展經(jīng)理程自清表示,“在某些高端的應(yīng)用場合,ARM+DSP會起到事半功倍的效果?!本科湓?,因為DSP可專門用于處理密集型信號處理需求、復(fù)雜的數(shù)學(xué)函數(shù)以及影像處理算法,而 ARM 則可用于實現(xiàn)圖形用戶界面(GUI)、網(wǎng)絡(luò)連接、系統(tǒng)控制以及多種操作系統(tǒng)下的應(yīng)用處理。另外,ARM資源可以空出來做更多的應(yīng)用,總體性能會大大提高。
C6A816x處理器在同一芯片上集成了1.5GHz TMS320C674x 浮點(diǎn)與定點(diǎn)DSP和ARM Cortex-A8處理器,此外還集成了針對各種應(yīng)用而優(yōu)化的數(shù)種高帶寬外設(shè),包括 PCIExpress Gen2、SATA 2.0、雙千兆位以太網(wǎng)和雙DDR2/DDR3 接口。另一方面,該系列處理器還配備了片上顯示引擎,能夠為2個同時工作的高清顯示屏輸出兩組不同的內(nèi)容流?!斑@對于高端機(jī)器視覺系統(tǒng)等應(yīng)用而言非常重要,其中一個顯示屏可提供觸摸屏鍵盤功能,而另一個顯示屏則能顯示機(jī)器性能及視覺分析結(jié)果?!背套郧逖a(bǔ)充說。同時,C6A8168處理器還專門集成了3D圖形加速器,可實現(xiàn)更高級、更豐富的精彩GUI體驗。[!--empirenews.page--]
在接受媒體采訪時,程自清以機(jī)器視覺產(chǎn)品為例,詳細(xì)介紹了基于C6A8167的方案是如何幫助客戶簡化設(shè)計,并提高可靠性的。在以往此類產(chǎn)品的系統(tǒng)設(shè)計中,工程師往往需要FPGA進(jìn)行算法和數(shù)據(jù)整理,同時利用DDR做影像視覺處理和特征提取的算法,另外還需要uProcessor做系統(tǒng)管理和通訊等,特別是在一些高端的顯示中,總體成本非常高。而采用C6A816x產(chǎn)品,首先接口可以全部集成在其中,同時又集成了定點(diǎn)、浮點(diǎn)DSP和高性能ARM,據(jù)稱此舉可節(jié)約超過50%的成本。
C6A816x產(chǎn)品圖