拓展自研異構(gòu)計算矩陣,安謀科技發(fā)布車規(guī)嵌入式處理器“星辰”STAR-MC2和視頻處理器“玲瓏”V6/V8
構(gòu)建完整易用的異構(gòu)計算生態(tài),是安謀科技長期堅持的產(chǎn)品戰(zhàn)略。目前,安謀科技已經(jīng)推出了“周易”NPU、“星辰”CPU、“山?!盨PU及“玲瓏”ISP和VPU等產(chǎn)品,這些產(chǎn)品能夠與Arm IP高效協(xié)同,為客戶打造高效的整體化解決方案??梢哉f,安謀科技已經(jīng)組成了比Arm更為廣闊的產(chǎn)品矩陣。近日,安謀科技繼續(xù)深化產(chǎn)品布局,推出了“星辰”二代——STAR-MC2車規(guī)級嵌入式處理器和“玲瓏”V6/V8視頻處理器。
“星辰”STAR-MC2:車規(guī)級、高性能AI應(yīng)用
“星辰”STAR-MC1是面向物聯(lián)網(wǎng)應(yīng)用場景的輕量級低功耗嵌入式處理器,而最新推出的“星辰”STAR-MC2則是在第一代的基礎(chǔ)上,增加了產(chǎn)品單位計算密度,實現(xiàn)了最高車規(guī)級的可靠性。
“星辰”STAR-MC2基于Arm最新的v8.1-M架構(gòu)設(shè)計而來,在40nm工藝下主頻提升到了235MHz,STAR-MC2的標量處理能力增加了45%。通過v8.1-M架構(gòu)的Helium特性強化,其矢量處理性能提升了200%,單位能耗執(zhí)行效率相比第一代產(chǎn)品有了100%提升。因為STAR-MC2整個架構(gòu)體系跟Arm架構(gòu)體系一脈相承,所以Arm RAS 擴展、協(xié)處理器、可定制指令集、Trustzone等技術(shù)都從STAR-MC1繼承下來,同時進行了一定的增強。比如在信息安全方面,以前在處理器內(nèi)部Trustzone并沒有對例如FPU等模塊進行相應(yīng)的區(qū)分,而STAR-MC2對于Trustzone的劃分更為精細,從而效率上也有所增強。
基于上述種種技術(shù)創(chuàng)新,STAR-MC2帶來了幾大優(yōu)勢。首先STAR MC-2是第一款支持8-Bit計算的處理器,它的AI處理能力提升了9倍,因此更適用于一些輕量級的AI應(yīng)用計算場景。在安全方面,STAR-MC2支持Arm主推的PSA-Ready,與 “山?!苯鉀Q方案相配合,可以提供一個完整的物聯(lián)網(wǎng)安全解決方案。另一個關(guān)鍵的技術(shù)亮點在于,STAR-MC2支持最高級別的車規(guī)功能安全,安謀科技不僅僅給客戶提供包含RTL的傳統(tǒng)處理器IP,也會為給客戶提供一個包含所有必要數(shù)據(jù)的功能安全包,以確??蛻艨蓾M足最高車規(guī)級新品的功能安全要求。
安謀科技處理器產(chǎn)品總監(jiān)陳江杉表示,滿足車規(guī)對嵌入式處理器最大的難點是需要準備掌握下游客戶需求,所謂的knowhow。車規(guī)的設(shè)計不僅僅是在具體的硬件和軟件機制上要有所考慮,同時它還是一個流程設(shè)計,需要建立完整的需求管理、設(shè)計流程及相應(yīng)規(guī)范。新推出的“星辰”STAR-MC2,是安謀科技的第一款最高車規(guī)級的IP產(chǎn)品,未來在其產(chǎn)品路線圖上還會有更多的車規(guī)級產(chǎn)品逐漸推出來。
“玲瓏”V6/V8:多核架構(gòu)、多格式、靈活可伸縮
視頻數(shù)據(jù)在業(yè)務(wù)數(shù)據(jù)中的占比高達80%,由于數(shù)據(jù)量較大,因此在存儲和傳輸?shù)母鱾€節(jié)點上都需要相應(yīng)的視頻處理器來對視覺數(shù)據(jù)進行壓縮;因為視頻應(yīng)用場景的千差萬別,對于處理器的能力要求也有所不同。
“玲瓏”V6/V8采用多核心架構(gòu)、支持多格式的編解碼、提供靈活可伸縮的視頻處理方案。在繼續(xù)保持原有技術(shù)優(yōu)勢的基礎(chǔ)上,“玲瓏”V6/V8新增了對于AV1的解碼支持,并且大幅提高了H.264的編碼質(zhì)量,依靠小面積多格式的支持,做到了業(yè)內(nèi)領(lǐng)先。
在架構(gòu)層面,“玲瓏”V6/V8采用的是一個三層堆棧形式。
底層是一個靈活的硬件支撐,可通過多核伸縮性支持不同分辨率和性能的需求。每個核里有硬件加速模塊以及單獨的硬件控制器來對相應(yīng)的加速模塊進行控制,功能靈活性也得到提升。
Firmware層主要進行的是功能擴展以及針對不同應(yīng)用場景的優(yōu)化。針對不同應(yīng)用場景進行相應(yīng)優(yōu)化,在不同應(yīng)用場景下分別具有不同的碼率降低,保證在更低的帶寬需求下進行高質(zhì)量的視頻傳輸?!傲岘嚒盫6/V8與主CPU有靈活的控制接口,可進行靈活擴展。display frame reordering的實現(xiàn),減少了VPU對主CPU的負載需求,并實現(xiàn)了自主的碼率控制算法以及相應(yīng)處理。
軟件層面,主要是主CPU(Host CPU)的處理器控制以及相應(yīng)的memory的管理和調(diào)度,安謀科技已完整實現(xiàn)了安卓和Linux的驅(qū)動以及上層一些應(yīng)用框架支持,可以滿足各種消費類產(chǎn)品、云端以及嵌入式場景的需求。
“玲瓏”V6面向主流的4K及以下級別視頻處理需求,單核性能和之前相比提升2倍,可滿足高幀率的需求,可達到如4K@120幀的解碼能力?!傲岘嚒盫8主要針對高端的8K級別的產(chǎn)品,最高可達8K@120幀的解碼能力。其最大分辨率是“玲瓏”V6的4倍,其伸縮能力是4到8核,所以整體性能相比“玲瓏”V6大幅提升,在單實例VPU的場景可以支持更多路視頻信號處理。
據(jù)安謀科技多媒體產(chǎn)品經(jīng)理董峰介紹,“玲瓏”V6/V8相比前代產(chǎn)品更適合AI的相關(guān)應(yīng)用。
“通常AI處理場景的數(shù)據(jù)都是RGB模式,壓縮視頻相應(yīng)的視頻流通常都是YUV這種模式,對整個AI 推理場景首先要進行視頻解碼和相應(yīng)的AI處理,如果中間再增加一個格式轉(zhuǎn)換處理的話,那就是有一個YUV到RGB的相應(yīng)的處理,這對帶寬需求是比較大的。像1080P這種原始數(shù)據(jù),以200萬為例,YUV是3MB的數(shù)據(jù)量,RGB是6MB這樣一個數(shù)據(jù)量,作為一個從YUV到RGB的處理,相應(yīng)的帶寬很明顯是3M加6M,帶寬對單路來說還是可以接受的,但云端的各種場景通常是非常多路的應(yīng)用。”
而“玲瓏”V6/V8內(nèi)集成了YUV2RGB的后處理,一次性地解碼直接輸出RGB數(shù)據(jù),可以支持單package格式和多分channel的格式。通過YUV2RGB的后處理,可以在AI場景下減少內(nèi)存的一次讀寫,整體上實現(xiàn)30%的帶寬減少。在全1080P場景下,可以減少系統(tǒng)功耗,大幅度提升SoC級的整體性能。
立足全球生態(tài),提供本土創(chuàng)新
安謀科技對于Arm、對于中國乃至全球都是一個非常特殊的存在。一方面,安謀科技將Arm這一全球最大計算平臺生態(tài)的先進架構(gòu)技術(shù)引入到了中國,另一方面,幫助中國的客戶和產(chǎn)業(yè)合作伙伴融入到了全球市場。
安謀科技產(chǎn)品研發(fā)負責人劉澍表示,安謀科技所有的研發(fā)人員都在中國,安謀科技也始終立足于國內(nèi)產(chǎn)業(yè)需求——無論是目前所看到的自主創(chuàng)新的需求,還是新應(yīng)用、新行業(yè)涌現(xiàn)出來的需求。安謀科技廣泛收集了國內(nèi)客戶的這些需求,并據(jù)此來定義產(chǎn)品路線圖,同時進行高質(zhì)量的交付。
在近期安謀科技管理層調(diào)整之后,公司整體運營和業(yè)務(wù)運作均未發(fā)生變化:整個公司的獨立性不變、戰(zhàn)略不變、對員工的承諾不變、以及基本的組織架構(gòu)框架不變。展望未來,安謀科技與Arm會有更多業(yè)務(wù)合作推進到具體實施和落地的層面。其中包括研發(fā)技術(shù)的合作、產(chǎn)品路線圖合作、方法學和解決方案合作、業(yè)務(wù)的合作以及生態(tài)上的共同開發(fā)等。劉澍表示,未來不管是安謀科技的自研業(yè)務(wù)還是Arm的IP業(yè)務(wù)都會有更好的發(fā)展。
總結(jié)
未來安謀科技將會沿著兩條業(yè)務(wù)路線繼續(xù)邁進,一方面繼續(xù)推進全面、易用的自研異構(gòu)計算產(chǎn)品矩陣,據(jù)悉將會在今年晚些或年底有更多的自研產(chǎn)品發(fā)布。另一方面大力地發(fā)展Arm的IP業(yè)務(wù)。為產(chǎn)業(yè)客戶提供優(yōu)質(zhì)的產(chǎn)品和服務(wù)。
最新推出的自研“星辰”STAR-MC2和“玲瓏”V6/V8,作為其異構(gòu)計算矩陣中的深化產(chǎn)品,相信也會在中國乃至全球客戶應(yīng)用中迎來全面花開。