安防芯片的發(fā)展 加強(qiáng)算力的同時(shí)也要突破瓶頸
芯片是“硬”的,算法是“軟”的,如何能將兩者更好的結(jié)合起來(lái),這就需要加強(qiáng)芯片對(duì)底層運(yùn)算加速算法的適應(yīng)性。
一、AI芯片的數(shù)據(jù)存儲(chǔ)問(wèn)題及瓶頸
在提高AI安防芯片性能,加強(qiáng)算力的同時(shí),芯片中關(guān)鍵的其實(shí)并不是單純提升算力,如果不進(jìn)行存儲(chǔ)優(yōu)化,那么芯片實(shí)際提供的計(jì)算力會(huì)大大降低。這也是制約AI安防芯片規(guī)?;瘧?yīng)用的問(wèn)題之一。要突破AI芯片的瓶頸,并不能只是簡(jiǎn)單的增加計(jì)算算力,而是一定要把數(shù)據(jù)存儲(chǔ)管理做好。
傳統(tǒng)芯片中,采用的是馮·諾伊曼架構(gòu),計(jì)算模塊和存儲(chǔ)單元是分開(kāi)的,“內(nèi)存墻”問(wèn)題很?chē)?yán)重。而AI依賴(lài)的算法是一個(gè)龐大和復(fù)雜的網(wǎng)絡(luò),有很多參數(shù)要存儲(chǔ),也需要完成大量的計(jì)算,需要巨大存儲(chǔ)容量,高帶寬、低延時(shí)的訪存能力。很多AI初創(chuàng)芯片公司,實(shí)際上都在努力解決這個(gè)問(wèn)題。
而我們的思考是,不能采取通常的先有計(jì)算指令然后提供數(shù)據(jù)的方式,應(yīng)該從存儲(chǔ)子系統(tǒng)的優(yōu)化入手,讓數(shù)據(jù)在存儲(chǔ)之間的搬移過(guò)程之中完成計(jì)算。
這也可以叫做“基于memory的計(jì)算”,而不是“基于計(jì)算的memory”。
當(dāng)前芯片領(lǐng)域?qū)τ贏I算法的關(guān)注還較多,針對(duì)AI的結(jié)構(gòu)改進(jìn)嘗試還比較少。之后,memory與computing結(jié)合的嘗試,我相信會(huì)是一個(gè)好的方向。
二、安防芯片同質(zhì)化問(wèn)題嚴(yán)重
對(duì)于AI安防芯片來(lái)說(shuō),“芯片+算法”的整合是重要的。而對(duì)于具體一款芯片,主要的指標(biāo)應(yīng)該是價(jià)格和穩(wěn)定性。芯片是“硬”的,算法是“軟”的,如何能將兩者更好的結(jié)合起來(lái),這就需要加強(qiáng)芯片對(duì)底層運(yùn)算加速算法的適應(yīng)性?,F(xiàn)有芯片的問(wèn)題,從技術(shù)角度來(lái)說(shuō),對(duì)前端的AI芯片算力的要求,對(duì)存儲(chǔ)問(wèn)題的解決,都很重要,都需要靠算法和芯片架構(gòu)一起來(lái)改善,比如說(shuō)現(xiàn)在的算法就還比較耗帶寬。再具體應(yīng)用上,AI安防芯片在安防攝像頭中作為協(xié)處理器,目前已經(jīng)被主控芯片集成了,所以單純提供AI加速器并不占優(yōu)勢(shì)。而開(kāi)發(fā)編解碼能力、加密及AI能力三合一的芯片,為攝像頭提供安全加密則是重點(diǎn)所在。這也是安防相對(duì)于其他芯片廠商不同的一點(diǎn)。從行業(yè)角度來(lái)說(shuō),現(xiàn)有AI芯片在安防行業(yè)應(yīng)用落地上的主要問(wèn)題,其實(shí)是同質(zhì)化。很多AI芯片廠商產(chǎn)出的芯片并沒(méi)有太大差別,一方面很多芯片達(dá)不到現(xiàn)有安防行業(yè)對(duì)前端AI芯片的要求,一方面又容易陷入芯片同質(zhì)化競(jìng)爭(zhēng)?,F(xiàn)在的安防芯片格局下,其實(shí)已經(jīng)存在壟斷的生態(tài),有大的行業(yè)玩家存在,那么做AI安防芯片如何找到自己的價(jià)值點(diǎn),并做到差異化還是很難的。
三、芯片成本問(wèn)題有待突破
在智能安防監(jiān)控領(lǐng)域,芯片是硬件設(shè)備中成本占比較高的零組件之一,也是安防視頻監(jiān)控設(shè)備的核心部件,通過(guò)前端攝像機(jī)內(nèi)置人工智能芯片,可實(shí)時(shí)分析視頻內(nèi)容,檢測(cè)對(duì)象,識(shí)別人、車(chē)屬性信息,并通過(guò)網(wǎng)絡(luò)傳遞到后端人工智能的中心數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)。
目前,安防視頻設(shè)備中所需要的處理器芯片主要包括網(wǎng)絡(luò)攝像機(jī)中的SoC芯片、后端DVR/NVR中的SoC芯片以及深度學(xué)習(xí)算法、加速器芯片以及前端模擬攝像機(jī)中的ISP芯片四種類(lèi)型。目前,高性能的深度學(xué)習(xí)算法加速器芯片仍由國(guó)外芯片廠商提供,但其余三類(lèi)處理器芯片已實(shí)現(xiàn)了較大程度的國(guó)產(chǎn)化替代。安防領(lǐng)域主流的深度學(xué)習(xí)芯片方案是GPU,但GPU存在成本、效率、功耗等瓶頸。
當(dāng)前在安防智能化進(jìn)程中,算法層面已經(jīng)接近成熟,而在芯片成本上還存在一些問(wèn)題。為了實(shí)現(xiàn)智能化的功能(即運(yùn)行深度學(xué)習(xí)算法),安防監(jiān)控系統(tǒng)的前端和后端設(shè)備中需要加入英偉達(dá)或是英特爾等國(guó)際大廠所設(shè)計(jì)的GPU、FPGA或者ASIC加速芯片,與原有的承擔(dān)圖像處理和編解碼功能的主處理器芯片一起構(gòu)成雙芯片方案,而采用這些芯片一般要為安防監(jiān)控設(shè)備新增高額成本(2017年僅前端攝像機(jī)中采用的AI加速器芯片的成本就高達(dá)上百美元),因此導(dǎo)致智能化設(shè)備的成本普遍偏高,在很大程度上影響了智能化的大面積應(yīng)用。
四、AI芯片的易用性有待提升
現(xiàn)在的安防市場(chǎng)上,已經(jīng)出現(xiàn)了很多前端的AI加速器,但實(shí)際它們?cè)趹?yīng)用上,還存在一些問(wèn)題。
第一是價(jià)格太高。第二是可編程性不足。原先的通用芯片CPU很容易能實(shí)現(xiàn)編程,但AI加速模塊中并沒(méi)有指令集,無(wú)法編程,需要手工去調(diào)整。
在安防領(lǐng)域也是一樣,廠商普遍反映的,不是AI芯片的性能,而是無(wú)論AI初創(chuàng)企業(yè),還是傳統(tǒng)大廠設(shè)計(jì)的加速器都很復(fù)雜,AI加速器很難被用起來(lái)。
一般來(lái)說(shuō),通用芯片難以負(fù)荷對(duì)計(jì)算的高要求,AI專(zhuān)用芯片則在可編程性、靈活性上有所欠缺。目前應(yīng)用較多的集成度高的Soc,將不同計(jì)算架構(gòu)芯片集成在一起,需要多套編程程序,運(yùn)行就容易帶來(lái)問(wèn)題。這也是安防芯片廠商們,尤其是在安防前端應(yīng)用上面臨的難題。
而業(yè)內(nèi)目前看好的一種方式,就是將不同的芯片架構(gòu)結(jié)合在一起,這就是“異構(gòu)計(jì)算”。
異構(gòu)計(jì)算的長(zhǎng)處在于,能實(shí)現(xiàn)比較好的適應(yīng)性和靈活性,在通用性和專(zhuān)用性上達(dá)成一個(gè)折衷。既能高效的處理數(shù)據(jù),又能相對(duì)保證算法的及時(shí)更新和迭代。這也是我們?cè)谔剿鞯囊粋€(gè)方向。
現(xiàn)在在安防、自動(dòng)駕駛等這些邊緣端的市場(chǎng),對(duì)芯片的綜合要求非常高。芯片需要處理的數(shù)據(jù)量很大,同時(shí)對(duì)于性能、性?xún)r(jià)比、性能功耗比要求也很高。