在AI性能上,驍龍855秒殺麒麟980?未必是這樣!
前段時(shí)間的高通發(fā)布會(huì)上,有關(guān)驍龍855 AI性能達(dá)到友商競(jìng)品兩倍的言論可謂是賺足了眼球。高通指出,驍龍855針對(duì)CPU、GPU、DSP都進(jìn)行了AI計(jì)算優(yōu)化,結(jié)合第四代AI引擎可以實(shí)現(xiàn)每秒超過(guò)7萬(wàn)億次運(yùn)算(7 TOPs)的AI算力。
高通在發(fā)布會(huì)上指的“友商”,特意點(diǎn)名是安卓平臺(tái)另一款使用7nm工藝的處理器,目前三星最新的處理器Exynos 9820是基于8nm工藝打造,蘋果A12芯片雖然使用了7nm工藝,但平臺(tái)不同很難比較。言下之意,這里的“友商”很明顯就是指的華為的最新處理器麒麟980。
說(shuō)到手機(jī)芯片的AI性能,麒麟980主要依靠獨(dú)立內(nèi)置的NPU來(lái)支撐,這顆NPU就是AI芯片創(chuàng)企寒武紀(jì)開(kāi)發(fā)的1H處理器。而就在12月13日于清華大學(xué)舉辦的嵌入式人工智能大會(huì)上,寒武紀(jì)創(chuàng)始人兼CEO陳天石在演講中提到:“前段時(shí)間高通發(fā)布驍龍855時(shí)宣稱,其AI性能是友商競(jìng)品的2倍,我不知道這是不是在指我們,如果是,我不認(rèn)為1H的AI性能會(huì)落后于驍龍855?!标愄焓€表示,“在我們內(nèi)部測(cè)試中,1H的測(cè)試結(jié)果非常優(yōu)秀,測(cè)試峰值非常的高。如果高通有信心地話不妨公布測(cè)試結(jié)果,比一個(gè)高下?!?/p>
顯然,火藥味很濃。
難道,沒(méi)有搭載獨(dú)立的NPU內(nèi)核的驍龍855真的比搭載寒武紀(jì)1H處理器的麒麟980芯片在AI性能上強(qiáng)兩倍嗎?最近,這一話題在知乎上也得到了一些從業(yè)者的關(guān)注和討論。智能菌整理如下:
知乎作者麥克阿攝認(rèn)為:從7萬(wàn)億這個(gè)數(shù)字來(lái)看,驍龍855是橫掃蘋果的A12和華為麒麟980的(根據(jù)970的數(shù)據(jù),算上980的增幅,可得麒麟980的算力為4.2TOPs)。
但從AIMark平臺(tái)上的跑分成績(jī)來(lái)看,高通855平臺(tái)獲得2.2萬(wàn)分,和麒麟980的得分2.15萬(wàn)分相差不大,這又是怎么一回事呢?
圖片來(lái)自知乎用戶“麥克阿”
原來(lái),高通得出這個(gè)所謂的7 TOPS算力,是基于CPU+GPU+DSP這三部分的總計(jì)所得。但不管是華為還是蘋果,給出的AI算力數(shù)據(jù)都是來(lái)源于其單獨(dú)的NPU。
需要科普的是,CPU非常適合邏輯運(yùn)算和整數(shù)運(yùn)算,也可以進(jìn)行浮點(diǎn)運(yùn)算,但其效率低并且功耗高。隨著技術(shù)和應(yīng)用的發(fā)展,單單CPU已經(jīng)難以滿足是來(lái)自圖形渲染的需求了,于是專門進(jìn)行浮點(diǎn)運(yùn)算的GPU應(yīng)運(yùn)而生,它大大提升了浮點(diǎn)運(yùn)算的效率,降低了功耗。而AI主要是做卷積運(yùn)算,需要超大量的浮點(diǎn)運(yùn)算來(lái)支撐,但這里的浮點(diǎn)運(yùn)算并不需要GPU提供那么高的精度,只需要更低精度的浮點(diǎn)運(yùn)算就完全勝任,而這正是NPU所最擅長(zhǎng)的領(lǐng)域。另外,高通的發(fā)布會(huì)中也特別強(qiáng)調(diào)了DSP的設(shè)計(jì),但這畢竟也不是什么新概念。從硬件角度來(lái)說(shuō),可能有所提升,但也絕不具備NPU在AI計(jì)算上的專業(yè)和高效率。
知乎用戶養(yǎng)貓的哈士奇認(rèn)為:衡量AI性能沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),有很多都指標(biāo),有的跑卷積、有的跑池化、有的跑浮點(diǎn)、還有跑挖礦的,這里的指標(biāo)最重要的應(yīng)該是卷積。
本著“大膽假設(shè),小心求證”的思路,拜托一位搞AI研發(fā)的朋友跑了一下卷積運(yùn)算。測(cè)試機(jī)型是搭載驍龍845的小米MIX 2S和搭載A12芯片的iPhone XS。如果按照高通的說(shuō)法,驍龍855的AI性能是845的三倍。
結(jié)果顯示,在基于AI神經(jīng)網(wǎng)絡(luò)實(shí)測(cè)的場(chǎng)景下,搭載驍龍845的小米MIX 2S測(cè)試數(shù)據(jù)為10.39,而搭載蘋果A12芯片的iPhone XS測(cè)試數(shù)據(jù)為72.64,測(cè)試數(shù)據(jù)越高代表AI性能越強(qiáng)。如果驍龍855的AI性能是845的三倍,那么測(cè)試數(shù)據(jù)應(yīng)該是31.17,這一數(shù)字遠(yuǎn)低于A12的72.64,但是蘋果A12芯片對(duì)外公布的AI算力只有5 TOPS。是不是很奇怪?
圖片來(lái)自知乎用戶“養(yǎng)貓的哈士奇”
那么,高通驍龍855所公布的7 TOPS是怎么得來(lái)的?
驍龍855公布的AI性能是通過(guò)CPU+GPU+DSP的方式來(lái)實(shí)現(xiàn)的,如果是這樣這個(gè)數(shù)字基本沒(méi)意義。因?yàn)樵谝苿?dòng)端能耗比是非常重要的指標(biāo),更何況CPU、GPU、DSP還有其它任務(wù)不能全力投入AI運(yùn)算,高通驍龍855的在AI運(yùn)算上的能耗比太低了。
以上知乎作者都認(rèn)為,高通宣稱的驍龍855可以達(dá)到7 TOPS 算力完全是用來(lái)吹牛逼的。
但從另外一個(gè)角度看,不管是華為麒麟980還是高通驍龍855,以現(xiàn)有的應(yīng)用來(lái)看,其AI性能都是大量過(guò)剩的。因?yàn)槭謾C(jī)中所謂的AI只是一個(gè)執(zhí)行加速器,并不會(huì)用來(lái)進(jìn)行訓(xùn)練,現(xiàn)在的性能根本用不完,很多廠家在這方面都制造了足夠的噱頭。