計(jì)算機(jī)視覺(jué):通過(guò)壓縮技術(shù)減少 AI 推理所需的內(nèi)存大小
掃描二維碼
隨時(shí)隨地手機(jī)看文章
今天,我們將討論計(jì)算機(jī)視覺(jué)。我們將聽(tīng)到 Perceive 的首席執(zhí)行官 Steve Teig 談?wù)撍岢龅囊环N壓縮激活的方法,該方法可以減少 AI 推理所需的內(nèi)存大小。我們還將先睹為快,了解來(lái)自 GrAI Matter Labs 的新型神經(jīng)形態(tài)啟發(fā)式視覺(jué)芯片。
但首先:計(jì)算機(jī)視覺(jué)會(huì)再次自我改造嗎?我有幸聽(tīng)到了匹茲堡大學(xué)眼科教授、CMU 機(jī)器人研究所兼職教授 Ryad Benosman 教授。他也是我們今天所知的神經(jīng)形態(tài)視覺(jué)的創(chuàng)始人之一,即基于事件的視覺(jué)。
基于事件的視覺(jué)的想法是基于生物視覺(jué)系統(tǒng)的工作方式,檢測(cè)場(chǎng)景動(dòng)態(tài)的變化,而不是像主流的基于人工智能的計(jì)算機(jī)視覺(jué)系統(tǒng)那樣連續(xù)分析整個(gè)場(chǎng)景。Benosman 不想完全復(fù)制大腦或視網(wǎng)膜。“沒(méi)有必要在硅中制作神經(jīng)元的精確復(fù)制品,”他說(shuō)。當(dāng)然,部分問(wèn)題在于我們今天還沒(méi)有完全理解神經(jīng)元之間的所有信號(hào)。如果我們不了解大腦是如何工作的,我們?cè)趺茨軓?fù)制它呢?
Benosman 還認(rèn)為,如果我們沒(méi)有生物計(jì)算基礎(chǔ)來(lái)運(yùn)行大腦,那么復(fù)制大腦是沒(méi)有意義的。相反,我們所做的需要適應(yīng)硅的質(zhì)量。
當(dāng)基于事件的視覺(jué)是一個(gè)新想法時(shí),該領(lǐng)域的開(kāi)創(chuàng)性工作是如此新穎和與眾不同,以至于最初的論文被當(dāng)時(shí)領(lǐng)先的計(jì)算機(jī)視覺(jué)期刊拒絕,甚至沒(méi)有經(jīng)過(guò)審查。只是不相信計(jì)算機(jī)視覺(jué)可以在沒(méi)有全幀圖像的情況下工作。但是今天,有幾種基于事件的商業(yè)視覺(jué)傳感器可供包括 Prophecy 在內(nèi)的公司使用。但 Benosman 認(rèn)為在處理方面肯定有改進(jìn)的余地。
我們還將與神經(jīng)形態(tài)視覺(jué)領(lǐng)域的初創(chuàng)公司 GrAI Matter Labs 進(jìn)行了交談。該公司有效地從基于事件的愿景中借鑒了一些概念。他們不使用基于事件的傳感器;該芯片處理全幀圖像。但是,在處理階段應(yīng)用了查找事件的概念。他們更像是一種稀疏性。通過(guò)關(guān)注正在發(fā)生某些事情的視頻區(qū)域,它們可以使數(shù)據(jù)更稀疏,因此您可以更有效地處理它。如果你有合適的芯片,那就是。Grai Matter 當(dāng)然為此專門(mén)制造了一個(gè)芯片。
什么樣的應(yīng)用程序需要這個(gè)功能?有點(diǎn)基于事件,但不是基于事件。Grai Matter 正在將他們的技術(shù)應(yīng)用于最終產(chǎn)品供人類消費(fèi)的應(yīng)用。他們的芯片適用于媒體處理應(yīng)用程序,您可以在其中處理高質(zhì)量的視頻,并可能以某種方式使用人工智能來(lái)操縱視頻作為該過(guò)程的一部分。所以輸出也是高質(zhì)量的視頻,而不僅僅是用于做出決定的元數(shù)據(jù)或信息。
今天,世界上大多數(shù)人都關(guān)心理解音頻和視頻,并且您可以從中獲取元數(shù)據(jù)。所以沒(méi)有人真正關(guān)心原始提要發(fā)生了什么,不是真的。你可以做一些覆蓋,但這并不重要。因此,所有的架構(gòu)基本上都將盡可能多的 max 塞進(jìn)他們的架構(gòu)中,并且盡可能少地精確地獲取元數(shù)據(jù)。但這只是讓我們到目前為止。為您提供元數(shù)據(jù):框、動(dòng)作信號(hào)等等。我們希望為消費(fèi)者在家中和工作場(chǎng)所改變音頻和視頻體驗(yàn)。為了改造它,你需要一個(gè)不同的架構(gòu)。該架構(gòu)在延遲和質(zhì)量方面確實(shí)有很多不同的要求要滿足。指標(biāo)非常不同。
GrAI Matters 芯片的一個(gè)不同尋常的方面是它使用 16 位浮點(diǎn)精度。對(duì)于通常我們?cè)噲D盡可能降低精度的邊緣芯片來(lái)說(shuō),這是非常不尋常的。作為神經(jīng)形態(tài)提供商的關(guān)鍵方面之一是我們所有的 Mac 操作都是在 16 位浮點(diǎn)中完成的。與幾乎所有其他邊緣架構(gòu)相比,這有點(diǎn)獨(dú)特。正如你所看到的,很多人當(dāng)然會(huì)通過(guò)使用 8 位 int 來(lái)權(quán)衡功率和效率,對(duì)嗎?這基本上給你帶來(lái)了很多好處?,F(xiàn)在有了稀疏性和基于事件的處理,我們不得不進(jìn)行 16 位浮點(diǎn)運(yùn)算,因?yàn)槲覀円欉^(guò)去發(fā)生的事情。但我們基本上領(lǐng)先了,因?yàn)橛泻芏喾e極的東西可以得到,16 位浮點(diǎn)對(duì)我們來(lái)說(shuō)不是開(kāi)銷。事實(shí)上,它在實(shí)時(shí)處理方面的一些關(guān)鍵用例中為我們提供了相當(dāng)多的幫助。