AI芯片的幾種選擇,你更看好哪個(gè)?
根據(jù)行業(yè)的參考標(biāo)準(zhǔn),AI將是下一件大事,或?qū)⒃谙乱患笫轮邪l(fā)揮重要作用。這也就解釋了過(guò)去18個(gè)月里人工智能領(lǐng)域活動(dòng)的瘋狂。大公司支付數(shù)十億美元收購(gòu)創(chuàng)業(yè)公司,甚至投入更多的資金用于研發(fā)。此外,各國(guó)政府正在向大學(xué)和研究機(jī)構(gòu)投入數(shù)十億美元。全球競(jìng)賽正在進(jìn)行,目的是創(chuàng)建的最佳的架構(gòu)和系統(tǒng)來(lái)處理AI工作所必需的海量數(shù)據(jù)。
市場(chǎng)預(yù)測(cè)也相應(yīng)上升。 根據(jù)TracTIca研究所的數(shù)據(jù),到2025年,AI年收入預(yù)計(jì)將達(dá)到368億美元。TracTIca表示,迄今為止已經(jīng)確定了AI的27種不同的細(xì)分行業(yè)以及191個(gè)使用案例。
但隨著我們深入挖掘,很快就可以明顯地看到,并不存在一個(gè)的最好的方式來(lái)解決AI問(wèn)題。甚至對(duì)于AI是什么,或需要分析的數(shù)據(jù)類型,我們尚沒(méi)有一致的定義。
圖1 AI收入增長(zhǎng)預(yù)測(cè)。來(lái)源:TracTIca
OneSpin SoluTIons總裁兼首席執(zhí)行官Raik Brinkmann說(shuō),“在人工智能芯片中,你有三個(gè)問(wèn)題需要解決。首先,你需要處理大量的數(shù)據(jù)。其次,構(gòu)建用于并行處理的互連。第三是功率,這是你移動(dòng)數(shù)據(jù)量的直接結(jié)果。所以你亟須從馮諾依曼架構(gòu)轉(zhuǎn)變到數(shù)據(jù)流架構(gòu)。但它究竟是什么樣子?”
目前的答案很少,這就是為什么AI市場(chǎng)的第一顆芯片包括現(xiàn)成的CPU,GPU,F(xiàn)PGA和DSP的各種組合。雖然新設(shè)計(jì)正在由諸如英特爾、谷歌、英偉達(dá)、高通,以及IBM等公司開(kāi)發(fā),但目前還不清楚哪家的方法會(huì)勝出。似乎至少需要一個(gè)CPU來(lái)控制這些系統(tǒng),但是當(dāng)流數(shù)據(jù)并行化時(shí),就會(huì)需要各種類型的協(xié)處理器。
AI的許多數(shù)據(jù)處理涉及矩陣乘法和加法。大量并行工作的GPU提供了一種廉價(jià)的方法,但缺點(diǎn)是更高的功率。具有內(nèi)置DSP模塊和本地存儲(chǔ)器的FPGA更節(jié)能,但它們通常更昂貴。這也是軟件和硬件真正需要共同開(kāi)發(fā)的領(lǐng)域,但許多軟件遠(yuǎn)遠(yuǎn)落后于硬件。
Mentor Graphics董事長(zhǎng)兼首席執(zhí)行官Wally Rhines表示:“目前,研究和教育機(jī)構(gòu)有大量的活動(dòng)。有一場(chǎng)新的處理器開(kāi)發(fā)競(jìng)賽。也有標(biāo)準(zhǔn)的GPU用于深度學(xué)習(xí),同時(shí)還有很多人在從事CPU的工作。目標(biāo)是使神經(jīng)網(wǎng)絡(luò)的行為更像人腦,這將刺激一次全新的設(shè)計(jì)浪潮。”
當(dāng)視覺(jué)處理開(kāi)始涉及到AI時(shí),便受到了極大的關(guān)注,主要是因?yàn)樘厮估陬A(yù)計(jì)推出自動(dòng)駕駛汽車的15年前就已經(jīng)提出了自動(dòng)駕駛概念。這為視覺(jué)處理技術(shù),以及為處理由圖像傳感器、雷達(dá)和激光雷達(dá)收集的數(shù)據(jù)所需的芯片和整體系統(tǒng)架構(gòu)開(kāi)辟了巨大的市場(chǎng)。但許多經(jīng)濟(jì)學(xué)家和咨詢公司正尋求超越這個(gè)市場(chǎng),探討AI將如何影響整體生產(chǎn)力。Accenture最近的報(bào)道預(yù)測(cè),AI將使一些國(guó)家的GDP翻番(見(jiàn)下圖2)。雖然這將導(dǎo)致就業(yè)機(jī)會(huì)大幅減少,但整體收入的提高不容忽視。
Synopsys董事長(zhǎng)兼聯(lián)合首席執(zhí)行官Aart de Geus指出了電子學(xué)的三個(gè)浪潮——計(jì)算和網(wǎng)絡(luò)、移動(dòng)、數(shù)字智能。在后一種類型中,焦點(diǎn)從技術(shù)本身轉(zhuǎn)移到它可以為人們做什么。
“You’ll see processors with neural networking IP for facial recognition and vision processing in automobiles,” said de Geus. “Machine learning is the other side of this. There is a massive push for more capabilities, and the state of the art is doing this faster. This will drive development to 7nm and 5nm and beyond.”
de Geus說(shuō):“你將看到具有面部識(shí)別和汽車視覺(jué)處理的神經(jīng)網(wǎng)絡(luò)IP。機(jī)器學(xué)習(xí)是其另一面。它對(duì)于更多的能力會(huì)產(chǎn)生一種巨大的推動(dòng),目前的技術(shù)水平可以快速完成這些。這將推動(dòng)芯片發(fā)展到7nm、5nm,甚至更高的水平。”
目前的方法
自動(dòng)駕駛中的視覺(jué)處理在AI當(dāng)前研究中占主導(dǎo)地位,但該技術(shù)在無(wú)人機(jī)和機(jī)器人中的作用也越來(lái)越大。
Achronix公司總裁兼首席執(zhí)行官Robert Blake說(shuō):“對(duì)于圖像處理的AI應(yīng)用,計(jì)算復(fù)雜度很高。對(duì)于無(wú)線技術(shù),數(shù)學(xué)很好理解。對(duì)于圖像處理,數(shù)學(xué)就像西部拓荒,工作負(fù)載復(fù)雜多變。大概花費(fèi)5~10年時(shí)間才能解決市場(chǎng)問(wèn)題,但是它對(duì)于可編程邏輯肯定會(huì)有很大的作用,因?yàn)槲覀冃枰軌蛞愿叨炔⑿械姆绞酵瓿傻淖兙葦?shù)學(xué)。”
FPGA非常適合矩陣乘法。最重要的是,它的可編程性增加了一些必要的靈活性和面向未來(lái)的設(shè)計(jì),因?yàn)樵谶@一點(diǎn)上,不清楚所謂的智能將存在于一個(gè)設(shè)計(jì)的哪部分。用于做決策的數(shù)據(jù)一些將在本地處理,一些將在數(shù)據(jù)中心中處理。但在每個(gè)實(shí)現(xiàn)中,其百分比可能會(huì)改變。
這對(duì)AI芯片和軟件設(shè)計(jì)有很大的影響。雖然AI的大局并沒(méi)有太大的變化(大部分所謂的AI更接近于機(jī)器學(xué)習(xí),而非真正的AI),但是對(duì)于如何構(gòu)建這些系統(tǒng)的理解卻發(fā)生了重大的變化。
圖3:谷歌TPU開(kāi)發(fā)板 來(lái)源:谷歌
Arteris營(yíng)銷副總裁Kurt Shuler說(shuō):“對(duì)于自動(dòng)駕駛汽車,人們正在做的就是把現(xiàn)有的東西放在一起。為了使一個(gè)真正高效的嵌入式系統(tǒng)能夠?qū)W習(xí),它需要一個(gè)高效的硬件系統(tǒng)。我們采用了幾種不同的方法。如果你關(guān)注視覺(jué)處理,你要做的是試圖弄清楚器件看到的是什么,以及你如何推斷。這包括來(lái)自視覺(jué)傳感器、激光雷達(dá)和雷達(dá)的數(shù)據(jù),然后應(yīng)用專門(mén)的算法。這里的很多事情都是試圖模仿大腦中的事情,方法是利用深度卷積神經(jīng)網(wǎng)絡(luò)。”
它與真正的AI的不同之處是,現(xiàn)有技術(shù)水平能夠檢測(cè)和避開(kāi)物體,而真正的AI能夠擁有推理能力,例如如何通過(guò)一群人正在橫穿的街道,或判斷玩皮球的小孩子是否會(huì)跑到街道上。對(duì)于前者,判斷是基于各種傳感器的輸入,而傳感器的輸入是基于海量數(shù)據(jù)處理和預(yù)編程的行為。對(duì)于后者,機(jī)器能夠作出價(jià)值判斷,例如判斷轉(zhuǎn)彎避開(kāi)孩子可能會(huì)造成的很多結(jié)果,并做出最佳選擇。