AI芯片公司的數(shù)據(jù)中心、端點(diǎn)或AIoT設(shè)備
掃描二維碼
隨時(shí)隨地手機(jī)看文章
目前世界各地涌現(xiàn)出許多初創(chuàng)公司,它們對(duì)如何更好的地實(shí)現(xiàn)AI提出了新的想法。小編下面給大家說說目前的幾家大的AI芯片公司的終端應(yīng)用。
數(shù)據(jù)中心的人工智能
根據(jù)位置不同,數(shù)據(jù)中心可以算作“邊緣”。邊緣計(jì)算的關(guān)鍵概念是在(或接近)生成或收集數(shù)據(jù)的相同地理位置處理數(shù)據(jù)。這包括網(wǎng)關(guān)或集線器設(shè)備,也包括加速公司單一人工智能應(yīng)用程序的內(nèi)部服務(wù)器。想想醫(yī)院或醫(yī)學(xué)研究機(jī)構(gòu)中加速x射線或CT掃描圖像分類的服務(wù)器,以及從工廠接收狀態(tài)數(shù)據(jù)并在現(xiàn)場處理的網(wǎng)關(guān)。
Graphcore
總部位于英國布里斯托爾的Graphcore公司在早期的一輪融資中獲得了超過10億美元的估值,成為首家被認(rèn)定為獨(dú)角獸的西方半導(dǎo)體初創(chuàng)公司。
Graphcore的IPU(智能處理單元)芯片擁有超過1200個(gè)專業(yè)核心的大規(guī)模并行架構(gòu),每個(gè)核心可以運(yùn)行6個(gè)程序線程。還有大量的片上內(nèi)存,幾百M(fèi)B的RAM,更重要的是,還有45 tb的內(nèi)存帶寬。這使得整個(gè)機(jī)器學(xué)習(xí)模型可以存儲(chǔ)在芯片上。
Graphcore的IPU芯片可以在戴爾服務(wù)器上用于邊緣計(jì)算應(yīng)用程序。
Groq
Groq是由谷歌的一個(gè)團(tuán)隊(duì)在硅谷創(chuàng)立,擁有70名員工,迄今已籌集了6700萬美元的資金。在SC ' 19,他們正式推出了他們的超大芯片,可以達(dá)到1000 TOPS。
Groq的軟件優(yōu)先的方法意味著他們的編譯器處理許多通常在硬件中會(huì)發(fā)生的控制功能,比如執(zhí)行計(jì)劃。軟件會(huì)編排所有的數(shù)據(jù)流和時(shí)間,以確保計(jì)算不會(huì)出現(xiàn)停頓,并使延遲、性能和功耗在編譯時(shí)完全可預(yù)測(cè)。
Groq正以其張量流處理器(TSP)芯片為目標(biāo),瞄準(zhǔn)數(shù)據(jù)中心應(yīng)用和自動(dòng)駕駛車輛。
Cerebras
Cerebras是以恢復(fù)圓片規(guī)模芯片的倡導(dǎo)而著稱,而這個(gè)想法早在80年代就已經(jīng)被放棄。
我們常見的處理器都是經(jīng)過封裝之后才可使用的,實(shí)際上如CPU中的核心裸片大小一般在200平方毫米以下,而GPU核心的大小也沒有超過1000平方毫米的,所以在一片晶圓上可以切割出很多核心裸片。不過這并不代表無法制造超大尺寸的芯片,在Hot Chip 31會(huì)議中,Cerebras Systems就推出了一款晶圓級(jí)深度學(xué)習(xí)芯片,尺寸達(dá)到了215×215平方毫米。幾乎占據(jù)了一整個(gè)晶圓的大小。
Cerebras龐大的46,225mm2的芯片,占用整個(gè)晶圓,其功耗15千瓦,在84個(gè)處理器塊上封裝40萬個(gè)核和18GB內(nèi)存。雖然這些數(shù)字看起來非常龐大,但請(qǐng)記住,這么大的芯片被設(shè)計(jì)出來,目的是代替成千上萬個(gè)GPU的。
而這么大的芯片主要就是用來進(jìn)行深度學(xué)習(xí)訓(xùn)練的,而深度學(xué)習(xí)的訓(xùn)練是應(yīng)用小變化的過程,模型的大小等因素讓神經(jīng)網(wǎng)絡(luò)訓(xùn)練變得非常困難。對(duì)于粗粒度計(jì)算,需要告訴互聯(lián)才能進(jìn)行訓(xùn)練,規(guī)模依舊有限且成本高昂。所以Celebras Systems設(shè)計(jì)了專門為神經(jīng)網(wǎng)絡(luò)原語優(yōu)化的核心,這種核心可編程、可以快速進(jìn)行西數(shù)計(jì)算,而且具有高速互聯(lián)能力。Celebras Systems設(shè)計(jì)了非常靈活的內(nèi)核,而且可以高效的處理張量運(yùn)算。
該公司表示,它已經(jīng)解決了之前困擾晶圓片規(guī)模設(shè)計(jì)的問題,如成品率(它繞過缺陷),并發(fā)明了對(duì)抗熱效應(yīng)的封裝。
Cerebras已經(jīng)籌集了超過2億美元的資金,此前曾表示,他們的rack系統(tǒng)正在少數(shù)幾個(gè)客戶數(shù)據(jù)中心運(yùn)行。
Cambricon寒武紀(jì)
Cambricon是中國最早的人工智能芯片公司之一,但絕不是最后一家。Cambricon是2016年由中國科學(xué)院的兩名研究員創(chuàng)立。
由于CPU和通用GPU (GPGPU)指令集在加速神經(jīng)網(wǎng)絡(luò)方面缺乏靈活性,他們開發(fā)了自己的指令集架構(gòu)(ISA),這是一種集成了標(biāo)量、向量、矩陣、邏輯、數(shù)據(jù)傳輸和控制指令的負(fù)載存儲(chǔ)架構(gòu)。
Cambricon的第一款產(chǎn)品Cambricon-1A被用于數(shù)千萬部智能手機(jī),以及無人機(jī)和可穿戴設(shè)備等其他終端設(shè)備。如今,第二代芯片包括云計(jì)算的兩部分和邊緣計(jì)算芯片——思源220。這種邊緣芯片的設(shè)計(jì)是為了填補(bǔ)該公司在邊緣計(jì)算產(chǎn)品組合中的空白。思遠(yuǎn)220標(biāo)志著寒武紀(jì)實(shí)現(xiàn)了云、邊、端的全方位立體覆蓋。MLU220是一款專門用于邊緣計(jì)算應(yīng)用場景的AI加速產(chǎn)品(邊緣人工智能加速卡)。產(chǎn)品集成4核ARM CORTEX A55,LPDDR4x內(nèi)存及豐富的外圍接口。用戶既可以使用MLU220作為AI加速協(xié)處理器,也可以使用其實(shí)現(xiàn)SOC方案。
Cambricon(以及Horizon Robotics,見下文)目前是全球最有價(jià)值的芯片初創(chuàng)企業(yè)之一:該公司迄今已融資2億美元,使其市值達(dá)到25億美元左右。