AI芯片公司的數(shù)據(jù)中心、端點(diǎn)或AIoT設(shè)備

時(shí)間：2020-03-15 08:29:28

關(guān)鍵字： AI AIOT 寒武紀(jì) 數(shù)據(jù)中心

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]目前世界各地涌現(xiàn)出許多初創(chuàng)公司，它們對(duì)如何更好的地實(shí)現(xiàn)AI提出了新的想法。小編下面給大家說說目前的幾家大的AI芯片公司的終端應(yīng)用。

目前世界各地涌現(xiàn)出許多初創(chuàng)公司，它們對(duì)如何更好的地實(shí)現(xiàn)AI提出了新的想法。小編下面給大家說說目前的幾家大的AI芯片公司的終端應(yīng)用。

數(shù)據(jù)中心的人工智能

根據(jù)位置不同，數(shù)據(jù)中心可以算作“邊緣”。邊緣計(jì)算的關(guān)鍵概念是在(或接近)生成或收集數(shù)據(jù)的相同地理位置處理數(shù)據(jù)。這包括網(wǎng)關(guān)或集線器設(shè)備，也包括加速公司單一人工智能應(yīng)用程序的內(nèi)部服務(wù)器。想想醫(yī)院或醫(yī)學(xué)研究機(jī)構(gòu)中加速x射線或CT掃描圖像分類的服務(wù)器，以及從工廠接收狀態(tài)數(shù)據(jù)并在現(xiàn)場處理的網(wǎng)關(guān)。

Graphcore

總部位于英國布里斯托爾的Graphcore公司在早期的一輪融資中獲得了超過10億美元的估值，成為首家被認(rèn)定為獨(dú)角獸的西方半導(dǎo)體初創(chuàng)公司。

Graphcore的IPU(智能處理單元)芯片擁有超過1200個(gè)專業(yè)核心的大規(guī)模并行架構(gòu)，每個(gè)核心可以運(yùn)行6個(gè)程序線程。還有大量的片上內(nèi)存，幾百M(fèi)B的RAM，更重要的是，還有45 tb的內(nèi)存帶寬。這使得整個(gè)機(jī)器學(xué)習(xí)模型可以存儲(chǔ)在芯片上。

Graphcore的IPU芯片可以在戴爾服務(wù)器上用于邊緣計(jì)算應(yīng)用程序。

Groq

Groq是由谷歌的一個(gè)團(tuán)隊(duì)在硅谷創(chuàng)立，擁有70名員工，迄今已籌集了6700萬美元的資金。在SC ' 19，他們正式推出了他們的超大芯片，可以達(dá)到1000 TOPS。

Groq的軟件優(yōu)先的方法意味著他們的編譯器處理許多通常在硬件中會(huì)發(fā)生的控制功能，比如執(zhí)行計(jì)劃。軟件會(huì)編排所有的數(shù)據(jù)流和時(shí)間，以確保計(jì)算不會(huì)出現(xiàn)停頓，并使延遲、性能和功耗在編譯時(shí)完全可預(yù)測(cè)。

Groq正以其張量流處理器(TSP)芯片為目標(biāo)，瞄準(zhǔn)數(shù)據(jù)中心應(yīng)用和自動(dòng)駕駛車輛。

Cerebras

Cerebras是以恢復(fù)圓片規(guī)模芯片的倡導(dǎo)而著稱，而這個(gè)想法早在80年代就已經(jīng)被放棄。

我們常見的處理器都是經(jīng)過封裝之后才可使用的，實(shí)際上如CPU中的核心裸片大小一般在200平方毫米以下，而GPU核心的大小也沒有超過1000平方毫米的，所以在一片晶圓上可以切割出很多核心裸片。不過這并不代表無法制造超大尺寸的芯片，在Hot Chip 31會(huì)議中，Cerebras Systems就推出了一款晶圓級(jí)深度學(xué)習(xí)芯片，尺寸達(dá)到了215×215平方毫米。幾乎占據(jù)了一整個(gè)晶圓的大小。

Cerebras龐大的46,225mm2的芯片，占用整個(gè)晶圓，其功耗15千瓦，在84個(gè)處理器塊上封裝40萬個(gè)核和18GB內(nèi)存。雖然這些數(shù)字看起來非常龐大，但請(qǐng)記住，這么大的芯片被設(shè)計(jì)出來，目的是代替成千上萬個(gè)GPU的。

而這么大的芯片主要就是用來進(jìn)行深度學(xué)習(xí)訓(xùn)練的，而深度學(xué)習(xí)的訓(xùn)練是應(yīng)用小變化的過程，模型的大小等因素讓神經(jīng)網(wǎng)絡(luò)訓(xùn)練變得非常困難。對(duì)于粗粒度計(jì)算，需要告訴互聯(lián)才能進(jìn)行訓(xùn)練，規(guī)模依舊有限且成本高昂。所以Celebras Systems設(shè)計(jì)了專門為神經(jīng)網(wǎng)絡(luò)原語優(yōu)化的核心，這種核心可編程、可以快速進(jìn)行西數(shù)計(jì)算，而且具有高速互聯(lián)能力。Celebras Systems設(shè)計(jì)了非常靈活的內(nèi)核，而且可以高效的處理張量運(yùn)算。

該公司表示，它已經(jīng)解決了之前困擾晶圓片規(guī)模設(shè)計(jì)的問題，如成品率(它繞過缺陷)，并發(fā)明了對(duì)抗熱效應(yīng)的封裝。

Cerebras已經(jīng)籌集了超過2億美元的資金，此前曾表示，他們的rack系統(tǒng)正在少數(shù)幾個(gè)客戶數(shù)據(jù)中心運(yùn)行。

Cambricon寒武紀(jì)

Cambricon是中國最早的人工智能芯片公司之一，但絕不是最后一家。Cambricon是2016年由中國科學(xué)院的兩名研究員創(chuàng)立。

由于CPU和通用GPU (GPGPU)指令集在加速神經(jīng)網(wǎng)絡(luò)方面缺乏靈活性，他們開發(fā)了自己的指令集架構(gòu)(ISA)，這是一種集成了標(biāo)量、向量、矩陣、邏輯、數(shù)據(jù)傳輸和控制指令的負(fù)載存儲(chǔ)架構(gòu)。

Cambricon的第一款產(chǎn)品Cambricon-1A被用于數(shù)千萬部智能手機(jī)，以及無人機(jī)和可穿戴設(shè)備等其他終端設(shè)備。如今，第二代芯片包括云計(jì)算的兩部分和邊緣計(jì)算芯片——思源220。這種邊緣芯片的設(shè)計(jì)是為了填補(bǔ)該公司在邊緣計(jì)算產(chǎn)品組合中的空白。思遠(yuǎn)220標(biāo)志著寒武紀(jì)實(shí)現(xiàn)了云、邊、端的全方位立體覆蓋。MLU220是一款專門用于邊緣計(jì)算應(yīng)用場景的AI加速產(chǎn)品(邊緣人工智能加速卡)。產(chǎn)品集成4核ARM CORTEX A55，LPDDR4x內(nèi)存及豐富的外圍接口。用戶既可以使用MLU220作為AI加速協(xié)處理器，也可以使用其實(shí)現(xiàn)SOC方案。

Cambricon(以及Horizon Robotics，見下文)目前是全球最有價(jià)值的芯片初創(chuàng)企業(yè)之一:該公司迄今已融資2億美元，使其市值達(dá)到25億美元左右。