從邊緣到云的最有效的AI，Gyrfalcon在CES展示多款A(yù)I芯片

時(shí)間：2019-01-11 14:39:32

關(guān)鍵字： AI 人工智能處理器電源資訊

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]在CES展會(huì)上，Gyrfalcon Technology Inc. (以下簡(jiǎn)稱“GTI”)充分展示了公司的關(guān)鍵核心技術(shù),這些技術(shù)以最高性能的AI數(shù)據(jù)加速和低功耗來引領(lǐng)行業(yè)，使解決方案非?？焖俸陀行?，支持最大規(guī)模的部署。

在CES展會(huì)上，Gyrfalcon Technology Inc. (以下簡(jiǎn)稱“GTI”)充分展示了公司的關(guān)鍵核心技術(shù),這些技術(shù)以最高性能的AI數(shù)據(jù)加速和低功耗來引領(lǐng)行業(yè)，使解決方案非?？焖俸陀行?，支持最大規(guī)模的部署。

GTI公司成立于2017年，利用了相同的專利架構(gòu)和軟件,先后推出了三種不同的芯片。自2018年9月走出隱身模式以來，GTI的核心技術(shù)和核心產(chǎn)品先后在著名的出版物上發(fā)表過文章，包括《Forbes》、《EE Times》、《ZDNet》和《Semiconductor Engineering》等。

GTI AI芯片加速了用于主機(jī)處理器的人工智能數(shù)據(jù)，并允許任何設(shè)計(jì)在節(jié)約能源的同時(shí)提供更快、更精確的結(jié)果。隨著結(jié)果的優(yōu)越性和資源的減少，使用GTI芯片的設(shè)計(jì)將比其他加速人工智能數(shù)據(jù)的方法有效得多。所有的AI加速器都使用主機(jī)處理器，甚至是GPU，無論加速器是用于邊緣還是云計(jì)算，因此采用GTI的技術(shù)優(yōu)勢(shì)將極大地提高并改善客戶創(chuàng)建AI的解決方案。將優(yōu)勢(shì)顯著結(jié)合起來,增加對(duì)客戶的設(shè)計(jì),通過使用更少的能源包括更高的性能(降低成本),或使用少量設(shè)備,甚至于采用無限擴(kuò)張的靈活性,更低成本有效地創(chuàng)建自定義模型。因此就很容易理解了，我們的人工智能是如何為大規(guī)模生產(chǎn)的商業(yè)產(chǎn)品提高1000倍的效率的。

所有產(chǎn)品均利用GTI提供的三項(xiàng)專利和專有技術(shù)引擎，MPE(矩陣處理引擎)，ConStreaming?引擎，這是GTI專利，獨(dú)特且極其有效的卷積神經(jīng)網(wǎng)絡(luò)引擎，以及GME(Gyrfalcon MRAM引擎) )這是業(yè)界首款，只有這項(xiàng)技術(shù)才能實(shí)現(xiàn)嵌入式MRAM引擎。所有這些引擎在終端設(shè)備和數(shù)據(jù)中心運(yùn)營中都能提供卓越的結(jié)果和效率。它們受到50多項(xiàng)專利的保護(hù)，包括已經(jīng)授予的專利和仍在進(jìn)行中的專利，并且專利持續(xù)增長(zhǎng)。

上面提到的MPE支持AI加速器，就像人腦一樣，邏輯和內(nèi)存集成在一起，這樣在處理人工智能數(shù)據(jù)時(shí)就不會(huì)浪費(fèi)精力和時(shí)間。 AI算法可以即時(shí)訪問數(shù)據(jù)，快速提供結(jié)果，并且不會(huì)浪費(fèi)將數(shù)據(jù)移入和移出位于系統(tǒng)其他位置的離散存儲(chǔ)器的能量。這使得數(shù)據(jù)處理具有非常高的性能，同時(shí)使用非常少的能量。

第一款芯片，Lightspeeur?2801S解決了廣泛的Edge AI應(yīng)用,并立即提供給全球公認(rèn)的消費(fèi)電子產(chǎn)品，企業(yè)和工業(yè)公司去應(yīng)用此技術(shù)設(shè)計(jì)產(chǎn)品。IDC在最近的一份報(bào)告中稱，“到2019年，大約45%的人工智能數(shù)據(jù)將在Edge上存儲(chǔ)、執(zhí)行和操作”，這使得Edge由于其獨(dú)特的機(jī)遇，成為GTI的一個(gè)有吸引力的目標(biāo)。因此，GTI推出了第一款Edge AI芯片.此外,還因?yàn)镋dge AI具有極具挑戰(zhàn)性的成功標(biāo)準(zhǔn)，創(chuàng)始人發(fā)現(xiàn)，對(duì)于需要設(shè)計(jì)能夠以高性能加速AI并且耗能極少的設(shè)備的客戶而言，需要同時(shí)規(guī)模小，成本低，沒有選擇性。在2017年9月推出該芯片后，許多客戶立即開始使用該芯片，成為上市產(chǎn)品的驗(yàn)證者。

該芯片具有9.3 TOPS / W的等效性能，并采用28nm工藝技術(shù)。它尺寸為7x7mm，非常小，可容納各種邊緣設(shè)備。它的峰值性能為5.6 TOPS，在0.3 W時(shí)可提供2.8 TOPS。2801S的USB dongle版本已于2018年開始供客戶使用，許多產(chǎn)品已通過市場(chǎng)營銷與英特爾Movidius產(chǎn)品進(jìn)行了比較。相比之下，2801S更適合采用大規(guī)模采用的商用設(shè)備，因?yàn)樗峁┝烁玫男阅?2801S , 5.6 TOPS VS Movidius,1 TOPS)，更好的功率使用(2801S的0.3W, 2.8TOPS VS Movidius的1W ，1 TOPS)和更小的尺寸和更低的價(jià)格。它支持VGG和SSD，為支持核心優(yōu)勢(shì)的人工智能應(yīng)用，客戶正瞄準(zhǔn)更多的機(jī)會(huì)。

第二款芯片，TheLightingpee?2802M是整個(gè)行業(yè)中第一款將MRAM集成到其設(shè)計(jì)中的芯片，并使用專有的GME(Gyrfalcon MRAM引擎)，為Edge AI設(shè)計(jì)帶來了諸多優(yōu)勢(shì)。使用2803M的設(shè)備可支持在同一芯片上同時(shí)運(yùn)行的多個(gè)型號(hào)，或非常大的AI型號(hào)，因?yàn)樵撔酒商峁?0MB內(nèi)存。多個(gè)模型對(duì)于需要復(fù)雜的AI實(shí)現(xiàn)以支持用戶交互或多階段AI功能的設(shè)備非常重要。該芯片采用22nm工藝技術(shù)，并提供非易失性存儲(chǔ)器，這對(duì)于物聯(lián)網(wǎng)端點(diǎn)和邊緣設(shè)備至關(guān)重要，這些設(shè)備在退出睡眠模式或電源中斷后需要立即運(yùn)行。對(duì)于使用太陽能或電池供電的遠(yuǎn)程設(shè)備，這是一項(xiàng)強(qiáng)烈的需求。

該芯片的客戶特定版本可以開發(fā)，以滿足客戶大批量應(yīng)用的特定設(shè)計(jì)。這將實(shí)現(xiàn)額外的設(shè)計(jì)功能，例如一次性可編程性，以提高安全性，非電泄漏和讀取速度，最高可達(dá)到為10ns。非電泄漏將在更具挑戰(zhàn)性的環(huán)境條件下提供一致的性能，并且允許該芯片的非常大的版本設(shè)計(jì)具有顯著提高的加速性能，而與較小尺寸的版本相比對(duì)功率使用的影響最小。高達(dá)10ns的讀取速度可以使芯片上的電源使用性能達(dá)到約30 TOPS / W，與任何其他提供AI加速的產(chǎn)品或技術(shù)相比，效率驚人。

第三款芯片，Lightspeeur?2803S增加了速度和功能，是先進(jìn)邊緣產(chǎn)品(家庭和小型辦公室中心，自動(dòng)駕駛車輛，機(jī)器人等)以及提供云AI的數(shù)據(jù)中心的理想選擇。

該芯片具有24 TOPS / W的等效性能，并采用28nm工藝技術(shù)。它的尺寸小為9x9mm，在0.7 W時(shí)的峰值性能為16.8 TOPS。它還支持448x448x4圖像尺寸，滿足更多種應(yīng)用需求。 448x448圖像尺寸近似為VGA圖像尺寸，x4表示圖像的紅色，綠色和藍(lán)色標(biāo)準(zhǔn)格式，添加了3D以用于高級(jí)相機(jī)相關(guān)的AI應(yīng)用程序。該芯片可支持各種神經(jīng)網(wǎng)絡(luò)，包括ResNet，MobileNet，ShiftNet，VGG和SSD。

它作為獨(dú)立芯片提供，基于USB的Dongle將提供給設(shè)計(jì)先進(jìn)邊緣設(shè)計(jì)的客戶，或者在即插即用數(shù)據(jù)中心實(shí)現(xiàn)中使用它，利用Dongle進(jìn)行AI加速器芯片擴(kuò)展。 GAINBOARD?系列加速卡可配置2801S或2803S芯片，目前，2801S僅支持并聯(lián)方式，2803S支持級(jí)聯(lián)與并聯(lián)兩種方式。2803S支持兩種擴(kuò)展模式：一、多顆芯片級(jí)聯(lián)，線性提升AI算力，運(yùn)行大規(guī)模神經(jīng)網(wǎng)絡(luò);二、多顆芯片并聯(lián)，同時(shí)處理多任務(wù)。

所有Lightspeeur?芯片均可并聯(lián)使用，可將所有芯片封裝到GAINBOARD?產(chǎn)品中，如4芯片M.2卡，16芯片PCIe服務(wù)器卡和64芯片服務(wù)器產(chǎn)品?？蛻艨梢造`活地選擇在先進(jìn)邊緣，邊緣服務(wù)器或數(shù)據(jù)中心服務(wù)器設(shè)計(jì)中精確設(shè)計(jì)多少芯片。先進(jìn)邊緣產(chǎn)品將是無人機(jī)，先進(jìn)的監(jiān)控設(shè)備，機(jī)器人和自動(dòng)駕駛汽車。邊緣服務(wù)器可以是復(fù)雜的工作站，家庭和小型辦公室AI中心，以及用于小型私人學(xué)校，大廈或社區(qū)的單卡AI服務(wù)器。數(shù)據(jù)中心服務(wù)器將提供大規(guī)模云AI服務(wù)器操作。這提供了無限的靈活性，因?yàn)槟Ｐ涂梢源罅坎⑿羞\(yùn)行，并且在系統(tǒng)中的實(shí)際芯片數(shù)量沒有限制。

當(dāng)在2803S的PCIe配置上使用這些優(yōu)勢(shì)時(shí)，它比硅谷流行的NVIDIA T4等市場(chǎng)選擇或英國的Graphcore芯片等新的挑戰(zhàn)者等要有效率得多。16芯片PCIe的2803提供了271TOPS，而NVIDIA T4在PCIe中僅提供65 TOPS，而Graphcore在使用2個(gè)芯片的類似配置中僅提供248TOPS。將TOPS的結(jié)果與所使用的功耗進(jìn)行比較，可以看出其對(duì)于先進(jìn)邊緣或數(shù)據(jù)中心操作的卓越效果，因?yàn)?803S PCIe將僅使用28W，而NVIDIA PCIe將消耗70W, Graphcore PCIe將消耗高達(dá)300W的功耗。

性能與功耗的比值說明了一切，2803S提供了驚人的10TOPS /W，而NVIDIA PCIe提供了大約1 TOPS/W，而Graphcore提供了不到1TOPS/W。這些對(duì)于高級(jí)人工智能加速來說是非常不經(jīng)濟(jì)的，而且它們甚至沒有更好的性能。當(dāng)您將其中四種PCIe卡打包到標(biāo)準(zhǔn)服務(wù)器配置中時(shí)，您可以將對(duì)數(shù)據(jù)中心的影響增加四倍。

使用GTI芯片的Cloud AI可以支持廣泛的用例，包括圖像識(shí)別，文本分類，情感分析，語言翻譯，文本預(yù)測(cè)，聊天機(jī)器人操作，閱讀理解和圖像字幕。

GTI提供完整的產(chǎn)品生態(tài)系統(tǒng)及廣泛的機(jī)會(huì)。我們擁有不斷增長(zhǎng)的芯片組合，我們擁有全系列的系統(tǒng)產(chǎn)品，如M.2卡，PCIe卡和服務(wù)器產(chǎn)品，我們擁有全方位的開發(fā)資源，可供客戶用于創(chuàng)建非常吸引力且有效的商業(yè)解決方案。這些工具包括非常簡(jiǎn)單的“Plai Builder”，允許非專業(yè)用戶使用最少的步驟或?qū)I(yè)知識(shí)創(chuàng)建AI模型。 “Plai”(People Learning Artificial Intelligence)英語中解釋意為“全民學(xué)習(xí)人工智能”是公司致力于簡(jiǎn)化AI模型創(chuàng)建，適應(yīng)非專業(yè)模型創(chuàng)建者。 GTI還提供SDK，一些具有現(xiàn)有的參考AI模型庫和其他工具，用于將芯片設(shè)計(jì)到器件中，并將現(xiàn)有模型移植到在GTI芯片架構(gòu)上運(yùn)行的格式。還有PlaiGround，它代表了公司的4D計(jì)劃，將提供去中心化，分布式，基于設(shè)備和深度學(xué)習(xí)的AI模型，支持由客戶，AI建模服務(wù)和機(jī)構(gòu)開發(fā)的非常具有挑戰(zhàn)性和創(chuàng)新的AI模型范圍。

一些客戶和合作伙伴代表Gyrfalcon和合作的技術(shù)發(fā)表了演講。在最近的一次新聞發(fā)布會(huì)上，京都副省長(zhǎng)Akimasa Yamasita先生表示了對(duì)GTI的認(rèn)可：“我們非常高興GTI能夠參加大數(shù)據(jù)會(huì)議。我們認(rèn)為最有效的大數(shù)據(jù)是利用AI人工智能，我們相信Gyrfalcon是硅谷最成功的AI公司之一，并期待與GTI有更多的合作機(jī)會(huì)。”