從邊緣到云的最有效的AI,Gyrfalcon在CES展示多款A(yù)I芯片
在CES展會上,Gyrfalcon Technology Inc. (以下簡稱“GTI”)充分展示了公司的關(guān)鍵核心技術(shù),這些技術(shù)以最高性能的AI數(shù)據(jù)加速和低功耗來引領(lǐng)行業(yè),使解決方案非常快速和有效,支持最大規(guī)模的部署。
GTI公司成立于2017年,利用了相同的專利架構(gòu)和軟件,先后推出了三種不同的芯片。自2018年9月走出隱身模式以來,GTI的核心技術(shù)和核心產(chǎn)品先后在著名的出版物上發(fā)表過文章,包括《Forbes》、《EE Times》、《ZDNet》和《Semiconductor Engineering》等。
GTI AI芯片加速了用于主機(jī)處理器的人工智能數(shù)據(jù),并允許任何設(shè)計(jì)在節(jié)約能源的同時提供更快、更精確的結(jié)果。隨著結(jié)果的優(yōu)越性和資源的減少,使用GTI芯片的設(shè)計(jì)將比其他加速人工智能數(shù)據(jù)的方法有效得多。所有的AI加速器都使用主機(jī)處理器,甚至是GPU,無論加速器是用于邊緣還是云計(jì)算,因此采用GTI的技術(shù)優(yōu)勢將極大地提高并改善客戶創(chuàng)建AI的解決方案。將優(yōu)勢顯著結(jié)合起來,增加對客戶的設(shè)計(jì),通過使用更少的能源包括更高的性能(降低成本),或使用少量設(shè)備,甚至于采用無限擴(kuò)張的靈活性,更低成本有效地創(chuàng)建自定義模型。因此就很容易理解了,我們的人工智能是如何為大規(guī)模生產(chǎn)的商業(yè)產(chǎn)品提高1000倍的效率的。
所有產(chǎn)品均利用GTI提供的三項(xiàng)專利和專有技術(shù)引擎,MPE(矩陣處理引擎),ConStreaming?引擎,這是GTI專利,獨(dú)特且極其有效的卷積神經(jīng)網(wǎng)絡(luò)引擎,以及GME(Gyrfalcon MRAM引擎) )這是業(yè)界首款,只有這項(xiàng)技術(shù)才能實(shí)現(xiàn)嵌入式MRAM引擎。所有這些引擎在終端設(shè)備和數(shù)據(jù)中心運(yùn)營中都能提供卓越的結(jié)果和效率。它們受到50多項(xiàng)專利的保護(hù),包括已經(jīng)授予的專利和仍在進(jìn)行中的專利,并且專利持續(xù)增長。
上面提到的MPE支持AI加速器,就像人腦一樣,邏輯和內(nèi)存集成在一起,這樣在處理人工智能數(shù)據(jù)時就不會浪費(fèi)精力和時間。 AI算法可以即時訪問數(shù)據(jù),快速提供結(jié)果,并且不會浪費(fèi)將數(shù)據(jù)移入和移出位于系統(tǒng)其他位置的離散存儲器的能量。這使得數(shù)據(jù)處理具有非常高的性能,同時使用非常少的能量。
第一款芯片,Lightspeeur?2801S解決了廣泛的Edge AI應(yīng)用,并立即提供給全球公認(rèn)的消費(fèi)電子產(chǎn)品,企業(yè)和工業(yè)公司去應(yīng)用此技術(shù)設(shè)計(jì)產(chǎn)品。IDC在最近的一份報(bào)告中稱,“到2019年,大約45%的人工智能數(shù)據(jù)將在Edge上存儲、執(zhí)行和操作”,這使得Edge由于其獨(dú)特的機(jī)遇,成為GTI的一個有吸引力的目標(biāo)。因此,GTI推出了第一款Edge AI芯片.此外,還因?yàn)镋dge AI具有極具挑戰(zhàn)性的成功標(biāo)準(zhǔn),創(chuàng)始人發(fā)現(xiàn),對于需要設(shè)計(jì)能夠以高性能加速AI并且耗能極少的設(shè)備的客戶而言, 需要同時規(guī)模小,成本低,沒有選擇性。 在2017年9月推出該芯片后,許多客戶立即開始使用該芯片,成為上市產(chǎn)品的驗(yàn)證者。
該芯片具有9.3 TOPS / W的等效性能,并采用28nm工藝技術(shù)。 它尺寸為7x7mm,非常小,可容納各種邊緣設(shè)備。 它的峰值性能為5.6 TOPS,在0.3 W時可提供2.8 TOPS。2801S的USB dongle版本已于2018年開始供客戶使用,許多產(chǎn)品已通過市場營銷與英特爾Movidius產(chǎn)品進(jìn)行了比較。 相比之下,2801S更適合采用大規(guī)模采用的商用設(shè)備,因?yàn)樗峁┝烁玫男阅?2801S , 5.6 TOPS VS Movidius,1 TOPS),更好的功率使用(2801S的0.3W, 2.8TOPS VS Movidius的1W ,1 TOPS)和更小的尺寸和更低的價格。 它支持VGG和SSD,為支持核心優(yōu)勢的人工智能應(yīng)用,客戶正瞄準(zhǔn)更多的機(jī)會。
第二款芯片,TheLightingpee?2802M是整個行業(yè)中第一款將MRAM集成到其設(shè)計(jì)中的芯片,并使用專有的GME(Gyrfalcon MRAM引擎),為Edge AI設(shè)計(jì)帶來了諸多優(yōu)勢。 使用2803M的設(shè)備可支持在同一芯片上同時運(yùn)行的多個型號,或非常大的AI型號,因?yàn)樵撔酒商峁?0MB內(nèi)存。 多個模型對于需要復(fù)雜的AI實(shí)現(xiàn)以支持用戶交互或多階段AI功能的設(shè)備非常重要。 該芯片采用22nm工藝技術(shù),并提供非易失性存儲器,這對于物聯(lián)網(wǎng)端點(diǎn)和邊緣設(shè)備至關(guān)重要,這些設(shè)備在退出睡眠模式或電源中斷后需要立即運(yùn)行。 對于使用太陽能或電池供電的遠(yuǎn)程設(shè)備,這是一項(xiàng)強(qiáng)烈的需求。
該芯片的客戶特定版本可以開發(fā),以滿足客戶大批量應(yīng)用的特定設(shè)計(jì)。這將實(shí)現(xiàn)額外的設(shè)計(jì)功能,例如一次性可編程性,以提高安全性,非電泄漏和讀取速度,最高可達(dá)到為10ns。非電泄漏將在更具挑戰(zhàn)性的環(huán)境條件下提供一致的性能,并且允許該芯片的非常大的版本設(shè)計(jì)具有顯著提高的加速性能,而與較小尺寸的版本相比對功率使用的影響最小。高達(dá)10ns的讀取速度可以使芯片上的電源使用性能達(dá)到約30 TOPS / W,與任何其他提供AI加速的產(chǎn)品或技術(shù)相比,效率驚人。
第三款芯片,Lightspeeur?2803S增加了速度和功能,是先進(jìn)邊緣產(chǎn)品(家庭和小型辦公室中心,自動駕駛車輛,機(jī)器人等)以及提供云AI的數(shù)據(jù)中心的理想選擇。
該芯片具有24 TOPS / W的等效性能,并采用28nm工藝技術(shù)。 它的尺寸小為9x9mm,在0.7 W時的峰值性能為16.8 TOPS。它還支持448x448x4圖像尺寸,滿足更多種應(yīng)用需求。 448x448圖像尺寸近似為VGA圖像尺寸,x4表示圖像的紅色,綠色和藍(lán)色標(biāo)準(zhǔn)格式,添加了3D以用于高級相機(jī)相關(guān)的AI應(yīng)用程序。 該芯片可支持各種神經(jīng)網(wǎng)絡(luò),包括ResNet,MobileNet,ShiftNet,VGG和SSD。
它作為獨(dú)立芯片提供,基于USB的Dongle將提供給設(shè)計(jì)先進(jìn)邊緣設(shè)計(jì)的客戶,或者在即插即用數(shù)據(jù)中心實(shí)現(xiàn)中使用它,利用Dongle進(jìn)行AI加速器芯片擴(kuò)展。 GAINBOARD?系列加速卡可配置2801S或2803S芯片,目前,2801S僅支持并聯(lián)方式,2803S支持級聯(lián)與并聯(lián)兩種方式。2803S支持兩種擴(kuò)展模式:一、多顆芯片級聯(lián),線性提升AI算力,運(yùn)行大規(guī)模神經(jīng)網(wǎng)絡(luò);二、多顆芯片并聯(lián),同時處理多任務(wù)。
所有Lightspeeur?芯片均可并聯(lián)使用,可將所有芯片封裝到GAINBOARD?產(chǎn)品中,如4芯片M.2卡,16芯片PCIe服務(wù)器卡和64芯片服務(wù)器產(chǎn)品??蛻艨梢造`活地選擇在先進(jìn)邊緣,邊緣服務(wù)器或數(shù)據(jù)中心服務(wù)器設(shè)計(jì)中精確設(shè)計(jì)多少芯片。先進(jìn)邊緣產(chǎn)品將是無人機(jī),先進(jìn)的監(jiān)控設(shè)備,機(jī)器人和自動駕駛汽車。邊緣服務(wù)器可以是復(fù)雜的工作站,家庭和小型辦公室AI中心,以及用于小型私人學(xué)校,大廈或社區(qū)的單卡AI服務(wù)器。數(shù)據(jù)中心服務(wù)器將提供大規(guī)模云AI服務(wù)器操作。這提供了無限的靈活性,因?yàn)槟P涂梢源罅坎⑿羞\(yùn)行,并且在系統(tǒng)中的實(shí)際芯片數(shù)量沒有限制。
當(dāng)在2803S的PCIe配置上使用這些優(yōu)勢時,它比硅谷流行的NVIDIA T4等市場選擇或英國的Graphcore芯片等新的挑戰(zhàn)者等要有效率得多。16芯片PCIe的2803提供了271TOPS,而NVIDIA T4在PCIe中僅提供65 TOPS,而Graphcore在使用2個芯片的類似配置中僅提供248TOPS。將TOPS的結(jié)果與所使用的功耗進(jìn)行比較,可以看出其對于先進(jìn)邊緣或數(shù)據(jù)中心操作的卓越效果,因?yàn)?803S PCIe將僅使用28W,而NVIDIA PCIe將消耗70W, Graphcore PCIe將消耗高達(dá)300W的功耗。
性能與功耗的比值說明了一切,2803S提供了驚人的10TOPS /W,而NVIDIA PCIe提供了大約1 TOPS/W,而Graphcore提供了不到1TOPS/W。這些對于高級人工智能加速來說是非常不經(jīng)濟(jì)的,而且它們甚至沒有更好的性能。當(dāng)您將其中四種PCIe卡打包到標(biāo)準(zhǔn)服務(wù)器配置中時,您可以將對數(shù)據(jù)中心的影響增加四倍。
使用GTI芯片的Cloud AI可以支持廣泛的用例,包括圖像識別,文本分類,情感分析,語言翻譯,文本預(yù)測,聊天機(jī)器人操作,閱讀理解和圖像字幕。
GTI提供完整的產(chǎn)品生態(tài)系統(tǒng)及廣泛的機(jī)會。 我們擁有不斷增長的芯片組合,我們擁有全系列的系統(tǒng)產(chǎn)品,如M.2卡,PCIe卡和服務(wù)器產(chǎn)品,我們擁有全方位的開發(fā)資源,可供客戶用于創(chuàng)建非常吸引力且有效的商業(yè)解決方案。這些工具包括非常簡單的“Plai Builder”,允許非專業(yè)用戶使用最少的步驟或?qū)I(yè)知識創(chuàng)建AI模型。 “Plai”(People Learning Artificial Intelligence)英語中解釋意為“全民學(xué)習(xí)人工智能”是公司致力于簡化AI模型創(chuàng)建,適應(yīng)非專業(yè)模型創(chuàng)建者。 GTI還提供SDK,一些具有現(xiàn)有的參考AI模型庫和其他工具,用于將芯片設(shè)計(jì)到器件中,并將現(xiàn)有模型移植到在GTI芯片架構(gòu)上運(yùn)行的格式。還有PlaiGround,它代表了公司的4D計(jì)劃,將提供去中心化,分布式,基于設(shè)備和深度學(xué)習(xí)的AI模型,支持由客戶,AI建模服務(wù)和機(jī)構(gòu)開發(fā)的非常具有挑戰(zhàn)性和創(chuàng)新的AI模型范圍。
一些客戶和合作伙伴代表Gyrfalcon和合作的技術(shù)發(fā)表了演講。在最近的一次新聞發(fā)布會上,京都副省長Akimasa Yamasita先生表示了對GTI的認(rèn)可:“我們非常高興GTI能夠參加大數(shù)據(jù)會議。我們認(rèn)為最有效的大數(shù)據(jù)是利用AI人工智能,我們相信Gyrfalcon是硅谷最成功的AI公司之一,并期待與GTI有更多的合作機(jī)會。”