Microchip與韓國智能硬件公司IHWK合作開發(fā)模擬計算平臺，加速邊緣AI/ML推理

時間：2023-09-14 16:19:40

關鍵字：邊緣AI 處理器存儲器

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]IHWK采用Microchip的memBrain? 非易失性內存計算技術并與高校合作，為神經(jīng)技術設備開發(fā) SoC 處理器

為了適應網(wǎng)絡邊緣人工智能(AI)計算及相關推理算法的快速發(fā)展，韓國智能硬件公司(IHWK)正在為神經(jīng)技術設備和現(xiàn)場可編程神經(jīng)形態(tài)設備開發(fā)神經(jīng)形態(tài)計算平臺。Microchip Technology Inc.(美國微芯科技公司)通過子公司冠捷半導體(SST)參與協(xié)助開發(fā)，為該平臺SuperFlash® memBrain?神經(jīng)形態(tài)存儲器解決方案提供評估系統(tǒng)。該解決方案基于Microchip經(jīng)行業(yè)驗證的非易失性存儲器(NVM)SuperFlash技術并加以優(yōu)化，可通過模擬內存計算方法為神經(jīng)網(wǎng)絡執(zhí)行矢量矩陣乘法(VMM)。

memBrain技術評估工具包旨在讓IHWK展示其神經(jīng)形態(tài)計算平臺在邊緣運行推理算法的絕對能效。最終目標是為生成式人工智能模型、自動駕駛汽車、醫(yī)療診斷、語音處理、安全/監(jiān)控和商用無人機等應用創(chuàng)建超低功耗模擬處理單元(APU)。

由于目前用于邊緣推理的神經(jīng)網(wǎng)絡模型可能需要5000萬或更多突觸(權重)進行處理，因此純數(shù)字解決方案需要足夠帶寬來使用片外DRAM，這對神經(jīng)網(wǎng)絡計算造成了瓶頸，降低了整體計算能力。相比之下，memBrain解決方案在超低功耗亞閾值模式下將突觸權重存儲在片上浮動柵中，并使用相同存儲單元進行計算，從而顯著提高了能效和降低了系統(tǒng)延遲。與傳統(tǒng)數(shù)字DSP和基于SRAM/DRAM的方法相比，該方案可將每次推理決策的功耗降低到原來的1/20到1/10，并能顯著降低總體物料清單。

為了開發(fā)APU，IHWK 還與位于大田的韓國科學技術院(KAIST)合作進行設備開發(fā)，并與位于首爾的延世大學(Yonsei University)合作提供設備設計協(xié)助。最終的 APU 預計將優(yōu)化推理的系統(tǒng)級算法，并在每瓦 20-80 TeraOPS 之間運行，實現(xiàn)了為電池供電設備設計的內存計算解決方案的最佳性能。

Microchip技術許可業(yè)務部門SST副總裁Mark Reiten表示：“通過使用成熟的NVM而非替代性片外內存解決方案來執(zhí)行神經(jīng)網(wǎng)絡計算和存儲權重，Microchip的memBrain內存計算技術有望消除在網(wǎng)絡邊緣執(zhí)行人工智能處理所面臨的大規(guī)模數(shù)據(jù)通信瓶頸。與韓國領先的研發(fā)公司IHWK、相關高校和早期用戶開展合作，進一步證明了Microchip神經(jīng)處理技術的先進性，也將推動Microchip在人工智能領域的發(fā)展。”

IHWK 分公司經(jīng)理Sanghoon Yoon 表示：“韓國是人工智能半導體發(fā)展的重要熱點地區(qū)。我們的非易失性存儲器和新興存儲器專家已經(jīng)證實，Microchip基于成熟非易失性存儲器技術的memBrain產(chǎn)品是創(chuàng)建內存計算系統(tǒng)的最佳選擇?！?

將神經(jīng)模型永久存儲在memBrain解決方案的處理元件中，還可支持用于實時神經(jīng)網(wǎng)絡處理的即時開啟功能。IHWK正尋求利用SuperFlash存儲器浮動柵單元的非易失性，支持低功耗邊緣計算設備使用高級ML模型，建立機器學習推理的新基準。