介紹一款基于FPGA的CNN硬件加速器IP
隨著人工智能(AI)的不斷發(fā)展,它已經(jīng)從早期的人工特征工程進(jìn)化到現(xiàn)在可以從海量數(shù)據(jù)中學(xué)習(xí),機(jī)器視覺(jué)、語(yǔ)音識(shí)別以及自然語(yǔ)言處理等領(lǐng)域都取得了重大突破。CNN(Convolutional Neural Network,卷積神經(jīng)網(wǎng)絡(luò))在人工智能領(lǐng)域受到越來(lái)越多的青睞,它是深度學(xué)習(xí)技術(shù)中極具代表性的網(wǎng)絡(luò)結(jié)構(gòu)之一,尤其在圖像處理領(lǐng)域取得了很大的成功。隨著網(wǎng)絡(luò)變得越來(lái)越大、越來(lái)越復(fù)雜,我們需要大量的計(jì)算資源來(lái)對(duì)其進(jìn)行訓(xùn)練,因此人們紛紛將注意力轉(zhuǎn)向FPGA(Field Programmable Gate Array,現(xiàn)場(chǎng)可編程門(mén)陣列)器件,F(xiàn)PGA不僅具有軟件的可編程性和靈活性,同時(shí)又有ASIC高吞吐和低延遲的特性,而且由于具有豐富的I/O接口,F(xiàn)PGA還非常適合用作協(xié)議和接口轉(zhuǎn)換的芯片。
近日KORTIQ公司推出了一款Xilinx FPGA的CNN加速器IP——AIScale,它能夠利用實(shí)現(xiàn)訓(xùn)練好的CNN網(wǎng)絡(luò),比如行業(yè)標(biāo)準(zhǔn)的ResNet、AlexNet、Tiny Yolo和VGG-16等,并將它們進(jìn)行壓縮輸出二進(jìn)制描述文件,可以部署到Xilinx全系列可編程邏輯器件上。Zynq SoC和Zynq UltraScale+ MPSoC器件PS可以提供數(shù)據(jù)給AIScale CNN加速器(PL),經(jīng)過(guò)分類(lèi)處理將輸出數(shù)據(jù)給PS。壓縮后的CNN網(wǎng)絡(luò)占用資源相對(duì)小很多,可以部署在片上存儲(chǔ)器中,可以更快更靈活的切換CNN網(wǎng)絡(luò)。
圖1:AIScale在計(jì)算機(jī)視覺(jué)應(yīng)用案例示意圖
AIScale加速器的核心是AIScale RCC(Re-configurable Compute Core),用戶根據(jù)需求可以靈活自定義AIScale RCC模塊的數(shù)量,AIScale RCC支持卷積預(yù)處理、池化/采樣、加權(quán)和全連接層等處理。資源更豐富的Zynq SoC和UltraScale+ MPSoC可以集成更多的AIScale RCC模塊,這會(huì)給AIScale加速器帶來(lái)更大的性能提升。當(dāng)然也可以根據(jù)成本、系統(tǒng)功耗、性能需求集成一定的AIScale RCC模塊,選擇合適的Xilinx FPGA器件。
圖2:多個(gè) AIScale RCC模塊級(jí)聯(lián)連接
KORTIQ公司目前專注于嵌入式和計(jì)算機(jī)視覺(jué)領(lǐng)域,設(shè)計(jì)工業(yè)4.0和物聯(lián)網(wǎng)(IoT)等,未來(lái)將會(huì)為AIScale CNN加速器提供更多更先進(jìn)的特性,比如圖像分類(lèi)、物體識(shí)別和追蹤、人臉和語(yǔ)音識(shí)別、自然語(yǔ)言處理等,將先進(jìn)的人工智能網(wǎng)絡(luò)應(yīng)用到自動(dòng)化生產(chǎn)、控制等場(chǎng)景中,提高相關(guān)行業(yè)的生產(chǎn)力為用戶帶來(lái)更好的服務(wù)。
原文鏈接:https://forums.xilinx.com/t5/Xcell-Daily-Blog/KORTIQ-s-AIScale-Accelerator-fits-trained-CNNs-into-large-or/ba-p/812395