現(xiàn)代數據中心成功的要訣是:大規(guī)模提供尖端加速計算平臺,從而使世界各地的開發(fā)者與解決方案提供商都能被覆蓋到。在過去十年里,云計算已運用并行計算來提高性能,這種方法需要將求解過程分解成多個并行任務,以充分利用所有計算單元。以GPU 為代表的并行計算加速器,其中含有多達 2,000 個計算單元。我們不妨將它想象成一個塞滿小黃人的小型棒球場,每個小黃人代表 100 萬個邏輯門。一旦出現(xiàn)某個問題不支持所有小黃人同時并行工作完成求解,諸如 GPU 這樣的并行計算加速器就會面臨嚴重的性能局限。的確,一些類型的問題非常適合這種并行計算“小黃人”模式,但很多問題卻并不適合。
例如壓縮、視頻編碼、基因組分析和股票交易等任務,就不適合這種并行模式。這些任務更適合邏輯門方法與可編程芯片,即現(xiàn)場可編程門陣列( FPGA )。正因如此,Nimbix 近期率先在 Nimbix 云上面向開發(fā)者推出基于 FPGA 的 Alveo U50 加速器具有重要意義。
邏輯門是計算的基本單元。從“Hello World”到“Half-Life”,每個程序在執(zhí)行時都將轉化為大量邏輯門的迅速開關動作。程序的運行速度幾乎完全取決于體現(xiàn)在代碼中的程序員意圖與最終執(zhí)行該意圖所需的邏輯門數量之間的抽象層數量。每增加一層抽象,就需要消耗更多數量的邏輯門。
例如選取一個高級語言實現(xiàn)的視頻編碼程序,將其直接轉換成邏輯門,然后將邏輯門定義加載到 FPGA 中。結果證明,與常規(guī)的 CPU 方法相比,使用邏輯門對程序進行處理,不僅將視頻編碼速度提高了 20 倍,而且也將功耗降低了 10 倍。此外,還可以將編碼器的 30 多個并行實例加載到 FPGA 中。也就是說,通常CPU 編碼單個流的時間里就可以生成 600 個編碼流。這就是將基于門的 FPGA 方法用于解決實際應用的強大之處。此外,與 GPU 等功能固定的加速器相比,F(xiàn)PGA 還具有更高的靈活應變能力。隨著工作負載算法和需求的發(fā)展演進,F(xiàn)PGA 提供了可重配置硬件,其適配速度遠遠超越了 GPU 的產品周期。想象一下,現(xiàn)在已經有了 100 多種像這樣可以使用FPGA 加速技術進行優(yōu)化的解決方案!
FPGA 一度被認為是適用于嵌入式計算環(huán)境(汽車、工業(yè)物聯(lián)網及無人機和攝像頭等高端消費產品)的專用芯片,但隨著基于 FPGA 的加速在眾多新興新型工作負載中應用的日臻成熟,F(xiàn)PGA 正日漸在數據中心領域被廣泛采用。為了應對不斷增長的需求,賽靈思推出了專門針對數據中心的 Alveo加速器卡產品系列。
賽靈思與 Nimbix 展開合作,致力于為廣大用戶提供基于云的 FPGA 加速平臺。從計算流體動力學到視頻轉碼,開發(fā)者能夠立即訪問和使用這款平臺,獲得100 多種應用加速解決方案。新硬件的部署工作往往難度較大,但通過 Nimbix 動態(tài)部署基于云的 FPGA 加速硬件,可以一鍵點擊輕松實現(xiàn)。Nimbix 使用了賽靈思全系列 Alveo 產品線,包括U50、U200、U250、U280 加速器卡。
不僅如此,賽靈思還與 Nimbix 和三星的 SmartSSD 存儲部門合作,利用基于 FPGA 的計算加速器交付智能存儲。三星 SmartSSD 是一種在前端安裝 FPGA 加速器并預先加載可編程邏輯的 SSD,能夠動態(tài)改善驅動器的整體性能,為大規(guī)模數據處理和分析提供可擴展加速。數據直接在 SmartSSD 上進行處理,然后傳送給主機 CPU,從而減少數據傳輸,并加快獲得洞察的速度。Nimbix 云為數據分析師、數據科學家以及加速 IP 開發(fā)者提供了獲取加速存儲內計算的便捷渠道,方便開發(fā)新一代云應用與數據中心應用。
在云端開發(fā)和部署 FPGA 加速器從未像今天這樣簡單。賽靈思與眾多大型云提供商緊密合作,推動新平臺盡快投入使用。Nimbix 是首家使用賽靈思 Alveo U50 卡和三星 SmartSSD 的加速云提供商??蛻衄F(xiàn)在可以注冊并開始免費試用。