【導讀】:如今AI的觸角已經(jīng)伸向了市場各個領域,AI離不開硬件,新一代人工智能硬件相較于之前的硬件有什么不一樣的呢?Achronix給出了答案。
AI應用覆蓋了不同的市場,如自主駕駛、醫(yī)療診斷、家用電器、工業(yè)自動化、自適應網(wǎng)站和金融分析等等;甚至是將這些系統(tǒng)連接在一起的通信基礎設施也正朝著自動化的自我修復和優(yōu)化發(fā)展。這些全新的架構將執(zhí)行諸如負載平衡等功能,還有根據(jù)以往經(jīng)驗來進行預測來分配資源,如無線通道和網(wǎng)絡端口等資源。這些應用要求高性能,并且在許多情況下,要有低延遲以成功地響應條件和需求的變化。它們還要求功耗要盡可能的低,其結果是無法在本地完成,機器學習解決方案往往被放在電能和散熱器充足的云服務器中。對這些嵌入式系統(tǒng)進一步的要求是:即使在網(wǎng)絡不能連接至云端的情況下,也要始終處于待命狀態(tài),并且隨時準備響應。這些因素結合起來就要求改變硬件設計的方式。
讓我們來了解一下通常被用于執(zhí)行這類計算任務的一些主要硬件器件種類,并分析與它們每種器件相關的優(yōu)缺點:
中央處理器(Central Processing Unit,CPU)CPU幾乎是達到了半導體器件所能擁有的最高靈活性,被構想為一種完全通用的器件,它們也很容易被編程。然而,這種靈活性自然是要付出代價的,在一個通用架構中移動數(shù)據(jù)和指令所涉及到的大量開銷,使CPU相對低效且耗電。其結果是,為了滿足當今的計算需求,CPU很快就被淘汰了。因此,設計人員就順理成章地選擇探討用其它架構來補充這種通用功能。
圖形處理器(Graphics Processing Unit,GPU)根據(jù)任務要求,另一條途徑是考慮圖形處理器(GPU)來解決這個問題。GPU從上世紀90年代起就開始進入了興盛時期,那個時期它們通常被用來幫助個人電腦(PC)中的CPU完成圖形處理任務,為此它們還在架構上進行了優(yōu)化。事實上,憑借其擁有的許多計算內核和數(shù)不清的算數(shù)邏輯單元,GPU可被用來加速許多不同類型的高度并行功能。然而,其代價是不能執(zhí)行通用計算任務,并且還相對耗電。
專用集成電路(ApplicaTIon Specific Integrated Circuits,ASICs)在解決方案組合中,最遙遠的一端是專用集成電路(ASIC)。它們被專門制造用來支持其目標應用,ASIC可被設計成不在任何其他計算上浪費時間或能耗。然而,正如大多數(shù)設計人員證實的一樣,ASIC的設計和生產(chǎn)是昂貴的,并對數(shù)量有限的功能進行了高的承諾;ASIC在設計和制造完成之后,幾乎沒有能力去提供更通用的計算或適用其它用途。
我們的很大一部分客戶已經(jīng)到達這個階段了——設計高性能ASIC來作為解決他們所面臨的密集計算需求的唯一方法。然而即便是采用這種方案,許多與我們交流的客戶已經(jīng)在不得不考慮其他可選擇方案,以支持他們以更低的整體成本去生產(chǎn)性能更高的器件,以及集成一定程度的功能靈活性。
那么,其它的可選方案是什么呢?FPGA
還有另一種方法。FPGA可提供接近CPU所擁有的靈活性,以及接近ASIC所擁有的效率。與ASIC一樣,F(xiàn)PGA允許設計人員實現(xiàn)邏輯算法,提供巨大的并行和硬件優(yōu)化的解決方案。與ASIC不同的是,F(xiàn)PGA可以在眨眼間用一個新的設計進行重新編程。與CPU或GPU相比,當今FPGA的能效非常高,能夠比基于處理器的解決方案每瓦提供遠遠更多的運算。
但是,還有一種更具吸引力的解決方案。
Speedcore嵌入式FPGA(eFPGA)知識產(chǎn)權( IP)
Achronix已經(jīng)先行采取了進一步的措施。與其簡單地提倡使用分立的FPGA芯片,為什么不將該架構引入到您的CPU或SoC之中呢?并同時仍可享受更多的性能提高呢?
一款eFPGA消除了芯片與芯片之間通信的需求,例如通過PCI-Express這樣帶寬有限的連接需求,消除了對數(shù)據(jù)進行串行化和解串行化的需求,并提供了一個極大容量的、直達為FPGA陣列結構的片上互連。這意味著與獨立的FPGA芯片相比,可提供高達100倍的性能改善,同時將功耗降低高達50%,并縮小了片芯晶粒的面積,降低系統(tǒng)成本高達90%,及減少了對如穩(wěn)壓電源、元器件和散熱器等其它組件的需求。
Achronix的SpeedcoreTM嵌入式FPGA(eFPGA)IP產(chǎn)品可以被集成到ASIC或者SoC之中,以提供定制的可編程陣列結構??蛻敉ㄟ^細化其所需的邏輯功能、存儲器和DSP資源,然后Achronix將配置Speedcore IP,以滿足其個性化的需求。Speedcore的查找表(LUT)、存儲器(RAM)單元和DSP64單元都可以像積木一樣組裝起來,從而為任何特定應用創(chuàng)建最優(yōu)化的可編程功能陣列結構。Speedcore eFPGA目前已經(jīng)在臺積電(TSMC)的16nm工藝上驗證量產(chǎn),并在開發(fā)用于TSMC的7nm工藝的產(chǎn)品。Speedcore eFPGA由Achronix的經(jīng)過實際芯片驗證的ACE設計工具提供支持。
在其他幾個優(yōu)勢之外,Speedcore eFPGA解決方案可提供緩存一致性、共享存儲資源,以實現(xiàn)更快速地導入和導出數(shù)據(jù),且能在2ms內對每10萬個查找表重新配置其整個架構。
諸如多核CPU、通用圖形處理器GPGPU和獨立FPGA芯片等現(xiàn)有解決方案都可被用來支持如深度學習等先進的人工智能算法;但隨著機器學習架構的發(fā)展,它們的局限無法滿足開發(fā)人員對硬件不斷攀升的要求。Achronix的Speedcore eFPGA是基于經(jīng)過驗證的技術,并可為設計人員提供一條途徑,去實現(xiàn)更快速、更小巧的、成本更低且更節(jié)能的解決方案,從而支持設計人員根據(jù)快速升級的市場需求繼續(xù)增加他們的計算能力。
Achronix半導體公司是一家提供高性能,高密度FPGA方案的美國高科技公司。Achronix半導體公司跟Intel的合作讓其可以用業(yè)界最先進的22nm 3D FinFET 技術發(fā)展新一代的FPGA器件。