英特爾CPU+FPGA,這才是未來互聯(lián)世界的正確打開方式
互聯(lián)的世界,數(shù)據(jù)的需求呈現(xiàn)出一個指數(shù)型的增長,預(yù)測2020年左右,數(shù)據(jù)的洪流將奔涌而來,話不多說,看下圖。
這么大的數(shù)據(jù)量,意味著網(wǎng)絡(luò)就必須要在更高的速度上處理更多的數(shù)據(jù),數(shù)據(jù)中心也必須要做更復(fù)雜的計(jì)算、處理更大的數(shù)據(jù)集,即使嵌入式的終端和設(shè)備也要做很多本地的計(jì)算。
除此之外,數(shù)據(jù)中心還需要應(yīng)對一些更加具有挑戰(zhàn)性的工作負(fù)載,比如要進(jìn)行大數(shù)據(jù)的分析,還有機(jī)器學(xué)習(xí),這其中會出現(xiàn)一些瓶頸和計(jì)算的熱點(diǎn),CPU單獨(dú)無法應(yīng)對,這個時候就需要FPGA。
9月19日,在英特爾FPGA技術(shù)大會后的媒體發(fā)布會上,英特爾可編程解決方案事業(yè)部副總裁兼客戶體驗(yàn)事業(yè)部總經(jīng)理Rina Raman女士跟我們分享了FPGA是如何解決這些數(shù)據(jù)難題的。
FPGA能干什么?
FPGA針對現(xiàn)在應(yīng)用最早、轉(zhuǎn)型最厲害的六個全球市場分別為:G無線通訊,雷達(dá)和航天,網(wǎng)絡(luò)的轉(zhuǎn)型,云計(jì)算,智慧城市和無人駕駛車輛。
這幾個市場都面臨著連接數(shù)量急劇增長,計(jì)算復(fù)雜度提高的挑戰(zhàn),而FPGA可以幫助我們很好地應(yīng)對這些挑戰(zhàn)。
比如針對5G網(wǎng)絡(luò),F(xiàn)PGA可以加速M(fèi)IMO天線的計(jì)算和基帶的信號的處理、安全,還有其他一些可能會制約發(fā)展的網(wǎng)絡(luò)的功能。
在航空領(lǐng)域,特別是雷達(dá)處理到安全的通訊,面臨著包括像波速形成和過濾和更多的像機(jī)器學(xué)習(xí)的算法等方面的挑戰(zhàn),傳統(tǒng)的方法是我們要使用更快的CPU和DSP芯片陣列或者是ASIC專用的集成電路來應(yīng)對,但是,通過使用FPGA,我們可以加速數(shù)字的處理,加速處理機(jī)器學(xué)習(xí)的一些任務(wù),讓我們整個架構(gòu)會更加簡單,而且開發(fā)的環(huán)境也更加統(tǒng)一。
隨著無人駕駛汽車的發(fā)展,對性能將會有一個極大的要求,再加上對算法和用力方面有很大的不確定性,所以,我們看到可能會出現(xiàn)計(jì)算的孤島,每個孤島都可能有自己本身的硬件和開發(fā)環(huán)境,這對制造商來說可能是不可持續(xù)的。FPGA在以下兩個領(lǐng)域能夠發(fā)揮非常關(guān)鍵的作用:一是本地計(jì)算,比如說傳感器、融合,二是深度學(xué)習(xí)的推算。
另外,在智慧城市的領(lǐng)域,現(xiàn)代化過程中也有很多計(jì)算孤島正在出現(xiàn),比如交通管理系統(tǒng)和照明管理系統(tǒng)、泊車管理系統(tǒng)和安全的攝像頭,實(shí)際上他們都是各自為政,做不到系統(tǒng)之間數(shù)據(jù)的共享,英特爾的CPU加上FPGA就能取代這些專有的架構(gòu),可以提供一些像本地計(jì)算、連接和分析的能力,只需要通過加速幾個關(guān)鍵的功能就能實(shí)現(xiàn)。
還有在云的環(huán)境中,工作負(fù)載會出現(xiàn)動態(tài)的變化,甚至這些工作負(fù)載的構(gòu)成也會出現(xiàn)快速的變化。有一些工作負(fù)載所需要的性能是即使在合理的功耗水平之下都難以實(shí)現(xiàn)的,這個時候服務(wù)器卡上需要一些特別的芯片或者配上一個GPU,專門處理并行的運(yùn)算,或者是裝上網(wǎng)絡(luò)加速器,處理協(xié)議和安全的流量分流。還有視頻的解碼器,或者是配上ASIC專用的集成電路,用于搜索的加速和深度學(xué)習(xí)。但是,事實(shí)上在服務(wù)器上面并沒有空間,也沒有足夠的功率里支持所有這些芯片都放進(jìn)去,所以,有一些云的服務(wù)提供商和數(shù)據(jù)中心的架構(gòu)師就開始轉(zhuǎn)向使用英特爾最先進(jìn)的FPGA的產(chǎn)品,就是和英特爾Xeon的CPU能夠?qū)崿F(xiàn)很好地連接,提供搜索、計(jì)算、加密、分組處理和機(jī)器學(xué)習(xí)的硬件的加速。
FPGA在現(xiàn)實(shí)生活中的案例
接著,Rina Raman女士給我們介紹了很多FPGA在現(xiàn)實(shí)生活當(dāng)中實(shí)際的案例。
第一個是數(shù)據(jù)庫的加速?,F(xiàn)在關(guān)系數(shù)據(jù)庫實(shí)際上是無處不在的,數(shù)據(jù)分析就變得至關(guān)重要了,無論是對電子商務(wù)還是廣告,對所有人來說數(shù)據(jù)分析都是最重要的事情。Swarm64是英特爾的一個合作伙伴,它就使用了我們最新的FPGA大量處理一些并行的數(shù)據(jù),實(shí)現(xiàn)了很好的吞吐量,也有比較好的能耗和更高的性能。
Swarm64這個可擴(kuò)展的數(shù)據(jù)加速器是一個無縫的插件,能夠讓我們常用的一些數(shù)據(jù)庫可以處理一些高速的大數(shù)據(jù),無論是在云里面,還是在現(xiàn)場,它都可以支持任何的配置。另外,這也是一個很好的內(nèi)聯(lián)加速的例子,我們可以把數(shù)據(jù)存儲在數(shù)據(jù)庫之前先進(jìn)行壓縮和處理??梢钥吹椒治瞿芰κ且郧暗?倍,數(shù)據(jù)倉庫能力是以前的2倍,存儲壓縮的能力是以前的3倍。
另外一個例子是基因測序,可以看到這個數(shù)據(jù)量非常大,也非常復(fù)雜,基本上是分析能力跟不上,所以說很多的研究項(xiàng)目被迫推遲。為此,英特爾和Broad Institute共同開發(fā)出了一個叫基因分析的工具,GATK,這是一個用于基因分析的軟件工具包,Broad Institute開發(fā)出來,主要是用于分析大吞吐量測序的數(shù)據(jù)。英特爾幫助Broad Institute加速了它的Pair-HMM提高了50倍,整個通道能力提高了2.2倍,幫助實(shí)現(xiàn)了DNA測序方面取得了很大的突破。
NVMe代表的是非易失性儲存器的規(guī)范。它是針對NVND的閃存和下一代固態(tài)的儲存技術(shù),這也是一個內(nèi)件加速的例子,不是在軟件里面進(jìn)行處理,數(shù)據(jù)是在硬件里面通過FPGA來進(jìn)行處理和加速的,然后再進(jìn)入到Ethernet Fabric,這個基于FPGA的解決方案相比我們之前的解決方案,可以在讀寫速度的時延方面降低57-72%。
下圖是英特爾提供的一系列的產(chǎn)品,可以看到,Stratix 10最新的產(chǎn)品有樣片了,Arria 10的終端系列產(chǎn)品已經(jīng)在全面生產(chǎn)了,Cyclone 10和Max 10已經(jīng)大量出貨。
下一代FPGA
Rina Raman女士跟21ic記者介紹到,下一代FPGA的產(chǎn)品叫做Falcon Mesa,這是英特爾下一代基于10納米制程的新的Falcon Mesa產(chǎn)品。“可以看到它是使用了英特爾10納米的制程技術(shù),基于世界上最先進(jìn)的一個FinFET制程的技術(shù),這是我們第二代使用HyperFlex架構(gòu)產(chǎn)品,也是第二代基于EMIB的異構(gòu)的SIP。EMIB實(shí)際上是英特爾接口的規(guī)范。新的產(chǎn)品也會支持下一代的HBM,現(xiàn)在Stratix 10也支持HBM,可以看到它的轉(zhuǎn)換速率可以達(dá)到112G。另外我們還支持PC/IE兼4×16的支持,就意味著支持的帶寬能夠達(dá)到16TB。”這是Alter并入英特爾后開發(fā)出的第一代使用了英特爾10納米制程技術(shù)開發(fā)出來的產(chǎn)品。
猶記得,當(dāng)年英特爾收購Alter的新聞曾轟動業(yè)界,如今,經(jīng)過整合之后,兩家公司優(yōu)勢互補(bǔ),擁有了更強(qiáng)的能力,如Stratix 10獲得了英特爾領(lǐng)先業(yè)界3年的制程技術(shù),給我們帶來了更大的容量和更快的速度。“英特爾的制程技術(shù)是全球最創(chuàng)新的、最領(lǐng)先的技術(shù),我們也是把它的制程技術(shù)用于我們Falcon Mesa的生產(chǎn)和制造。”Rina Raman女士說到。
同時,英特爾還提供了加速堆棧,這能夠幫助開發(fā)人員輕松入門。
可以看到,英特爾給我們帶來的能力包括強(qiáng)大的封裝能力,制程的技術(shù)和光學(xué)方面的技術(shù),包括我們可以獲得它開發(fā)的工具、處理器和它的合作伙伴的生態(tài)系統(tǒng),這個實(shí)際上我們也可以幫助實(shí)現(xiàn)硬件和軟件編程的統(tǒng)一。
在這個過程中,intel也面臨著三個方面的轉(zhuǎn)型,Rina Raman女士跟21icj記者分享到:一是我們可以連接到網(wǎng)絡(luò)處理器和存儲器方面能帶來最高的性能,以及最高的FPGA的Fabric的性能。二是我們可以通過一些先進(jìn)的制程技術(shù)、先進(jìn)的冷卻技術(shù)和異構(gòu)的整合,帶來很好的功耗方面的降低。三是我們也使傳統(tǒng)的FPGA設(shè)計(jì)工具的生產(chǎn)力有很大的提高,讓更多的軟件開發(fā)者可以獲得、了解我們相關(guān)的一些框架和內(nèi)容。
“我們面臨的挑戰(zhàn)是非常復(fù)雜的,面對這樣的復(fù)雜性,可能需要不同的解決方案來應(yīng)對挑戰(zhàn)。英特爾認(rèn)為FPGA能夠幫助我們加速計(jì)算,幫助我們更好地應(yīng)對今天以及未來數(shù)據(jù)的需求。”Rina Raman女士最后說到。