為高頻交易而生的加速卡,以超低時(shí)延發(fā)揮AI交易策略潛能|AMD推出Alveo UL3422金融科技加速卡
金融行業(yè)的競(jìng)爭(zhēng)日益激烈,速度和效率已經(jīng)成為決定成敗的關(guān)鍵因素。無論是銀行業(yè)、支付、保險(xiǎn)業(yè),還是證券交易、外匯、及大宗商品交易,快速準(zhǔn)確的交易執(zhí)行都是獲取收益的核心。隨著技術(shù)的進(jìn)步,尤其是電子交易的普及,高頻交易(High-Frequency Trading,HFT)逐漸成為市場(chǎng)中的重要力量。HFT以超高速的交易執(zhí)行為特色,旨在通過捕捉瞬息萬變的價(jià)格波動(dòng)獲取利潤(rùn),因此對(duì)交易速度和延遲的要求極高。對(duì)于HFT公司而言,交易速度、準(zhǔn)確性和一致性是成功的基石——最大限度地降低交易延遲不僅提升了交易的效率,還在市場(chǎng)中構(gòu)建了獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)和盈利能力。
高頻交易對(duì)基礎(chǔ)設(shè)施性能的極致要求使得硬件加速成為關(guān)鍵。為了實(shí)現(xiàn)從數(shù)據(jù)接收到交易執(zhí)行的超低延遲,HFT公司越來越多地依賴FPGA加速卡這種高效、靈活的硬件加速器。FPGA能夠在納秒級(jí)的時(shí)間內(nèi)處理復(fù)雜的交易算法,為HFT提供了強(qiáng)大的速度和一致性支持。
正是在這種需求驅(qū)動(dòng)下,AMD推出了最新的Alveo UL3422金融科技加速卡。這款加速卡不僅能夠滿足HFT對(duì)超低時(shí)延的要求,還支持硬件自檢功能,確保在實(shí)時(shí)交易中始終保持最佳狀態(tài)。
滿足高頻交易三大核心需求,AMD Alveo UL3422來了
“高頻交易就是使用算法能夠?qū)崿F(xiàn)非常迅速地從tick-to-trade這樣一個(gè)交易的特征。它使用非常復(fù)雜的算法,以及要求非常高的硬件。通常是利用市場(chǎng)上非常小的價(jià)差以及市場(chǎng)的低效,在短時(shí)高頻發(fā)生的交易,通過這樣的方式來獲得利潤(rùn)。”AMD自適應(yīng)和嵌入式計(jì)算事業(yè)部Alveo加速卡高級(jí)產(chǎn)品線經(jīng)理Shyam Chander總結(jié)到了高頻交易有三大關(guān)鍵特點(diǎn):首先是極低時(shí)延,幾微秒的延遲差異可能就意味著利潤(rùn)與虧損的天壤之別;其次是關(guān)鍵基礎(chǔ)設(shè)施,許多HFT公司通過在交易所租用服務(wù)器或部署設(shè)備實(shí)現(xiàn)服務(wù)器共置,以此確保盡可能低的交易延遲,市場(chǎng)數(shù)據(jù)的傳輸速度和設(shè)備布置也直接影響交易效率;最后是強(qiáng)大的算法,自適應(yīng)計(jì)算能夠幫助交易商優(yōu)化算法和實(shí)現(xiàn)監(jiān)管合規(guī),進(jìn)一步提升交易效率與精準(zhǔn)性。這些特點(diǎn)使HFT能夠在瞬息萬變的市場(chǎng)中占得先機(jī)。
而AMD最新推出的Alveo UL3422金融科技加速卡專為高頻交易需求設(shè)計(jì),通過FPGA加速實(shí)現(xiàn)了納秒級(jí)的超低延遲,為全球交易提供快速的tick-to-trade響應(yīng)能力。
據(jù)悉,Alveo UL3422是AMD Alveo超低時(shí)延加速卡系列的最新成員,基于前一代Alveo UL3524產(chǎn)品打造,保持了UL3524的許多核心優(yōu)勢(shì),同時(shí)優(yōu)化了性價(jià)比。Alveo UL3422具備三大優(yōu)勢(shì):首先,它采用專門設(shè)計(jì)的芯片和GTF收發(fā)器,確保在交易執(zhí)行中達(dá)到極低的延遲標(biāo)準(zhǔn);其次,其全高半長(zhǎng)的纖薄尺寸,使其具有高性價(jià)比和靈活的部署性,降低了高頻交易基礎(chǔ)設(shè)施的進(jìn)入門檻;最后,Alveo UL3422支持輕松開發(fā),用戶可借助AMD開發(fā)工具優(yōu)化性能,實(shí)現(xiàn)RTL流和硬件靈活配置,便于構(gòu)建完整的交易生態(tài)系統(tǒng)。
此外,Alveo UL3422配備的自檢(self-test)功能可在運(yùn)行過程中自動(dòng)監(jiān)測(cè)硬件狀態(tài)和性能,及時(shí)發(fā)現(xiàn)并修復(fù)異常,保障系統(tǒng)穩(wěn)定性、準(zhǔn)確性和低延遲,確保高頻交易策略的精準(zhǔn)執(zhí)行。
如上圖所示,Alveo UL3422加速卡采用纖薄小巧的設(shè)計(jì),基于Virtex? UltraScale+ VU2P FPGA單片架構(gòu),配備單一插槽并搭載專屬開發(fā)的GTF收發(fā)器,能夠?qū)崿F(xiàn)超低延遲的交易性能。其緊湊的尺寸結(jié)合高效設(shè)計(jì),配備多個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)、板載內(nèi)存及板對(duì)板連接,相較于前代Alveo UL3524產(chǎn)品具備更高的經(jīng)濟(jì)性。
此外,Alveo UL3422提供10G和25G雙網(wǎng)絡(luò)端口,支持多卡互聯(lián),并優(yōu)化了FPGA的操作能力,滿足復(fù)雜金融應(yīng)用需求??紤]到金融服務(wù)對(duì)時(shí)間精度和準(zhǔn)確性的嚴(yán)格要求,該加速卡還具備與外部單元的交互功能,確保精準(zhǔn)的時(shí)間戳標(biāo)記。
低于3ns的收發(fā)器延遲,助力20ns以下的交易執(zhí)行“超低延遲”
在“Tick-to-Trade”流程中,超低延遲基礎(chǔ)設(shè)施是實(shí)現(xiàn)高頻交易(HFT)性能的核心。從市場(chǎng)數(shù)據(jù)的接收到交易指令的執(zhí)行,每個(gè)階段都需要極致的速度和效率,這正是AMD最新的Alveo UL3422加速卡所擅長(zhǎng)的領(lǐng)域。
數(shù)據(jù)傳輸饋送系統(tǒng)是整個(gè)交易過程的起點(diǎn)。這一系統(tǒng)負(fù)責(zé)從市場(chǎng)接收實(shí)時(shí)數(shù)據(jù),包括價(jià)格變動(dòng)、交易量等關(guān)鍵信息,并將這些數(shù)據(jù)快速傳遞到下一個(gè)階段。這一環(huán)節(jié)中的數(shù)據(jù)傳輸速度至關(guān)重要,直接影響后續(xù)分析和決策的效率。超低延遲的實(shí)現(xiàn)確保了交易系統(tǒng)能夠以最快的速度響應(yīng)市場(chǎng)變化,從而獲取交易先機(jī)。
接收到的數(shù)據(jù)被迅速傳輸?shù)剿惴ń灰灼脚_(tái),該平臺(tái)通過高度復(fù)雜的算法對(duì)市場(chǎng)信息進(jìn)行實(shí)時(shí)分析和處理,生成交易指令。算法交易平臺(tái)是實(shí)現(xiàn)高頻交易的核心,要求極低的計(jì)算延遲,以確保在最短時(shí)間內(nèi)得出交易決策。
在生成交易指令后,系統(tǒng)會(huì)進(jìn)行風(fēng)險(xiǎn)控制,通過交易前風(fēng)險(xiǎn)檢查控制系統(tǒng)來驗(yàn)證指令的合規(guī)性和風(fēng)險(xiǎn)性。這個(gè)環(huán)節(jié)確保每筆交易符合監(jiān)管要求,降低系統(tǒng)性風(fēng)險(xiǎn),避免高風(fēng)險(xiǎn)交易的產(chǎn)生。對(duì)于高頻交易來說,風(fēng)險(xiǎn)控制過程需要極高的效率,以避免交易延遲,因此這一步驟也必須在極短時(shí)間內(nèi)完成,以確保交易的持續(xù)順暢。
通過風(fēng)險(xiǎn)檢查的交易指令最終被提交至交易訂單服務(wù)器(匹配引擎)進(jìn)行撮合執(zhí)行。匹配引擎根據(jù)訂單需求迅速完成交易撮合,從而實(shí)現(xiàn)訂單的即時(shí)執(zhí)行。交易訂單的撮合執(zhí)行需滿足SEC等監(jiān)管機(jī)構(gòu)的合規(guī)要求,確保交易的合法性和合規(guī)性。整個(gè)“Tick-to-Trade”流程至此完成,通過超低延遲的基礎(chǔ)設(shè)施優(yōu)化,就確保了高頻交易系統(tǒng)能夠以最快速度、最高效率在市場(chǎng)中捕捉利潤(rùn)機(jī)會(huì)。
AMD Alveo UL3422在整個(gè)“Tick-to-Trade”基礎(chǔ)設(shè)施中發(fā)揮了關(guān)鍵作用,其超低時(shí)延性能(ULL)使得它在數(shù)據(jù)傳輸、算法交易和交易前風(fēng)險(xiǎn)控制等環(huán)節(jié)中都具備卓越的加速效果。在數(shù)據(jù)傳輸階段,UL3422確保市場(chǎng)數(shù)據(jù)能夠迅速且無延遲地傳輸至算法交易平臺(tái),使系統(tǒng)能夠快速響應(yīng)市場(chǎng)變化。在算法交易平臺(tái)環(huán)節(jié),UL3422通過其FPGA加速能力高效處理復(fù)雜算法,提供納秒級(jí)的決策速度,以快速生成交易指令。接著,在交易前風(fēng)險(xiǎn)檢查階段,UL3422進(jìn)一步保障了風(fēng)險(xiǎn)控制的及時(shí)性和合規(guī)性,確保每筆交易都符合SEC等監(jiān)管要求。
據(jù)Shyam Chander介紹,AMD針對(duì)不同延遲需求和算法復(fù)雜度的交易解決方案,以支持不同的高頻交易場(chǎng)景。
· < 20 納秒的超低時(shí)延(FPGA加速):該級(jí)別適用于對(duì)執(zhí)行速度有極致要求的交易策略,例如套利。此方案使用超低延遲的FPGA硬件實(shí)現(xiàn),確保在極短時(shí)間內(nèi)完成交易執(zhí)行,幫助交易者在市場(chǎng)上獲得速度優(yōu)勢(shì)。而AMD Alveo UL3422的收發(fā)器延遲低于3ns,僅為2.34ns,與UL3524一致,因?yàn)閮烧叨疾捎昧讼嗤腉FY收發(fā)器IP。而此前UL3524創(chuàng)下的世界紀(jì)錄交易延遲僅為13.9ns。
· < 100 納秒的低時(shí)延(FPGA和自適應(yīng)SoC):此級(jí)別適合多贏家或計(jì)算密集型的交易策略。通過FPGA結(jié)合自適應(yīng)SoC的硬件架構(gòu)支持,這種方案可以更高效地執(zhí)行復(fù)雜算法,滿足多個(gè)算法密集型的需求。AMD的Alveo V80滿足的就是這方面的要求,無論是從計(jì)算還是內(nèi)存的資源方面都能夠適配相應(yīng)的交易。
· < 1000 納秒的低時(shí)延(CPU和低時(shí)延NIC):適用于需要復(fù)雜CPU計(jì)算的交易場(chǎng)景,通過CPU結(jié)合低時(shí)延網(wǎng)絡(luò)接口卡(NIC)實(shí)現(xiàn)。該方案在延遲上略高,但仍能支持復(fù)雜的計(jì)算需求,適合需要較高延遲容忍度的交易策略。像AMD Alveo X3522、CPU如EPYC和銳龍也都能夠滿足這一非常復(fù)雜的計(jì)算和交易需求。
以FPGA靈活計(jì)算為基礎(chǔ),發(fā)揮交易中的AI算法之力
隨著越來越多的交易商在交易管線中引入人工智能,AI交易策略逐漸成為金融科技領(lǐng)域的新趨勢(shì)。傳統(tǒng)上,機(jī)器學(xué)習(xí)并不是交易管線的一部分,但現(xiàn)在監(jiān)督學(xué)習(xí)和機(jī)器學(xué)習(xí)引擎正被廣泛應(yīng)用于交易流程中,盡管金融科技領(lǐng)域?qū)Υ藨?yīng)用的細(xì)節(jié)鮮有公開。然而,這一趨勢(shì)的出現(xiàn)確實(shí)展現(xiàn)了AI在提升交易效率和精度方面的潛力。在這種背景下,F(xiàn)PGA在結(jié)合AI交易策略方面具備明顯的優(yōu)勢(shì)。
據(jù)Shyam解答:首先,F(xiàn)PGA的可編程性使其能夠靈活適應(yīng)各種算法需求,實(shí)現(xiàn)利潤(rùn)最大化等不同目標(biāo),且與ASIC等硬件不同,F(xiàn)PGA能通過編程實(shí)現(xiàn)無縫連接,從而具備高度的適應(yīng)性。此外,金融科技對(duì)超低時(shí)延有著嚴(yán)格要求,F(xiàn)PGA通過其GTF收發(fā)器可實(shí)現(xiàn)20納秒以內(nèi)的數(shù)據(jù)傳輸,滿足了這一超低時(shí)延的需求。這些優(yōu)勢(shì)使FPGA成為AI交易策略的理想加速計(jì)算平臺(tái)。
“對(duì)于高頻交易商來說,他們非常專注于基礎(chǔ)設(shè)施,因?yàn)榛A(chǔ)設(shè)施是他們是否能夠盈利的關(guān)鍵?!盨hyam分享到。
從世界交易所聯(lián)合會(huì)統(tǒng)計(jì)的全球25大證券交易所的主機(jī)共置需求分布來看,為了實(shí)現(xiàn)最低時(shí)延,交易所和高頻交易商需將服務(wù)器部署在靠近交易所的數(shù)據(jù)中心。這種主機(jī)共置策略需要大量資本支出和運(yùn)營(yíng)支持,包括機(jī)架空間、電力、網(wǎng)絡(luò)連接和數(shù)據(jù)傳輸,以確保交易速度和穩(wěn)定性。同時(shí),各區(qū)域的市場(chǎng)份額分布以及基礎(chǔ)設(shè)施戰(zhàn)略對(duì)盈利能力的意義重大。
而此次最新推出的AMD Alveo UL3422具備精簡(jiǎn)優(yōu)化的設(shè)計(jì),與上一代相比提升了性價(jià)比,并且采用全高半長(zhǎng)的緊湊尺寸,非常適合1U服務(wù)器的空間需求,同時(shí)支持2U和4U服務(wù)器的靈活配置。它已在Hypertec ORION HF X410R-G6和Dell PowerEdge R640等服務(wù)器上完成了兼容性測(cè)試,能夠?qū)崿F(xiàn)高效穩(wěn)定的性能。這款加速卡針對(duì)機(jī)架空間、功耗和主機(jī)共置進(jìn)行了優(yōu)化,能夠在高密度環(huán)境中高效部署,滿足企業(yè)對(duì)低成本高性能計(jì)算加速的需求。
據(jù)悉,AMD Alveo UL3422加速卡的相關(guān)參考設(shè)計(jì)、工具與生態(tài)系統(tǒng)的IP都已經(jīng)推出,而且這款產(chǎn)品現(xiàn)在已經(jīng)在量產(chǎn)中。