亞馬遜云科技: 如何讓云上工作負(fù)載的算力性價(jià)比提升兩位數(shù)百分比
北京2023年8月11日 /美通社/ -- 即便是以"燒錢"著稱的一級(jí)方程式比賽(F1),也要為算力性價(jià)比做打算,作為全球最負(fù)盛名的賽車比賽之一, F1在計(jì)算流體力學(xué)(CFD)模擬的支持下實(shí)現(xiàn)那些令賽車迷血脈賁張的"地表最快賽車"和數(shù)百公里時(shí)速下的輪對(duì)輪對(duì)決。
幾年前,F(xiàn)1將其CFD模擬遷移至亞馬遜云科技的高性能計(jì)算(HPC)平臺(tái),并引入基于Amazon Graviton2處理器的Amazon EC2 C6gn實(shí)例。這不僅使CFD模擬時(shí)間大幅縮短,還使成本降低了30%。隨著基于新一代Amazon Graviton3處理器的Amazon EC2 C7g實(shí)例的推出,F(xiàn)1又成為該實(shí)例首批使用的用戶之一。F1首席技術(shù)官Pat Symonds表示"在同樣的模擬中,基于Graviton3的C7g實(shí)例比C6gn實(shí)例快了40%。我們期待Graviton3成為運(yùn)行所有CFD工作負(fù)載的最佳選擇。"
這代表了眾多涉及算力需求的企業(yè)與機(jī)構(gòu)用戶的訴求——在算力作為基本資源的數(shù)字經(jīng)濟(jì)時(shí)代,其性能與成本對(duì)其業(yè)務(wù)的影響與日俱增。高性價(jià)比的算力,往往是用戶選擇云計(jì)算的根本出發(fā)點(diǎn)之一。人工智能(AI)、機(jī)器學(xué)習(xí)(ML)等應(yīng)用不斷加劇算力供需和成本之間的矛盾。在云端獲得更加高性價(jià)比的算力不僅是用戶永恒不變的追求,也成了云計(jì)算供應(yīng)商的核心要?jiǎng)?wù)。
深入底層,Amazon Nitro變革云計(jì)算的性價(jià)比
亞馬遜云科技首席執(zhí)行官 Adam Selipsky 曾表示:"如果希望針對(duì)所有可能的工作負(fù)載徹底變革計(jì)算的性價(jià)比,還需要徹底重新思考實(shí)例。為了實(shí)現(xiàn)這個(gè)目標(biāo),我們需要深入底層技術(shù)直達(dá)芯片。"
為了打破傳統(tǒng)底層架構(gòu)的性價(jià)比桎梏,亞馬遜云科技早在十年前就走上了"自研芯片"之路,開(kāi)始在基礎(chǔ)設(shè)施底層針對(duì)云環(huán)境進(jìn)行"量體裁衣"的技術(shù)創(chuàng)新。亞馬遜云科技在2013年推出云服務(wù)器虛擬化引擎Amazon Nitro系統(tǒng),并于2015年收購(gòu)Annapurna Labs之后便駛?cè)?quot;自研芯片"的快車道,逐漸形成由Amazon Nitro系統(tǒng)、云原生處理器Amazon Graviton、機(jī)器學(xué)習(xí)訓(xùn)練Amazon Trainium芯片和機(jī)器學(xué)習(xí)推理Amazon Inferentia芯片組成的幾大路徑,并進(jìn)行快速迭代。
Nitro創(chuàng)新的將網(wǎng)絡(luò)、存儲(chǔ)、管理、安全和監(jiān)控的功能卸載到專用的硬件來(lái)完成,從底層變革了云計(jì)算的性價(jià)比。作為Amazon EC2實(shí)例的基礎(chǔ)平臺(tái),Nitro不但將硬件的幾乎所有計(jì)算資源都提供給實(shí)例,其模塊化的設(shè)計(jì)在加快實(shí)例設(shè)計(jì)與交付的同時(shí),還能與Graviton結(jié)合,進(jìn)一步為客戶工作負(fù)載提供更加性價(jià)比。例如,基于Gravtion2的Amazon EC2 I4g實(shí)例,在Nitro SSD 作為 NVMe 高性能存儲(chǔ)的加持下,與上一代存儲(chǔ)優(yōu)化型實(shí)例相比I/O 延遲降低多達(dá) 60%,延遲抖動(dòng)降低多達(dá) 75%,與類似的基于x86的存儲(chǔ)優(yōu)化型實(shí)例相比,計(jì)算性能提高達(dá) 15%。
更進(jìn)一步,Amazon Graviton持續(xù)突破云計(jì)算性價(jià)比
Nitro拉開(kāi)了亞馬遜云科技定制芯片的大幕,隨后的云原生處理器Amazon Graviton則更進(jìn)一步,打破原有的云計(jì)算算力成本規(guī)則。Graviton處理器基于ARM架構(gòu),相比X86架構(gòu),其在架構(gòu)與設(shè)計(jì)理念上完全為適應(yīng)多用戶的公有云環(huán)境而生,具有成本低和核心密度高等特性。例如在性能分配上,與x86在單物理核心運(yùn)行多個(gè)虛擬處理器(vCPU)不同,Graviton處理器的每個(gè)vCPU都獨(dú)占一個(gè)物理核心,這樣的設(shè)計(jì)從硬件層面就避免了云端高并發(fā)任務(wù)時(shí)爭(zhēng)奪vCPU性能的情況,使不同用戶都能獲得穩(wěn)定且一致的vCPU算力。
從2018年問(wèn)世至今,Graviton處理器進(jìn)行了三次重大迭代,每一代Graviton都保持著大幅度的性能提升。其中,2020年推出的Graviton2與第一代Graviton相比,處理器性能提升7倍、計(jì)算核心數(shù)量多達(dá)4倍、緩存達(dá)到2倍、內(nèi)存速度達(dá)到5倍。2021年推出的Graviton3,單核性能比Graviton2又提升25%,浮點(diǎn)性能提升2倍,并首次在云計(jì)算芯片中采用性能更強(qiáng)、功耗更低的DDR5內(nèi)存;Graviton3的能效也更高,在相同性能下,與同類型EC2實(shí)例對(duì)比,可節(jié)省高達(dá)60%的能源消耗。
去年年底,亞馬遜云科技又發(fā)布了專門對(duì)浮點(diǎn)和向量指令運(yùn)算進(jìn)行了優(yōu)化的Graviton3E,聚焦于為CFD、天氣模擬、基因組學(xué)和分子動(dòng)力學(xué)等高性能計(jì)算工作負(fù)載提供性能優(yōu)化與更優(yōu)性價(jià)比。Graviton3的推出又一次刷新前代產(chǎn)品的性價(jià)比表現(xiàn),很多獲益于Graviton2的客戶都表示愿意積極嘗試。在基于Graviton3的Amazon EC2 C7g實(shí)例尚處在預(yù)覽階段時(shí),Twitter就對(duì)其進(jìn)行了多項(xiàng)工作負(fù)載基準(zhǔn)測(cè)試,最終發(fā)現(xiàn)C7g實(shí)例相較于基于Graviton2的C6g有著20%-80%的性能提升,同時(shí)還將尾部延遲降低了35%。
Graviton3 以及Graviton3E處理器的推出,進(jìn)一步體現(xiàn)了亞馬遜云科技自研芯片與傳統(tǒng)架構(gòu)不同的算力升級(jí)理念。Graviton3在并未大幅改變處理器主頻的前提下,轉(zhuǎn)而依托高效的數(shù)據(jù)并行和指令并行,可在單位時(shí)間內(nèi)執(zhí)行兩倍于前代產(chǎn)品的指令和數(shù)據(jù)處理,還采用了更具性價(jià)比的Chiplet封裝,不但大幅提升了執(zhí)行效率,并保持了良好的能效比。
Amazon Graviton規(guī)?;瘧?yīng)用帶來(lái)廣泛的系統(tǒng)及軟件支持
基于Graviton處理器的Amazon EC2實(shí)例在Graviton2推出后快速增加,目前基于Graviton2的實(shí)例就有100多個(gè),涵蓋通用、計(jì)算優(yōu)化型、內(nèi)存優(yōu)化型、存儲(chǔ)優(yōu)化型、加速計(jì)算型等10多個(gè)種類,為客戶廣泛的工作負(fù)載提供極佳的算力性價(jià)比,成為眾多客戶在亞馬遜云科技獲得大規(guī)模云端算力的全新可選項(xiàng)。
為了讓客戶更輕松、方便的獲得Graviton帶來(lái)的算力性價(jià)比優(yōu)勢(shì),亞馬遜云科技進(jìn)一步將客戶常用的托管服務(wù)運(yùn)行在Graviton2之上,包括Amazon Relational Database Service、Amazon Aurora、Amazon ElastiCache、Amazon MemoryDB for Redis、Amazon OpenSearch、Amazon EMR、Amazon Elastic Kubernetes Service和Amazon Lambda等。目前運(yùn)行在Graviton2之上的亞馬遜云科技托管服務(wù)已有20多種,這一數(shù)字還在基于客戶需求持續(xù)增加。托管服務(wù)大幅降低了客戶將應(yīng)用遷移到 Graviton的復(fù)雜度,時(shí)間可以從幾天降低到幾分鐘,而且轉(zhuǎn)移到Graviton實(shí)例上即可實(shí)現(xiàn)高達(dá)40%的性價(jià)比提升。
同時(shí),Graviton處理器的規(guī)模化應(yīng)用為全行業(yè)帶來(lái)如漣漪擴(kuò)散般的連鎖效應(yīng)——越來(lái)越多的系統(tǒng)與軟件,如大多數(shù)流行的 Linux 操作系統(tǒng)(包括 Amazon Linux 2、Red Hat Enterprise Linux、SUSE 和 Ubuntu 等)都支持Graviton;由亞馬遜云科技和第三方軟件供應(yīng)商提供的,適用于安全、監(jiān)控與管理、容器以及持續(xù)集成和交付 (CI/CD) 的很多熱門應(yīng)用程序和服務(wù)也支持基于Graviton處理器的實(shí)例。廣泛的系統(tǒng)及軟件對(duì)Graviton的支持,讓客戶可根據(jù)業(yè)務(wù)所需進(jìn)行自由靈活的選擇,讓其更廣泛的工作負(fù)載受益。
不止芯片創(chuàng)新,亞馬遜云科技整體硬件創(chuàng)新為客戶帶來(lái)可持續(xù)的算力
從初代Graviton處理器問(wèn)世至今僅五年,亞馬遜云科技針對(duì)Graviton可用性及其軟硬件支持體系開(kāi)啟了 "正向螺旋式上升"。如今,使用Graviton處理器獲得更優(yōu)性價(jià)比的企業(yè)和機(jī)構(gòu)已覆蓋幾乎所有涉及云計(jì)算的主流行業(yè)。亞馬遜云科技的持續(xù)創(chuàng)新,遠(yuǎn)不局限于基于ARM架構(gòu)的Graviton處理器,還包括實(shí)現(xiàn)虛擬化平臺(tái)底座的Nitro系統(tǒng)、機(jī)器學(xué)習(xí)加速處理芯片、服務(wù)器硬件以及數(shù)據(jù)中心基礎(chǔ)設(shè)施在內(nèi)的整體創(chuàng)新。未來(lái),隨著Graviton處理器的不斷升級(jí),亞馬遜云科技將進(jìn)一步讓客戶簡(jiǎn)單、快捷地獲得更佳性能、更優(yōu)成本以及可持續(xù)的算力。