核心?制程?性價(jià)比?當(dāng)我們?cè)谡勊懔r(shí),到底在討論什么?
有人說(shuō)這是智能時(shí)代,有人說(shuō)這是數(shù)據(jù)的時(shí)代,有人說(shuō)這是云時(shí)代……但無(wú)論我們?nèi)绾味x當(dāng)下與未來(lái),算力卻總是一個(gè)繞不開(kāi)的話題。但當(dāng)我們?cè)谟懻撍懔Φ臅r(shí)候,我們究竟在談什么?是幾nm的制程?是多少GHz、多少L3緩存?是多少核心、多少線程?這些都對(duì),但也都不對(duì)。
沒(méi)有先進(jìn)的制程,再頂尖的科學(xué)家也無(wú)法用少量的晶體管完成復(fù)雜計(jì)算;沒(méi)有更高的頻率和更大的緩存,再高效結(jié)構(gòu)也無(wú)法轉(zhuǎn)化為強(qiáng)大的計(jì)算能力;但對(duì)于實(shí)際的算力來(lái)說(shuō),這些都只是表象。真正的算力,是云數(shù)據(jù)中心里能跑多少應(yīng)用,是超算中心里的科學(xué)家能夠多快獲得結(jié)果,是用戶能夠把經(jīng)歷集中在業(yè)務(wù)和應(yīng)用之上。
英特爾處理器
還有哪些核心競(jìng)爭(zhēng)力?
眾所周知,英特爾在挑戰(zhàn)新制程的道路上遇到了一些困難。這使得英特爾很難在兼顧功耗、良率及芯片面積的情況下,在晶片之上集成更多的晶體管。相應(yīng)的,也就無(wú)法構(gòu)建更多核心、更多線程。這的確給英特爾繼續(xù)挑戰(zhàn)更高的處理器性能帶來(lái)了麻煩,但實(shí)際的情況卻遠(yuǎn)非如此簡(jiǎn)單。
硬件的性能需要依靠軟件來(lái)體現(xiàn),而軟件層面的優(yōu)化則直接關(guān)系到硬件的性能。舉個(gè)例子,2000年,索尼推出的PS2主機(jī)使用的Emotion?Engine處理器使用180nm制程,包含1050萬(wàn)個(gè)晶體管,每秒能夠生成6600萬(wàn)個(gè)多邊形(概括系統(tǒng)3D能力的核心指標(biāo)之一);同年英偉達(dá)發(fā)布的GeForce?2?Ultra使用同樣的工藝制程,包含2500萬(wàn)個(gè)晶體管,理論上每秒?yún)s只能生成3100萬(wàn)個(gè)多邊形。前者運(yùn)行著定制的操作系統(tǒng),并且軟件都由專門的開(kāi)發(fā)機(jī)進(jìn)行開(kāi)發(fā);而后者則面向PC市場(chǎng),運(yùn)行在Windows環(huán)境中。
當(dāng)然,如此簡(jiǎn)單粗暴的對(duì)比索尼EE處理器和英偉達(dá)顯卡的每秒多邊形生成率并沒(méi)有太大的實(shí)際意義,但這也足以說(shuō)明軟件優(yōu)化的意義。
誠(chéng)然,我們無(wú)法要求今日的商用系統(tǒng)全部運(yùn)行經(jīng)過(guò)深度定制開(kāi)發(fā)的操作系統(tǒng)和應(yīng)用軟件,但細(xì)致且廣泛的調(diào)優(yōu)仍舊關(guān)系到硬件最終性能及用戶價(jià)值的體現(xiàn)。
回到今日的主題,當(dāng)我們?cè)诳吹接⑻貭栍龅降姆N種問(wèn)題時(shí),我們也應(yīng)當(dāng)注意到,英特爾始終在投入更多的人力和資源于軟件及系統(tǒng)的優(yōu)化之上。而通過(guò)這些優(yōu)化,英特爾所獲得不僅是一個(gè)個(gè)用戶的認(rèn)可,更是海量用戶價(jià)值的體現(xiàn)。
開(kāi)放的云服務(wù)提供商
開(kāi)放的選擇
在處理器廠商的各類客戶群中,CSP絕對(duì)是一個(gè)十分特殊的存在。CSP的價(jià)值在于向外界提供高性價(jià)比的基礎(chǔ)設(shè)施類服務(wù);換句話說(shuō),如何以更低的價(jià)格對(duì)外提供更多服務(wù)是CSP的核心盈利模式。這意味著,CSP對(duì)于性能是十分敏感的。當(dāng)兩款處理器價(jià)格持平,那么CSP會(huì)毫不猶豫的選擇算力更高的那一款。
青云QingCloud是國(guó)內(nèi)一家特色十分鮮明的CSP,堅(jiān)持中立可靠的為客戶提供云計(jì)算服務(wù)。但是相對(duì)于財(cái)大氣粗的BAT,青云QingCloud更在乎基礎(chǔ)設(shè)施的性價(jià)比。同時(shí),青云QingCloud對(duì)于基礎(chǔ)架構(gòu)中計(jì)算平臺(tái)的選擇也始終保持開(kāi)放態(tài)度,任何能夠提供優(yōu)勢(shì)性價(jià)比的產(chǎn)品都會(huì)成為青云QingCloud未來(lái)基礎(chǔ)架構(gòu)的選項(xiàng)。所以,對(duì)于不同的計(jì)算平臺(tái),青云QingCloud不僅始終保持關(guān)注,更會(huì)通過(guò)不斷的對(duì)比測(cè)試來(lái)決定下一次升級(jí)的對(duì)象。
顯然,對(duì)于此時(shí)的英特爾,想要拿下青云QingCloud,難度自然不小。但就在大家都以為青云QingCloud會(huì)選擇目前外界呼聲更高的對(duì)手產(chǎn)品時(shí),英特爾卻再次成為其采購(gòu)對(duì)象。在這一結(jié)果的背后,則是英特爾戰(zhàn)略客戶支持部門的大力支持。
2020年1月,青云QingCloud在測(cè)試后認(rèn)為對(duì)手產(chǎn)品在一些場(chǎng)景中的性能表現(xiàn)要優(yōu)于英特爾。但在英特爾戰(zhàn)略客戶支持部門的努力下,英特爾軟件工程團(tuán)隊(duì)對(duì)青云QingCloud的軟件測(cè)試環(huán)境進(jìn)行了細(xì)致的調(diào)優(yōu),而經(jīng)過(guò)調(diào)優(yōu)后的測(cè)試結(jié)果則完全逆轉(zhuǎn)。最終,開(kāi)放的青云QingCloud在對(duì)自身軟件環(huán)境進(jìn)行調(diào)整后仍舊選擇了英特爾的產(chǎn)品。
另一方面,在英特爾團(tuán)隊(duì)的協(xié)助下,青云QingCloud還上線了基于英特爾至強(qiáng)處理器的AI推理業(yè)務(wù),直接擴(kuò)展了青云QingCloud的服務(wù)目錄,讓青云QingCloud能夠更快的加入普惠AI的大潮,在競(jìng)爭(zhēng)中不落人后。同時(shí),青云QingCloud也是首個(gè)將傲騰產(chǎn)品應(yīng)用在企業(yè)級(jí)存儲(chǔ)的緩存層中的CSP,在成本平衡的前提下實(shí)現(xiàn)了更好的性能。
對(duì)于英特爾平臺(tái)所帶來(lái)的一系列應(yīng)用新體驗(yàn)和新業(yè)務(wù),青云QingCloud供應(yīng)鏈總監(jiān)廖洋直言不諱:作為CSP,青云QingCloud不僅關(guān)注硬件的采購(gòu)成本,更關(guān)注硬件在使用和對(duì)外服務(wù)過(guò)程中的成本。而英特爾對(duì)于青云QingCloud的關(guān)注、溝通及服務(wù)不僅讓彼此之間形成了深度的默契,更幫助青云QingCloud解決了業(yè)務(wù)層面的諸多實(shí)際問(wèn)題。
而對(duì)于青云QingCloud,英特爾也通過(guò)自身真金白銀的服務(wù)付出換來(lái)了客戶選擇與信賴。
如果說(shuō)云計(jì)算是讓大量的資源去服務(wù)更大量的用戶,那么與之相對(duì)的便是HPC領(lǐng)域的用大量資源去滿足幾個(gè)應(yīng)用的需求。在算力應(yīng)用的道路上,云和超算,一個(gè)向左,一個(gè)向右。但在對(duì)用戶的支持方面,英特爾的支持卻是一以貫之的。
與前面的CSP不同,HPC的用戶多為高校和科研機(jī)構(gòu)。如果說(shuō)以CSP為代表的企業(yè)用戶對(duì)算力的追求是全生命周期的極致性價(jià)比,那么以高校和科研單位為主的HPC用戶群則更關(guān)注算力的絕對(duì)性能和在專業(yè)領(lǐng)域的支持。因?yàn)樵谠浦?,算力是以各種高度模板化的服務(wù)列表來(lái)呈現(xiàn)的;而在科研類應(yīng)用之中,HPC很可能昨天還在處理氣象問(wèn)題,今天就需要轉(zhuǎn)戰(zhàn)重金屬污染的防治。不確定的應(yīng)用方向,不確定的計(jì)算規(guī)?!ㄒ淮_定的是,HPC的用戶需要更多支持與幫助。
清華大學(xué)、中南大學(xué),前者是如雷貫耳的中國(guó)頂級(jí)學(xué)府,后者則是擁有6個(gè)國(guó)家一級(jí)重點(diǎn)學(xué)科、12個(gè)二級(jí)重點(diǎn)學(xué)科的知名高校。而為了方便科研,兩所高校同樣也是HPC的老用戶。
在傳統(tǒng)的商業(yè)領(lǐng)域,很多成熟的應(yīng)用都有龐大的開(kāi)發(fā)支持和用戶基礎(chǔ),軟硬件的適配能夠獲得很好的保障。但在超算領(lǐng)域,應(yīng)用的開(kāi)發(fā)者和使用者都是小眾用戶,能夠理解業(yè)務(wù)和軟件邏輯的人少之又少,針對(duì)硬件變化的軟件優(yōu)化也就更少。因此,無(wú)論使用這些軟件的是本科生、研究生還是博士生,軟件的優(yōu)化都需要有專業(yè)人員的支持。
另一方面,從硬件的構(gòu)成方面,不同的高校和科研機(jī)構(gòu)也有不同的傾向。以清華大學(xué)為例,在其擁有的包含近2000個(gè)節(jié)點(diǎn)的超算系統(tǒng)中包含800多個(gè)Westmere-EX架構(gòu)節(jié)點(diǎn)(2010年興建)、200多個(gè)Broadwell架構(gòu)節(jié)點(diǎn)(2016年興建)和900多個(gè)Cascade?Lake架構(gòu)節(jié)點(diǎn)。顯然,清華大學(xué)的超算建設(shè)思路屬于“常用常新”的滾動(dòng)建設(shè)型。而中南大學(xué)則直接使用了新的Cascade?Lake架構(gòu)至強(qiáng)Gold?6248R構(gòu)建了1000多個(gè)節(jié)點(diǎn)。顯然,中南大學(xué)屬于“一步到位”型。
而無(wú)論采用哪種建設(shè)思路,從最開(kāi)始的架構(gòu)設(shè)計(jì)到處理器具體型號(hào)選擇,到供應(yīng)商設(shè)備再到最后的應(yīng)用移植與調(diào)整優(yōu)化;英特爾都全程參與。
對(duì)此,清華大學(xué)高性能計(jì)算中心張武生老師舉了一個(gè)生動(dòng)的例子:在超算的使用過(guò)程中,清華發(fā)現(xiàn)在某一個(gè)應(yīng)用上英特爾處理器的計(jì)算結(jié)果與其他平臺(tái)不一致。在得知這一消息后英特爾第一時(shí)間調(diào)集全球研發(fā)力量進(jìn)行響應(yīng),并最終找到了原因、對(duì)硬件進(jìn)行了修正。而在另外一個(gè)要求實(shí)時(shí)性、高帶寬、高IO的金融類研究項(xiàng)目中,由于計(jì)算模式不一樣,清華在實(shí)際的研究過(guò)程中遇到了很大困難。英特爾得知之后更第一時(shí)間為清華提供了全新的測(cè)試平臺(tái),保證了實(shí)驗(yàn)的進(jìn)度;整個(gè)過(guò)程只用了兩三周時(shí)間。響應(yīng)及時(shí),支持到位。
對(duì)于英特爾的支持,中南大學(xué)鄒有老師則表示:英特爾平臺(tái)有著完整的編譯器和文檔支持,軟件的開(kāi)發(fā)和移植都能夠比較方便的展開(kāi)。同時(shí),英特爾對(duì)客戶實(shí)際應(yīng)用中的真實(shí)需求有著很深的理解,并提供了眾多的培訓(xùn)項(xiàng)目,幫助學(xué)校的老師和同學(xué)提升了深度學(xué)習(xí)方面的能力。而這些軟硬件和技術(shù)層面的開(kāi)放性使得英特爾成為了一個(gè)更方便使用的平臺(tái)。
作為一種高精尖的IT應(yīng)用,對(duì)超算有需求的也絕不止清華、中南大學(xué)這樣的頂尖學(xué)府,更有廣泛的其他企業(yè)、高效和研究機(jī)構(gòu)。如果每個(gè)單位在遇到HPC需求時(shí)都以自建的形式來(lái)滿足,那么無(wú)論從經(jīng)濟(jì)成本還是時(shí)間成本來(lái)看,很多研究都是無(wú)法繼續(xù)的。因此,更合理的解決方案就是讓超算具備對(duì)外提供服務(wù)的能力,換句話說(shuō)就是“超算云”。
并行科技是一家專注于高性能軟件開(kāi)發(fā)、服務(wù)的公司;而超算云則是并行科技近幾年的戰(zhàn)略發(fā)展重點(diǎn)。相較于自建超算的高?;蚱渌芯繖C(jī)構(gòu),作為一家商業(yè)公司,并行科技在超算建設(shè)方面更注重系統(tǒng)的性價(jià)比——讓硬件以更高的效率為高性能應(yīng)用服務(wù)。
在底層硬件領(lǐng)域,并行科技一方面在基于英特爾Cascade?Lake-AP架構(gòu)處理器構(gòu)建自營(yíng)硬件平臺(tái),另一方面也在積極聯(lián)系擁有超算系統(tǒng)的高校和科研機(jī)構(gòu),使之能夠?qū)㈤e時(shí)的計(jì)算資源貢獻(xiàn)出來(lái),為其他用戶服務(wù),獲得更多資金以支持教學(xué)科研發(fā)展。
而在軟件平臺(tái)層,并行科技則基于英特爾系列處理器的硬件特點(diǎn)開(kāi)發(fā)了高效且靈活的超算云OS,在實(shí)現(xiàn)用戶管理和計(jì)費(fèi)功能的同時(shí),也讓平臺(tái)能夠充分調(diào)動(dòng)底層硬件資源實(shí)現(xiàn)更具效率的計(jì)算。當(dāng)然,并行科技的超算云還將常用的、經(jīng)過(guò)細(xì)致優(yōu)化的超算應(yīng)用以服務(wù)目錄的形式提供給用戶,免去用戶軟件部署和調(diào)優(yōu)的麻煩。
與此同時(shí),并行科技還聯(lián)手英特爾每年舉辦并行編程大賽,在高校中普及高性能計(jì)算編程技巧和方法,為超算領(lǐng)域的持續(xù)發(fā)展培養(yǎng)更多的跨界編程人才。
當(dāng)我們?cè)诹乃懔r(shí)
我們到底在討論什么?
伴隨社會(huì)與商業(yè)的數(shù)字化,算力已經(jīng)成為支持社會(huì)、科研和商業(yè)的不可或缺的基礎(chǔ)設(shè)要素。而這一要素更要在軟件應(yīng)用當(dāng)中體現(xiàn)其具體價(jià)值。再?gòu)?qiáng)大的算力也需要配套的應(yīng)用和優(yōu)化,才能充分發(fā)揮效能。
因此,當(dāng)我們?cè)诹乃懔r(shí),我們所說(shuō)的不僅僅是制程、核數(shù)、頻率,更是算力之上的軟件以及算力背后的優(yōu)化、服務(wù)與長(zhǎng)期的支持。
在這些方面,英特爾對(duì)用戶的重視與支持毋庸置疑;以“客戶至上”作為公司的價(jià)值觀,英特爾一直在深入各行各業(yè),緊密聆聽(tīng)客戶的心聲,從推動(dòng)應(yīng)用落地的角度有針對(duì)性地對(duì)產(chǎn)品和解決方案策略進(jìn)行調(diào)整。而在此之外,英特爾還提供了軟件、內(nèi)存與存儲(chǔ)、網(wǎng)絡(luò)、安全等多種配套技術(shù)。加之架構(gòu)、制程與封裝,英特爾圍繞數(shù)據(jù)價(jià)值所構(gòu)建的六大支柱正在成為各行各業(yè)用戶實(shí)現(xiàn)價(jià)值方便捷徑。
而隨著算力需求和以英特爾為代表的ICT企業(yè)的技術(shù)發(fā)展,在聊算力時(shí),我們討論的話題還可以更多。
【IT葡萄皮】(公眾號(hào):itopics)由資深媒體人張垞運(yùn)營(yíng)。從業(yè)十二年的深度觀察,只為一篇不吐不快的科技評(píng)論。
聯(lián)系方式
電話:18612920630
電子郵件:69240891@163.com
微信:z87136954
QQ:87136954
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!