GPU需求增長但費用高昂,微云服務(wù)成為企業(yè)新寵
GPU的需求如今呈現(xiàn)出極大的增長,它們對于運行和訓練生成式人工智能(GenAI)模型來說至關(guān)重要。微云(microclouds)提供的GPU服務(wù)可能成為一種可行的替代方案。微云市場規(guī)模正在快速增長。CoreWeave、Lambda Labs、Voltage Park和Together AI等企業(yè)處于微云市場的最前沿。CoreWeave最初是一家加密貨幣挖礦企業(yè),如今成功轉(zhuǎn)型成為GPU基礎(chǔ)設(shè)施的主要提供商。
這種轉(zhuǎn)變揭示了一個更廣泛的趨勢——企業(yè)正日益依賴于云托管的GPU服務(wù)。這一轉(zhuǎn)變的驅(qū)動因素主要包括安裝和維護硬件的高昂成本以及復雜的技術(shù)要求。由于公有云提供商通常不會對這些計算服務(wù)提供更多的折扣,微云為許多企業(yè)提供了更加靈活、經(jīng)濟高效的解決途徑。
為什么一些企業(yè)不再堅持使用AWS、谷歌云和微軟Azure提供的傳統(tǒng)云服務(wù)?而這些服務(wù)也提供了一系列GPU資源。其答案是“成本”。對于需要采用GPU的AI項目來說,微云通常是更具成本效益的一種解決方案。與Azure或谷歌云相比,企業(yè)在CoreWeave或其他微云平臺上租用主流的GPU(例如Nvidia A100 40GB)可以顯著降低成本。
企業(yè)采用微云仍需謹慎
盡管微云行業(yè)發(fā)展充滿活力,但其未來前景仍然存在一定的不確定性。微云供應(yīng)商保持業(yè)務(wù)增長取決于能否確保GPU的持續(xù)供應(yīng)以及維持具有競爭力的價格。此外,隨著全球主要云計算提供商投資于定制的AI處理硬件,市場競爭壓力可能會進一步加劇,大型云計算提供商將通過降低價格和提升服務(wù)質(zhì)量以保持競爭力。
此外,雖然GPU目前更適合生成式AI任務(wù),因為它們的運行速度和同時處理許多事情的能力,但并非所有AI工作負載都需要采用GPU。大多數(shù)GenAI工作負載并不需要如此強大的GPU性能。如今,它們往往更像是一種身份象征,而非必需品。
CPU仍然在處理對時間要求不太嚴格的任務(wù)中發(fā)揮著重要作用,這些任務(wù)通??梢匀萑梯^低的處理速度。芯片廠商正在積極研發(fā)一些具有發(fā)展前景的新型GPU,它們可能將以更低的成本為生GenAI提供更加高效的處理能力。
使用任何資源(包括處理器)的核心目標都是“少花錢,多辦事”。對于大多數(shù)AI用例來說,其高昂的成本將使許多企業(yè)從AI的炒作中回歸現(xiàn)實。
微云的美好未來
對于那些可能被炒作蒙蔽雙眼的企業(yè)來說,這是一個值得警惕的消息。從微云的近期發(fā)展來看,其市場呈現(xiàn)出樂觀的態(tài)勢。分析人士預計,新興的GenAI領(lǐng)域?qū)⒗^續(xù)推動對微云的需求,這為更多以GPU為中心的AI云初創(chuàng)公司提供強大的發(fā)展動力。
對于需要GPU支持的項目,企業(yè)應(yīng)該優(yōu)先考慮能夠充分利用GPU的解決方案,因為成本不是這些架構(gòu)選擇的主要決定因素。
微云提供商可能會對傳統(tǒng)云計算提供商帶來顯著的競爭壓力,特別是對于那些尋求采用更新、更經(jīng)濟的技術(shù)來管理其多云環(huán)境的客戶而言。許多企業(yè)正在面臨云計算成本高昂的挑戰(zhàn),這些成本往往超出了他們的預算。因此,更為經(jīng)濟實惠的替代品在市場上更受歡迎。
大約20年前,主要參與者開始在云計算市場嶄露頭角。在2012年到2016年期間,隨著云計算市場的逐步成熟和規(guī)范,原本數(shù)十家云計算提供商最終只剩下幾家具有顯著競爭優(yōu)勢的云巨頭。
任何新興的云計算提供商都有很多顧慮。他們可能會面臨資金短缺和市場競爭的壓力,或者經(jīng)歷無法預見的挑戰(zhàn)和災(zāi)難。這些公司在未來很可能被更大的云計算提供商收購,雖然在收購和整合過程可能會帶來一些困擾和挑戰(zhàn),但大多數(shù)公司都能實現(xiàn)更大的發(fā)展。因此,微云的未來前景依然光明,將會發(fā)揮更加重要的作用。