浪潮發(fā)布新版AIStation人工智能推理服務(wù)平臺
(全球TMT2021年9月23日訊)9月17日,在蘇州舉行的第四屆全球人工智能產(chǎn)品應(yīng)用博覽會(AIExpo2021)上,浪潮發(fā)布了新版AIStation人工智能推理服務(wù)平臺。

浪潮AIStation是人工智能開發(fā)服務(wù)平臺,可支持超過數(shù)千節(jié)點AI服務(wù)器的超大規(guī)模人工智能集群調(diào)度管理?;谌萜骰夹g(shù)簡化算力調(diào)度過程,幫助用戶擺脫在大規(guī)模AI計算集群中進行算力選擇、算力適配等繁雜工作,提高調(diào)度效率。實現(xiàn)資源敏捷調(diào)配,使得資源利用率得以大幅提升;強大的平臺調(diào)度機制可以應(yīng)對需求突發(fā)場景在幾分鐘內(nèi)自動完成服務(wù)擴容;支持多源模型統(tǒng)一部署,模型部署時間從數(shù)天縮短到幾分鐘,從而實現(xiàn)業(yè)務(wù)快速上線。AIStation可支持百萬級高并發(fā)的大規(guī)模AI推理服務(wù)場景,服務(wù)響應(yīng)平均延遲低于1ms。
浪潮此次發(fā)布的新版AIStation推理服務(wù)平臺實現(xiàn)了對英偉達、寒武紀、昆侖芯、高通等6家國際國內(nèi)廠商的12款AI和GPU芯片的多元算力支持。AI芯片可通過適配浪潮提供的AI芯片算力接入規(guī)范即可快速接入AIStation平臺,幫助用戶降低對多元AI芯片的使用和管理難度。AIStation平臺實現(xiàn)多元算力的統(tǒng)一管理及調(diào)度,為生產(chǎn)環(huán)境算力運行提供一致的監(jiān)管功能,對GPU、MLU、XPU等AI芯片的性能狀況、AI業(yè)務(wù)流量及響應(yīng)延時進行實時監(jiān)控,并根據(jù)監(jiān)控數(shù)據(jù)進行分析、決策、執(zhí)行操作,實現(xiàn)服務(wù)算力的自動調(diào)節(jié)、自適應(yīng)推理業(yè)務(wù)突發(fā)資源擴展需求。
AIStation是業(yè)界首個支持多元AI芯片算力的人工智能服務(wù)平臺,打通了多元AI芯片從接入、管理、調(diào)度、適配到應(yīng)用的路徑,通過構(gòu)建AI芯片算力接入規(guī)范實現(xiàn)多元算力的標準化管理,為產(chǎn)業(yè)AI化和智算中心建設(shè)提供高效便捷的AI算力調(diào)度,讓AI應(yīng)用和AI服務(wù)更便捷,助力用戶充分使用多元算力實現(xiàn)AI技術(shù)創(chuàng)新和落地。目前,浪潮AIStation推理服務(wù)平臺已在諸多客戶獲得成功應(yīng)用,在新基建、互聯(lián)網(wǎng)、金融、保險、交通、手機通信、智能汽車、智慧城市等多個AI場景發(fā)揮著重要作用。