AI效率260倍CPU:阿里雙11大規(guī)模部署NVIDIA GPU
一年一度的雙11、雙12購物狂歡都已經(jīng)過去,而在蘇州舉辦的GTC CHINA 2019大會上,NVIDIA和阿里巴巴共同透露了一個(gè)小“秘密”—;—;原來,雙11 2684億元創(chuàng)紀(jì)錄成交額的背后,離不開NVIDIA GPU的大規(guī)模部署。
阿里巴巴異構(gòu)計(jì)算總監(jiān)徐凌杰表示,每天有超過1億購物者在阿里網(wǎng)站上瀏覽數(shù)十億種商品,在購物高峰日,阿里的系統(tǒng)每秒需要處理數(shù)十萬個(gè)查詢,而能夠保證了這一切都能正常運(yùn)行,正是AI 的功勞。
阿里引入了NVIDIA加速計(jì)算平臺,大規(guī)模部署先進(jìn)的AI技術(shù),包括Tesla T4 GPU、cuBLAS運(yùn)算庫、自定義混合精度、推理加速軟件等,通過其直觀的搜索功能和可靠的推薦,能夠支持比過去復(fù)雜6倍的模型,從而使點(diǎn)擊率提高10%。
據(jù)悉,相比于CPU,Tesla T4將最大模型的吞吐量提高了100倍,能夠?yàn)榘⒗飶V泛、深入的推薦模型提供加速,每秒可處理780個(gè)查詢,而基于CPU的推理每秒只能處理3個(gè),效率差了足足260倍。
對電商來說,推薦系統(tǒng)是至關(guān)重要的應(yīng)用程序,可以向用戶展示與其喜好相匹配的商品,從而提高點(diǎn)擊率,而點(diǎn)擊率的每一次小幅提高,都會直接影響用戶的體驗(yàn)和商家的營收。使用能夠?qū)崟r(shí)大規(guī)模運(yùn)行的先進(jìn)推薦系統(tǒng)模型使點(diǎn)擊率提高10%,目前這只能通過GPU實(shí)現(xiàn)。
據(jù)介紹,阿里使用NVIDIA GPU支持資源分配、模型量化和圖變換三項(xiàng)優(yōu)化策略,從而提高吞吐量和響應(yīng)性,還部署NVIDIA GPU為各類系統(tǒng)提速,包括自動廣告橫幅生成、廣告推薦、幫助識別假冒產(chǎn)品的圖像處理、語言翻譯、語音識別等系統(tǒng)。
除了阿里云,百度、字節(jié)跳動、滴滴、快手、美團(tuán)點(diǎn)評、平安科技、搜狗、騰訊、小米等中國科技巨頭的云服務(wù)也都部署著NVIDIA GPU。