AI效率260倍CPU:阿里雙11大規(guī)模部署NVIDIA GPU

時(shí)間：2020-01-06 11:34:02

關(guān)鍵字： AI NVIDIA 雙11 阿里巴巴

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]一年一度的雙11、雙12購物狂歡都已經(jīng)過去，而在蘇州舉辦的GTC CHINA 2019大會上，NVIDIA和阿里巴巴共同透露了一個(gè)小“秘密”—;—;原來，雙11 2684億元創(chuàng)紀(jì)錄成交額的背后，離不開

一年一度的雙11、雙12購物狂歡都已經(jīng)過去，而在蘇州舉辦的GTC CHINA 2019大會上，NVIDIA和阿里巴巴共同透露了一個(gè)小“秘密”—;—;原來，雙11 2684億元創(chuàng)紀(jì)錄成交額的背后，離不開NVIDIA GPU的大規(guī)模部署。

阿里巴巴異構(gòu)計(jì)算總監(jiān)徐凌杰表示，每天有超過1億購物者在阿里網(wǎng)站上瀏覽數(shù)十億種商品，在購物高峰日，阿里的系統(tǒng)每秒需要處理數(shù)十萬個(gè)查詢，而能夠保證了這一切都能正常運(yùn)行，正是AI 的功勞。

阿里引入了NVIDIA加速計(jì)算平臺，大規(guī)模部署先進(jìn)的AI技術(shù)，包括Tesla T4 GPU、cuBLAS運(yùn)算庫、自定義混合精度、推理加速軟件等，通過其直觀的搜索功能和可靠的推薦，能夠支持比過去復(fù)雜6倍的模型，從而使點(diǎn)擊率提高10％。

據(jù)悉，相比于CPU，Tesla T4將最大模型的吞吐量提高了100倍，能夠?yàn)榘⒗飶V泛、深入的推薦模型提供加速，每秒可處理780個(gè)查詢，而基于CPU的推理每秒只能處理3個(gè)，效率差了足足260倍。

對電商來說，推薦系統(tǒng)是至關(guān)重要的應(yīng)用程序，可以向用戶展示與其喜好相匹配的商品，從而提高點(diǎn)擊率，而點(diǎn)擊率的每一次小幅提高，都會直接影響用戶的體驗(yàn)和商家的營收。使用能夠?qū)崟r(shí)大規(guī)模運(yùn)行的先進(jìn)推薦系統(tǒng)模型使點(diǎn)擊率提高10％，目前這只能通過GPU實(shí)現(xiàn)。

據(jù)介紹，阿里使用NVIDIA GPU支持資源分配、模型量化和圖變換三項(xiàng)優(yōu)化策略，從而提高吞吐量和響應(yīng)性，還部署NVIDIA GPU為各類系統(tǒng)提速，包括自動廣告橫幅生成、廣告推薦、幫助識別假冒產(chǎn)品的圖像處理、語言翻譯、語音識別等系統(tǒng)。

除了阿里云，百度、字節(jié)跳動、滴滴、快手、美團(tuán)點(diǎn)評、平安科技、搜狗、騰訊、小米等中國科技巨頭的云服務(wù)也都部署著NVIDIA GPU。