當(dāng)前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]英偉達剛剛發(fā)布了一款專為 AI 推理工作而設(shè)計的顯卡,它就是可以加速語音、視頻、搜索引擎、圖像神經(jīng)網(wǎng)絡(luò)的 Tesla T4 。在這之前,英偉達曾推出過類似的 Tesla P4 。但新品可在相同的功耗下

英偉達剛剛發(fā)布了一款專為 AI 推理工作而設(shè)計的顯卡,它就是可以加速語音、視頻、搜索引擎、圖像神經(jīng)網(wǎng)絡(luò)的 Tesla T4 。在這之前,英偉達曾推出過類似的 Tesla P4 。但新品可在相同的功耗下,提供高達 12 倍的性能,設(shè)立了推理負載效能的新標(biāo)準(zhǔn)。Tesla T4 擁有 320 個圖靈張量(TURring Tensor)內(nèi)核 + 2560 個 CUDA 內(nèi)核。

它在 TU104 芯片的基礎(chǔ)上,啟用了 40 組著色器(SM),功率優(yōu)化到了 75W(從而無需 PCIe 外接供電)。顯存為 16GB GDDR6,帶寬 320GB/s 。

GPU 支持混合精度,例如 FP32、FP16、已 INT8 。此外 Tesla T4 還支持 INT4 和實驗性的 INT1 精度模式,較其前身有顯著的進步。

與前代產(chǎn)品一樣,Tesla T4 的功耗相當(dāng)?shù)驼{(diào),服務(wù)器?PCIe 插槽的標(biāo)準(zhǔn)供電(75W)已經(jīng)足夠,無需外接 6-pin 。散熱方面,它也無需加裝主動式的風(fēng)扇(服務(wù)器典型的內(nèi)風(fēng)道設(shè)計已經(jīng)足夠)。

英偉達透露,與桌面型號一樣,Tesla T4 也配備了 RT 核心,很適合光線追蹤或 VDI(虛擬桌面基礎(chǔ)架構(gòu))。但這也意味著,該卡并不會用于大多數(shù)的推理工作負載。

Tesla 還擁有針對 AI?視頻應(yīng)用的優(yōu)化特性,由硬件轉(zhuǎn)碼引擎提供動力,提供兩倍于 Tesla P4 的性能。Nvidia 表示,這些計算卡可以同時解碼多達 38 路全高清視頻流。

此外,英偉達提供了圍繞 T4 的一系列技術(shù),比如 TensorRT Hyperscale 平臺擴展。該卡支持所有主要的深度學(xué)習(xí)框架,比如 PyTorch、TensorFlow、MXNet、以及 Caffee2 。

另外,Nvidia 提供了 TensorFlow RT5,這是該公司深度學(xué)習(xí)推理優(yōu)化器和運行時(Runtime)引擎的新版本,支持圖靈張量核心與多精度工作負載。

Nvidia 還宣布了針對圖靈做出優(yōu)化的 CUDA 10,其中包含了優(yōu)化的庫、編程模型、以及圖形 API 的互操作性;以及基于 Xavier 的產(chǎn)品系列新名稱(AGX 陣容),其專為從機器人、到自動駕駛汽車的自動機器系統(tǒng)而設(shè)計。

產(chǎn)品陣容包括 Drive Xavier 和新推出的 Drive Pegasus,首批為兩款 Xavier?處理器、以及兩款 Tesla V100 GPU 。Nvidia 現(xiàn)已將 GPU 更新為基于圖靈架構(gòu)的型號,另外還提供了類似的、面向醫(yī)療應(yīng)用的 Clara 設(shè)計平臺(采用了單一的 Xavier 處理器 + 圖靈 GPU 的組合)。

Nvidia 專注于提升推理工作負載的性能,這也是該公司的一項戰(zhàn)略舉措。該公司預(yù)計,市場會在未來五年增長至 200 億美元。同時,英特爾聲稱世界上大多數(shù)的推理工作負載,仍運行在基于至強處理器的平臺上。

鑒于英特爾在全球服務(wù)器市場擁有決定壟斷的地位(約 96%),這種說法是相當(dāng)可信的。

在最近以數(shù)據(jù)為中心的創(chuàng)新峰會上,該公司宣布在 2017 年為 AI 工作負載銷售了 10 億美元的處理器。預(yù)計未來幾年,該數(shù)字還會迅速增長。

顯然,推理工作負載將成為英偉達、英特爾、AMD 多家爭奪的熱門市場。英特爾憑借的,是其在服務(wù)器市場的先發(fā)優(yōu)勢。而低成本、低功耗的推理加速器(比如 Tesla T4),將對其發(fā)起每瓦特性能的巨大挑戰(zhàn)。

據(jù)悉,AMD 即將推出用于深度學(xué)習(xí)的 7nm Radeon Instinct GPU,谷歌也在積極開發(fā)自研的定制芯片(比如 TPU)。未來幾年,我們或許能見證該領(lǐng)域的最終獲勝者。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉