當前位置:首頁 > 嵌入式 > 嵌入式硬件
[導讀]為了加速 AI 訓練、推理的發(fā)展,英偉達(NVIDIA)、英特爾(Intel)以及 Arm 近日攜手發(fā)布了“FP8 Formats for Deep Learning”白皮書,希望能通過 8 位浮點運算的格式來改善運算性能,并將其作為 AI 通用的交換格式,提升深度學習訓練與推理速度。目前該白皮書也已提交給了電氣與電子工程師協(xié)會(Institute of Electrical and Electronics Engineers, IEEE)。

為了加速 AI 訓練、推理的發(fā)展,英偉達(NVIDIA)、英特爾(Intel)以及 Arm 近日攜手發(fā)布了“FP8 Formats for Deep Learning”白皮書,希望能通過 8 位浮點運算的格式來改善運算性能,并將其作為 AI 通用的交換格式,提升深度學習訓練與推理速度。目前該白皮書也已提交給了電氣與電子工程師協(xié)會(Institute of Electrical and Electronics Engineers, IEEE)。

FP8 格式之所以重要的原因有很多,其中最重要的是,到目前為止,AI 推理之間存在一種分裂,以整數(shù)格式(通常為 INT8,但有時為 INT4)以低精度完成,與 AI 訓練以 FP16、FP32 或 FP64 精度完成,HPC 以 FP32 或 FP64 精度完成。NVIDIA和 Intel 都認為 FP8 不僅可以用于推理,在某些情況下還可以用于 AI 訓練,從而從根本上提高其加速器的有效吞吐量。

AI芯片企業(yè)Graphcore 也正在推動 IEEE 采用供應商為 AI 設計的 FP8 格式作為其他所有人都可以使用的標準。此外,AMD 和高通也支持將FP8格式作為標準格式,以幫助降低云和邊緣的訓練和推理成本?!?

NVIDIA官方再度公布的最新消息顯示,美國政府對NVIDIA繼續(xù)開發(fā)H100集成電路的出口、再出口和國內(nèi)轉(zhuǎn)讓的許可進行了授權(quán)。這也意味著NVIDIA無需將某些業(yè)務轉(zhuǎn)移到中國境外。另外該授權(quán)還允許NVIDIA在2023年3月1日前為A100 GPU的美國客戶提供必要的出口支持(這里應該指的是在大陸的美國客戶);同時,授權(quán)A100和H100在2023年9月1日之前通過NVIDIA的香港公司履行訂單和物流。

雖然,NVIDIA A100/H100系列產(chǎn)品在美國給出的“緩沖期”之內(nèi)仍然可以通過其香港公司對中國大陸的出口,但是“緩沖期”過后,則必須有美國政府的許可才能出口。因此,一些大陸客戶為了保障供應,趕在“緩沖期”內(nèi)加大了A100/H100的采購量,也并不奇怪。

需要指出的是,從美國的禁令來看,只要性能小于A100的產(chǎn)品的都是能夠正常對國內(nèi)出貨的。那么鑒于國內(nèi)市場的龐大需求,NVIDIA完全是有能力、也有動機來專門為中國市場推出一款性能略低于A100的產(chǎn)品,比如搞個A90來規(guī)避美國的出口許可機制,同時又能滿足國內(nèi)的需求。預計“緩沖期”過后,NVIDIA有可能會推出相應的產(chǎn)品。

盡管NVIDIA的游戲業(yè)務收入在2022年二季度出現(xiàn)嚴重下滑,但是在獨立GPU市場(包括AIB 合作伙伴顯卡), NVIDIA仍保持著79%的份額,穩(wěn)居第一。根據(jù)市場研究機構(gòu)Jon Peddie Research的最新數(shù)據(jù)顯示,2022年二季度,全球獨立GPU市場出貨量較去年同期增長 2.4% 至 1040 萬臺,但是較一季度環(huán)比則下滑了22.6%。NVIDIA在獨立GPU的顯卡市場出貨量雖然同比增長了近3%,但是環(huán)比卻下滑了19.1%。而這主要是由于PC出貨量及虛擬幣挖礦需求下滑所引起的。

NVIDIA公司(納斯達克代碼:NVDA)是全球可編程圖形處理技術(shù)領袖。與ATI(后被AMD收購)齊名,專注于打造能夠增強個人和專業(yè)計算平臺的人機交互體驗的產(chǎn)品。公司的圖形和通信處理器擁有廣泛的市場,已被多種多樣的計算平臺采用,包括個人數(shù)字媒體PC、商用PC、專業(yè)工作站、數(shù)字內(nèi)容創(chuàng)建系統(tǒng)、筆記本電腦、軍用導航系統(tǒng)和視頻游戲控制臺等。NVIDIA全球雇員數(shù)量超過4000人。全球各地眾多OEM廠商、顯卡制造商、系統(tǒng)制造商、消費類電子產(chǎn)品公司都選擇NVIDIA的處理器作為其娛樂和商用解決方案的核心組件。在PC應用領域(例如制造、科研、電子商務、娛樂和教育等),NVIDIA公司獲獎不斷的圖形處理器可以提供出色的性能和鮮銳的視覺效果。其媒體和通信處理器能夠執(zhí)行寬帶連接和通信應用中要求十分苛刻的多媒體處理任務,并在音頻應用能力方面取得突破。NVIDIA產(chǎn)品和技術(shù)的基礎是NVIDIA ForceWare,這是一種綜合性軟件套件,能夠?qū)崿F(xiàn)業(yè)內(nèi)領先的圖形、音頻、視頻、通信、存儲和安全功能。NVIDIA ForceWare可以提高采用NVIDIA GeForce圖形芯片和NVIDIA nForce平臺解決方案的各類臺式和移動PC的工作效率、穩(wěn)定性和功能。

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權(quán)不予轉(zhuǎn)載,侵權(quán)必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術(shù)
關閉