當(dāng)前位置:首頁(yè) > 廠商動(dòng)態(tài) > 廠商文章
[導(dǎo)讀]像半導(dǎo)體設(shè)計(jì)這樣如此具有挑戰(zhàn)性的工作并不多見。在顯微鏡下,NVIDIA H100 Tensor Core GPU(上圖)這樣最先進(jìn)的芯片看起來就像一個(gè)精心規(guī)劃的大都市,由數(shù)百億個(gè)晶體管組成,把它們連接起來的線比人的頭發(fā)絲還細(xì) 1 萬倍。

芯片工程師展示了一個(gè)高度專業(yè)化的行業(yè)如何使用NVIDIA NeMo 來定制大語言模型,以獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。

10 月31 日,NVIDIA發(fā)布的一篇研究論文描述了生成式AI 如何助力芯片設(shè)計(jì),后者是當(dāng)今最復(fù)雜的工程工作之一。

這項(xiàng)工作展示了高度專業(yè)化領(lǐng)域的公司如何利用內(nèi)部數(shù)據(jù)訓(xùn)練大語言模型,從而開發(fā)提高生產(chǎn)力的AI 助手。

像半導(dǎo)體設(shè)計(jì)這樣如此具有挑戰(zhàn)性的工作并不多見。在顯微鏡下,NVIDIA H100 Tensor Core GPU(上圖)這樣最先進(jìn)的芯片看起來就像一個(gè)精心規(guī)劃的大都市,由數(shù)百億個(gè)晶體管組成,把它們連接起來的線比人的頭發(fā)絲還細(xì)1 萬倍。

多個(gè)工程團(tuán)隊(duì)進(jìn)行協(xié)作,需要長(zhǎng)達(dá)兩年的時(shí)間才能構(gòu)建出這樣一個(gè)數(shù)字化超級(jí)大都市。

一些小組定義芯片的整體架構(gòu),一些小組負(fù)責(zé)各種超小型電路的設(shè)計(jì)與布局,還有一些小組負(fù)責(zé)測(cè)試工作。每項(xiàng)工作都需要采取專門的方法、軟件程序和計(jì)算機(jī)語言。

大語言模型廣闊的前景

該論文的主要作者、NVIDIA 研究總監(jiān)Mark Ren 表示:“我相信,隨著時(shí)間的推移,大語言模型將全面助力所有流程?!?

在同日舉行的國(guó)際計(jì)算機(jī)輔助設(shè)計(jì)會(huì)議上,NVIDIA 首席科學(xué)家Bill Dally 發(fā)表主題演講并公布了這篇論文。這個(gè)年度盛會(huì)每年都會(huì)吸引數(shù)百名電子設(shè)計(jì)自動(dòng)化(EDA)領(lǐng)域的工程師參加。

此次會(huì)議在舊金山舉行。Dally 在會(huì)上表示:“這標(biāo)志著在將大語言模型用于復(fù)雜的半導(dǎo)體設(shè)計(jì)方面邁出了重要一步。這項(xiàng)工作表明,即使高度專業(yè)化的領(lǐng)域也可以利用內(nèi)部數(shù)據(jù)來訓(xùn)練極具價(jià)值的生成式AI 模型。”

ChipNeMo 浮出水面

這篇論文詳細(xì)介紹了NVIDIA 工程師如何創(chuàng)建名為ChipNeMo 的定制大語言模型,供內(nèi)部使用。該模型使用公司內(nèi)部數(shù)據(jù)進(jìn)行訓(xùn)練并生成和優(yōu)化軟件,以更好地協(xié)助人類設(shè)計(jì)師。

Ren 在EDA 領(lǐng)域從業(yè)超過20 多年,他表示,從長(zhǎng)遠(yuǎn)來看,工程師們希望生成式AI 能夠用于芯片設(shè)計(jì)的各個(gè)階段,從而大幅提升整體生產(chǎn)力。

在針對(duì)可能的使用場(chǎng)景對(duì)NVIDIA 工程師進(jìn)行調(diào)研之后,研究團(tuán)隊(duì)一開始選擇了三個(gè)場(chǎng)景:聊天機(jī)器人、代碼生成器和分析工具。

初始用例

維護(hù)已知bug 的更新描述需要耗費(fèi)大量時(shí)間,而上述分析工具中的后者能夠?qū)崿F(xiàn)此類任務(wù)的自動(dòng)化,并已得到廣泛的采用。

一個(gè)聊天機(jī)器人原型可以回答有關(guān)GPU 架構(gòu)和設(shè)計(jì)的問題,并且已經(jīng)幫助許多工程師在早期測(cè)試中快速找到技術(shù)文檔。

代碼生成器將幫助設(shè)計(jì)者編寫芯片設(shè)計(jì)軟件。

一個(gè)正在開發(fā)中的代碼生成器(如上圖所演示)已經(jīng)用兩種芯片設(shè)計(jì)師專用語言創(chuàng)建了大約10-20 行軟件的片段。它將與現(xiàn)有工具集成,為工程師們提供一個(gè)方便的助手來進(jìn)行設(shè)計(jì)。

使用NVIDIA NeMo 定制AI 模型

這篇論文主要關(guān)注該團(tuán)隊(duì)收集設(shè)計(jì)數(shù)據(jù)并使用這些數(shù)據(jù)創(chuàng)建專門的生成式AI 模型,這個(gè)過程可以移植到任何行業(yè)。

作為起點(diǎn),該團(tuán)隊(duì)選擇了一個(gè)基礎(chǔ)模型,并使用NVIDIA NeMo 對(duì)其進(jìn)行了定制。作為NVIDIA AI Enterprise 軟件平臺(tái)的一部分,NVIDIA NeMo 是一個(gè)用于構(gòu)建、定制和部署生成式AI 模型的框架。定的NeMo 模型具有430 億個(gè)參數(shù),這衡量了它對(duì)模式的理解力。它使用超過一萬億個(gè)文本和軟件中的token、單詞和符號(hào)進(jìn)行了訓(xùn)練。

ChipNeMo 提供了一個(gè)技術(shù)團(tuán)隊(duì)如何用自己的數(shù)據(jù)改進(jìn)預(yù)訓(xùn)練模型的示例。

然后,該團(tuán)隊(duì)在兩輪訓(xùn)練中完善了該模型。第一輪使用了相當(dāng)于大約240 億個(gè)token 的內(nèi)部設(shè)計(jì)數(shù)據(jù),第二輪使用了約13 萬個(gè)對(duì)話和設(shè)計(jì)示例。

這項(xiàng)工作是半導(dǎo)體行業(yè)進(jìn)行生成式AI 概念研究和印證的幾個(gè)例子之一, 這一趨勢(shì)剛剛開始在實(shí)驗(yàn)室興起。

分享經(jīng)驗(yàn)

Ren 的團(tuán)隊(duì)學(xué)到的一個(gè)最重要的經(jīng)驗(yàn)就是定制大語言模型的重要性。

芯片設(shè)計(jì)任務(wù)中,只有130 億個(gè)參數(shù)的定制ChipNeMo 模型的性能達(dá)到或超過了更大的通用大語言模型(例如包含700 億個(gè)參數(shù)的LLaMA2)。在某些使用場(chǎng)景中,ChipNeMo 模型甚至好很多。

他補(bǔ)充道,在這一過程中,用戶需要謹(jǐn)慎地確定他們收集什么數(shù)據(jù)以及如何清理數(shù)據(jù)以用于訓(xùn)練。

最后,Ren 建議用戶及時(shí)了解可以加快和簡(jiǎn)化工作的最新工具。

NVIDIA Research 在全球各地?fù)碛袛?shù)百名科學(xué)家和工程師,專注于AI、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、自動(dòng)駕駛汽車、機(jī)器人學(xué)等領(lǐng)域。近期的其它半導(dǎo)體項(xiàng)目包括使用AI 設(shè)計(jì)更小、更快的電路,以及優(yōu)化大型模塊的布局。

希望構(gòu)建自己的定制大語言模型的企業(yè)現(xiàn)在可以從使用GitHub 和NVIDIA NGC 目錄中的NeMo 框架開始。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉