大算力硬件“牛市”即將開啟!戴偉民博士解讀AIGC芯片的機遇與挑戰(zhàn)
2024年7月6日下午,由上海開放處理器產(chǎn)業(yè)創(chuàng)新中心和芯原微電子(上海)股份有限公司主辦的“RISC-V和生成式AI論壇”,在上海世博中心成功召開。芯原股份創(chuàng)始人、董事長兼總裁戴偉民博士發(fā)表了關(guān)于“AIGC芯片的機遇與挑戰(zhàn)”的精彩演講。這一演講不僅深入分析了人工智能技術(shù)的歷史發(fā)展和當前趨勢,還預(yù)測了這些技術(shù)將如何在未來塑造半導(dǎo)體行業(yè),特別是在AIGC領(lǐng)域的應(yīng)用和發(fā)展。
群模亂舞是浪費電,垂直領(lǐng)域微調(diào)具備更高價值
戴博士的演講首先回顧了從機械化時代到信息化時代的轉(zhuǎn)變,強調(diào)了人工智能從“弱智能”向“強智能”的轉(zhuǎn)變?nèi)绾螛O大地推動了計算需求的增長。他指出,隨著技術(shù)的進步,AIGC的發(fā)展已從單一模式識別和響應(yīng),擴展到更復(fù)雜的任務(wù)如自然語言處理和機器學(xué)習(xí)模型的自我迭代。這些技術(shù)的進步不僅加速了人工智能的應(yīng)用,也對芯片設(shè)計和制造提出了新的要求。
但當下的“百模大戰(zhàn)”,在戴博士看來更像是“群模亂舞”、浪費電?!安灰f一講起AI就要建一個訓(xùn)練中心、要很多訓(xùn)練卡,樹干是長不出樹葉的、要樹枝。樹枝是什么意思?微調(diào)。垂直領(lǐng)域的微調(diào),這是在端上、然后端上再推。實際上三張卡“云上的訓(xùn)練卡、端上的微調(diào)推理卡”,應(yīng)該是端上的卡大大大于“云”上的卡?!贝鞑┦拷忉尩?。
AIGC:推動高性能計算芯片市場擴張
戴博士詳細探討了AIGC技術(shù)對半導(dǎo)體行業(yè)的具體影響。他提到,隨著模型規(guī)模的增加,對計算能力的需求也呈指數(shù)級增長,這直接推動了高性能計算芯片市場的擴張。在他的演講中,戴博士使用具體數(shù)據(jù)展示了從GPT-3到GPT-4模型的參數(shù)和計算需求的激增,以及這對芯片設(shè)計和生產(chǎn)技術(shù)的挑戰(zhàn)。
據(jù)悉,GPT 3擁有1750億個參數(shù),計算需求 約為 315000百億億次;GPT 4約有1.7萬億個參數(shù),計算需求 約為 1.35億百億億次。一個擁有10萬億參數(shù)的理論上要130億百億億次的計算量,將需要1060萬個A100 PCle 80GB芯片或3336 個采用256 個Grace Hopper芯片的DGX GH200系統(tǒng)。
而為了實現(xiàn)這些模型加速,產(chǎn)業(yè)界也進行了多種探索。Groq自研的一種名為張量流處理器(TSP)的新型處理單元,并定義為“語言處理單元 (LPU)”。通過其專門的架構(gòu)設(shè)計、高效的內(nèi)存帶寬、改進的能效比、可擴展性和未來發(fā)展?jié)摿Γ谔幚?特定AI工作負載,尤其是大型語言模型時,相對于GPU展現(xiàn)出顯著的先進性。
初創(chuàng)公司Etched AI,則針對Transformer推出了專用ASIC“Sohu”。Sohu是基于臺積電4nm工藝,配有144GB HBM3E高帶寬內(nèi)存。能效方面明顯優(yōu)于傳統(tǒng)GPU,推理方面性能比英偉達的H100快20倍。而這種性能優(yōu)勢的建立是基于對Transformer架構(gòu)的優(yōu)化硬化,所以并不能夠支持CNN、RNN 或 LSTM等大多數(shù)AI 架構(gòu),靈活性欠佳。
戴博士引用了來自Counterpoint Research的數(shù)據(jù),該報告稱到2030年,關(guān)鍵計算領(lǐng)域的半導(dǎo)體收入將達數(shù)萬億美元;,生成式AI將使服務(wù)器領(lǐng)域的半導(dǎo)體收入增至三倍,達到5930億美元的規(guī)模。
下一輪“先軟后硬”的牛市正在到來,芯原實現(xiàn)積極布局
芯原在應(yīng)對AIGC挑戰(zhàn)方面的創(chuàng)新舉措,包括低功耗設(shè)計、高性能計算和芯片微調(diào)技術(shù)上的突破。特別是在可穿戴設(shè)備和汽車電子領(lǐng)域,芯原開發(fā)的芯片不僅能夠處理復(fù)雜的AI模型,還能在極低的功耗下運行,這些技術(shù)的應(yīng)用展示了其在行業(yè)中的領(lǐng)先地位。
在今年的德國嵌入式展上,芯原還展示了谷歌Open Se Cura項目。這是一個由設(shè)計工具和IP庫組成的開源框架,旨在加速安全、可擴展、透明和 高效的AI系統(tǒng)的發(fā)展;芯原提供多個IP、低功耗芯片設(shè)計、BSP,并負責(zé)推動該項目的商業(yè)化。
值得一提的是,芯原神經(jīng)網(wǎng)絡(luò)處理器 (NPU) 已在全球累積出貨超過1億顆,被72家客戶用于其128款人工智能芯片中,涉獵了超過10個市場應(yīng)用領(lǐng)域。芯原的圖形處理器 (GPU) 也已在全球累積出貨近20億顆,擁有70項專利,在千萬輛車上運行。在視頻處理器 (VPU) 方面,芯原也是全球第一。其VPU產(chǎn)品已被全球前20大云平臺解決方案提供商中12個采用,國內(nèi)前5大互聯(lián)網(wǎng)提供商種有3個也選擇了芯原的VPU。
在自動駕駛方面,芯原Chiplet技術(shù)正在助力構(gòu)建下一代智慧駕駛平臺。在數(shù)據(jù)中心領(lǐng)域,芯原也提供了全面的產(chǎn)品組合,提供了一系列高性能AIGC芯片。
展望未來,戴博士討論了AIGC技術(shù)在多個垂直市場中的應(yīng)用前景,如自動駕駛、健康醫(yī)療和制造業(yè)等。他預(yù)測,隨著技術(shù)的成熟,這些領(lǐng)域的需求將進一步驅(qū)動高性能芯片的市場增長。此外,他強調(diào)了在全球范圍內(nèi)建立戰(zhàn)略合作伙伴關(guān)系的重要性,以便更好地利用全球資源和專業(yè)知識,加速AIGC技術(shù)的商業(yè)化進程。
“我認為下一輪牛市2026年、最晚2027年,是因為2023年的ChatGPT?!贝鞑┦空J為,上一輪的牛市由iphone4開啟,是從移動硬件創(chuàng)新到移動互聯(lián)網(wǎng)的軟件創(chuàng)新,“先硬后軟”的節(jié)奏。而新一輪的牛市的開啟,則是先軟后硬的節(jié)奏,以ChatGPT為代表的大模型將會引領(lǐng)大算力硬件的“牛市”。
結(jié)語
戴偉民博士的演講為我們提供了對AIGC技術(shù)發(fā)展的深刻洞察,以及這些技術(shù)如何影響芯片行業(yè)的全面分析。他的見解不僅強調(diào)了芯原在這一變革中的領(lǐng)導(dǎo)角色,也展示了半導(dǎo)體行業(yè)面臨的機遇與挑戰(zhàn)。隨著AI技術(shù)的快速進步,芯原的創(chuàng)新和戰(zhàn)略布局將在未來的技術(shù)革命中扮演關(guān)鍵角色,推動整個行業(yè)向前發(fā)展。