加速芯片設(shè)計(jì),實(shí)現(xiàn)EDA工具和算力資源高效連接——專訪速石科技高級(jí)技術(shù)總監(jiān)張大成
芯片設(shè)計(jì)需要大量的算力資源,尤其是在超大規(guī)模芯片的仿真和建模方面,對(duì)計(jì)算存儲(chǔ)和網(wǎng)絡(luò)資源的要求很高,只是依靠自己的PC遠(yuǎn)遠(yuǎn)不夠。芯片設(shè)計(jì)團(tuán)隊(duì)希望能夠得到成千上萬顆CPU的計(jì)算能力,借助超大計(jì)算集群實(shí)現(xiàn)設(shè)計(jì)加速。但常規(guī)的云資源平臺(tái)提供的是企業(yè)通用服務(wù),很難滿足芯片設(shè)計(jì)這種細(xì)分領(lǐng)域的業(yè)務(wù)需求。而各個(gè)EDA工具家的自己的云平臺(tái),靈活度和計(jì)算資源又相對(duì)受限。正是瞄準(zhǔn)了這一行業(yè)機(jī)會(huì),速石科技?xì)⑷肓诉@一領(lǐng)域,迅速構(gòu)建了適合于芯片設(shè)計(jì)公司的一站式研發(fā)平臺(tái),幫助客戶實(shí)現(xiàn)EDA工具和算力資源之間的結(jié)合,并且在短短三年的時(shí)間內(nèi)實(shí)現(xiàn)了數(shù)百家行業(yè)客戶的案例落地,真正幫助中國芯片公司實(shí)現(xiàn)了設(shè)計(jì)加速。
近日在ICCAD2023上,我們有幸采訪到了速石科技高級(jí)技術(shù)總監(jiān)張大成,他就芯片設(shè)計(jì)的業(yè)務(wù)需求趨勢(shì)進(jìn)行了精彩分享。
高效連接EDA工具與算力資源的一站式研發(fā)平臺(tái)
在半導(dǎo)體芯片設(shè)計(jì)的產(chǎn)業(yè)發(fā)展過程中,隨著工藝制程愈發(fā)先進(jìn)、芯片晶體管數(shù)量越來越多,研發(fā)過程中需要大規(guī)模地調(diào)度算力運(yùn)算。速石科技正是基于這樣的客戶訴求,構(gòu)建了自己的一站式芯片研發(fā)平臺(tái)。該產(chǎn)品通過速石自研的調(diào)度器Fsched對(duì)企業(yè)的資源和任務(wù)狀況進(jìn)行實(shí)時(shí)的監(jiān)控和管理,配合Auto-Scale(自動(dòng)伸縮)、實(shí)時(shí)告警、可視化監(jiān)控等功能,從資源調(diào)度、運(yùn)營管理、工具自動(dòng)化等多維度滿足企業(yè)在芯片設(shè)計(jì)、開發(fā)、驗(yàn)證等環(huán)節(jié)的業(yè)務(wù)和管理需求。
據(jù)張大成介紹,速石科技的一站式研發(fā)平臺(tái)可以給客戶帶來諸多價(jià)值。例如當(dāng)某一個(gè)客戶隨著設(shè)計(jì)業(yè)務(wù)發(fā)展,經(jīng)常會(huì)遇到算力不足、任務(wù)排隊(duì)、運(yùn)維困難等問題。速石科技可以幫助客戶實(shí)現(xiàn)云上數(shù)萬核規(guī)模的設(shè)計(jì)回歸驗(yàn)證,通過旗下的企業(yè)級(jí)產(chǎn)品調(diào)度海量云端算力,提供針對(duì)EDA產(chǎn)品的優(yōu)化與適配,從而幫助客戶加速流片過程。同時(shí),速石科技還能提供專業(yè)的IT-CAD技術(shù)支持,有效降低了企業(yè)客戶的研發(fā)和運(yùn)維壓力,
張大成表示,“當(dāng)你仿真高峰來臨資源不足的時(shí)候,當(dāng)你的研發(fā)環(huán)境沒法滿足業(yè)務(wù)使用的時(shí)候,當(dāng)你對(duì)降低成本控制預(yù)算有需求的時(shí)候,當(dāng)你想要持續(xù)優(yōu)化研發(fā)效率的時(shí)候,當(dāng)你希望獲得包括CAD能力與大客戶支持在內(nèi)的一站式平臺(tái)服務(wù)的時(shí)候,速石科技做的就是這件事情,這是我們給客戶帶來的價(jià)值?!?
安全可靠,滿足企業(yè)復(fù)雜研發(fā)環(huán)境的管理需求
據(jù)張大成分享,最近幾年半導(dǎo)體芯片設(shè)計(jì)遇到比較大的一個(gè)挑戰(zhàn)是,芯片設(shè)計(jì)的質(zhì)量要求不斷提升,芯片驗(yàn)證的復(fù)雜程度也隨之不斷的提高,從而對(duì)資源、平臺(tái)、服務(wù)提出了更高的要求。速石科技的企業(yè)級(jí)產(chǎn)品能夠?qū)崿F(xiàn)對(duì)企業(yè)本地及云端復(fù)雜研發(fā)環(huán)境的統(tǒng)一協(xié)調(diào)管理,并可支持全球化的項(xiàng)目協(xié)同管理。結(jié)合IT自動(dòng)化管理、行業(yè)最佳實(shí)踐流程和基于業(yè)務(wù)的功能模塊,為用戶提供完整的研發(fā)環(huán)境搭建和管理,滿足了企業(yè)全研發(fā)周期的需求。
“速石科技有一整套產(chǎn)品可以幫助客戶管理調(diào)度自己的驗(yàn)證任務(wù),幫助其更好地運(yùn)行;同時(shí)速石科技在云上幫助客戶大規(guī)模地調(diào)用資源以完成驗(yàn)證和開發(fā)任務(wù),這其實(shí)為客戶帶來了整體的效率提升。而且像有的企業(yè),發(fā)展階段不一樣,研發(fā)環(huán)境也會(huì)產(chǎn)生比較大的變動(dòng),比如從單純的云端或者本地環(huán)境變成混合云,或者像有了多個(gè)研發(fā)中心,甚至有海外的研發(fā)協(xié)同需求,這些我們都可以滿足?!?
同時(shí),對(duì)于芯片設(shè)計(jì)企業(yè)來說,研發(fā)環(huán)境的安全性也至關(guān)重要,而速石科技也能就此提供一份讓用戶滿意的答卷,從研發(fā)網(wǎng)絡(luò)安全、研發(fā)數(shù)據(jù)物理安全防護(hù)、研發(fā)數(shù)據(jù)安全訪問及設(shè)備安全等多個(gè)方面提供了安全保障。
“例如我們有一個(gè)初創(chuàng)客戶,他獲得了某晶圓廠的先進(jìn)制程的準(zhǔn)入資格,但該廠的安全審計(jì)對(duì)整個(gè)研發(fā)環(huán)境有非常嚴(yán)格的安全規(guī)范要求,客戶的研發(fā)環(huán)境必須要符合要求,才能開展后續(xù)的一系列工作?!睆埓蟪煞窒淼?,“我們速石底層數(shù)據(jù)的安全措施和防范規(guī)則級(jí)別非常高,客戶很順利地通過了晶圓廠的審核,最后成功流片?!?
優(yōu)化運(yùn)營,本土化帶來的高性價(jià)比
半導(dǎo)體行業(yè)的國產(chǎn)化是一種趨勢(shì),也是企業(yè)的一種選擇。企業(yè)選擇國產(chǎn)化不僅僅是為了滿足合規(guī)需求,更重要的是能獲得基于本土的高質(zhì)量服務(wù)、成本上的優(yōu)惠和技術(shù)上的協(xié)同。一些企業(yè)已經(jīng)在尋找上下游的國產(chǎn)化替代方案,以滿足自身業(yè)務(wù)連續(xù)性的需求。
如當(dāng)前大部分的芯片公司使用的調(diào)度器,基本上都是海外軟件,很難獲得及時(shí)的技術(shù)支持,而且成本高昂。速石平臺(tái)的自研調(diào)度器Fshced,能夠提供多種靈活調(diào)度策略,實(shí)現(xiàn)代碼級(jí)支持,并可兼容用戶已有的研發(fā)環(huán)境和市面主流調(diào)度器,最大限度滿足企業(yè)不同階段的業(yè)務(wù)需求。國內(nèi)某家上市存儲(chǔ)芯片公司在積極尋求國產(chǎn)化替代方案,速石科技的產(chǎn)品提升了其30%的研發(fā)效率,有效降低了CAD工程師的維護(hù)開發(fā)精力,成功提升了企業(yè)的流片速度,為鞏固其市場地位起到了支撐作用。
當(dāng)然,調(diào)度器只是速石產(chǎn)品的一個(gè)模塊,作為國產(chǎn)化的一站式研發(fā)平臺(tái),速石產(chǎn)品在三年時(shí)間服務(wù)了數(shù)百家企業(yè),深入了解行業(yè)需求,并以此為基礎(chǔ)提供運(yùn)營優(yōu)化分析。如可視化監(jiān)控信息,速石能夠從使用模式、資源利用率、機(jī)型選擇等維度,按周期為用戶提供運(yùn)營優(yōu)化方案,從而降低企業(yè)的總體擁有成本。而且像License其實(shí)也可以看作是一種資源,而且費(fèi)用高昂,需要規(guī)劃更為合理的使用方式。速石科技可以結(jié)合平臺(tái)高效的管理和調(diào)度能力,幫助客戶更合理地分配License資源,從而助力其優(yōu)化運(yùn)營成本。
針對(duì)芯片設(shè)計(jì)的研發(fā)特性,速石科技的企業(yè)級(jí)產(chǎn)品FCC-B,能夠幫助企業(yè)找到成本和效率之間的關(guān)鍵平衡點(diǎn),在保障企業(yè)研發(fā)效率的同時(shí),顯著降低成本支出。“我們的產(chǎn)品有獨(dú)占的大內(nèi)存資源供應(yīng)給企業(yè)客戶,一方面能滿足企業(yè)在后仿階段特定的業(yè)務(wù)需求,另一方面能進(jìn)一步控制他們的硬件支出和構(gòu)建研發(fā)環(huán)境的整體成本?!睆埓蟪煽偨Y(jié)到。
減少研發(fā)技術(shù)債,助力高效AI訓(xùn)練
隨著近年來EDA廠商紛紛布局AI/ML實(shí)現(xiàn)設(shè)計(jì)加速,AI對(duì)芯片設(shè)計(jì)效率提升的話題也尤為受到關(guān)注。而在AI模型研發(fā)的整體框架中,諸如數(shù)據(jù)處理、生產(chǎn)環(huán)境部署、算力資源管理、研發(fā)環(huán)境管理等環(huán)節(jié)成為了AI研發(fā)中隱藏的技術(shù)債務(wù),對(duì)企業(yè)在系統(tǒng)性和規(guī)范化上有很高的要求。針對(duì)此問題,張大成也進(jìn)行了深入講解。
據(jù)了解,企業(yè)在AI模型的研發(fā)和訓(xùn)練中,通常會(huì)遇到兩大問題。
第一個(gè)問題是用戶體驗(yàn)。研發(fā)人員在進(jìn)行算法訓(xùn)練和模型調(diào)試的時(shí)候,會(huì)涉及到很多如進(jìn)項(xiàng)管理、模型數(shù)據(jù)集管理、容器化應(yīng)用等,但這些工作會(huì)消耗研發(fā)人員的大量精力進(jìn)行試錯(cuò)和調(diào)優(yōu)。速石科技的MLOps模塊能夠彌合研發(fā)團(tuán)隊(duì)與AI基礎(chǔ)設(shè)施間的差距,簡化模型研發(fā)流程,快速實(shí)現(xiàn)模型的部署和落地,從而幫助企業(yè)實(shí)現(xiàn)自身商業(yè)價(jià)值。
第二個(gè)問題則是研發(fā)資源。GPU當(dāng)前資源緊缺、成本高昂,如何提高GPU資源的利用率,從客戶運(yùn)維角度來看有非常大的阻礙。速石科技的MLOps模塊通過集群實(shí)現(xiàn)對(duì)企業(yè)云端和本地算力資源的統(tǒng)一管理,確保每個(gè)用戶都能及時(shí)獲取所需資源,減少任務(wù)排隊(duì)和資源浪費(fèi),幫助客戶實(shí)現(xiàn)成本的高效控制,提升企業(yè)研發(fā)的投資回報(bào)率。
據(jù)張大成介紹,速石科技的MLOps模塊已經(jīng)正式上線,有包括手機(jī)廠商和芯片廠商在內(nèi)的客戶投入使用,并獲得良好反饋。
Fabless競爭加劇,更要實(shí)現(xiàn)高效開發(fā)
當(dāng)前行業(yè)處于波動(dòng)調(diào)整的底部周期,對(duì)芯片供應(yīng)商而言面臨著多重壓力。在這種環(huán)境下,F(xiàn)abless的產(chǎn)品競爭愈加激烈,在制程規(guī)格、車規(guī)芯片、先進(jìn)封裝等方面的要求不斷提升。
張大成表示,在當(dāng)前這種市場大環(huán)境下,其實(shí)很多初創(chuàng)型企業(yè)在資金控制、成本控制、效率提升等方面都面臨著更大的壓力。而速石科技可以幫助他們從資金、成本、效率等維度控制企業(yè)支出,幫助他們未來能夠走得更遠(yuǎn)。