當(dāng)前位置:首頁 > 公眾號精選 > 全棧芯片工程師
[導(dǎo)讀]上一篇《EDA云實證Vol.1:從30天到17小時,如何讓HSPICE仿真效率提升42倍?》里,我們幫一家DesignHouse提高了使用HSPICE進(jìn)行芯片設(shè)計仿真的效率。而設(shè)計好的集成電路圖案需要通過光刻機轉(zhuǎn)印到晶圓上才能完成制造,這就是芯片制造中最重要的一個步驟——光刻。在...

上一篇《EDA云實證Vol.1:從30天到17小時,如何讓HSPICE仿真效率提升42倍?》里,我們幫一家Design House提高了使用HSPICE進(jìn)行芯片設(shè)計仿真的效率。


而設(shè)計好的集成電路圖案需要通過光刻機轉(zhuǎn)印到晶圓上才能完成制造,這就是芯片制造中最重要的一個步驟——光刻

在先進(jìn)工藝特別是 FinFET 工藝中,計算光刻已經(jīng)成為光刻工藝研發(fā)的核心。


光學(xué)鄰近效應(yīng)校正(Optical Proximity Correction,OPC屬于計算光刻技術(shù)的一種,主要是利用軟件和高性能計算,來模擬仿真光刻過程中的光學(xué)和化學(xué)過程,通過仿真建立精確的計算模型,然后調(diào)整圖形的邊沿不斷仿真迭代,直到逼近理想的圖形,最終加速工藝研發(fā)周期的目標(biāo)。

這一過程對計算資源的需求隨著模型的精確度呈指數(shù)級別增長。

舉個例子,一款7nm芯片需要高達(dá)100層的光罩,每層光罩?jǐn)?shù)據(jù)都需要使用EDA工具進(jìn)行OPC的過程。整個過程對硬件算力要求很高,EDA工具需要運行在幾千核的服務(wù)器CPU上,動輒就是幾十萬核時。

?

我們通過今天的實證驗證了如何在不同場景下,大幅幫用戶縮短OPC運行時間,同時確保云端和本地計算結(jié)果的完全一致性和計算性能的穩(wěn)定性。

這次實證涉及的場景很細(xì)致,既有License服務(wù)器的配置地點,又有不同調(diào)度器,還一一對云上計算結(jié)果和本地做了數(shù)據(jù)對比,使用的計算資源數(shù)量跨度也很大,從80-5000核不等,非常細(xì)致,極具參考性。





實證背景信息





A社是一家大型IC設(shè)計公司,隨著近年業(yè)務(wù)規(guī)模不斷擴大,OPC相關(guān)計算需求增大。但A社本地機房空間不足,原先傳統(tǒng)托管IDC模式也難以滿足彈性需求,導(dǎo)致大量任務(wù)出現(xiàn)排隊,無法及時輸出成果,拖慢了整個IC研發(fā)進(jìn)程。公司希望在本地建設(shè)和IDC托管之外,尋求具備彈性的大規(guī)模算力來滿足業(yè)務(wù)高峰期的需求,來滿足業(yè)務(wù)擴展需求。


實證目標(biāo)




1、OPC任務(wù)能否在云端有效運行?
2、fastone平臺能否滿足業(yè)務(wù)彈性資源需求,有效減少OPC運行時間?

3、License Server配置在本地和云端對計算性能/一致性/穩(wěn)定性是否有影響?

4、fastone能否支持不同調(diào)度器SGE/Slurm?使用不同調(diào)度器對計算性能/一致性/穩(wěn)定性是否有影響?

5、fastone平臺的云端輸出計算結(jié)果是否與本地完全一致?





實證參數(shù)



平臺:fastone企業(yè)版產(chǎn)品
應(yīng)用:Proteus?OPC
適用場景:在提交設(shè)計到制造之前,模擬仿真光學(xué)鄰近效應(yīng)校正,從理論上探索增大最小可分辨特征尺寸(Minimum Resolvable Feature size,MRF)和工藝窗口(Process Window,PW)的途徑,指導(dǎo)工藝參數(shù)的優(yōu)化。
License配置:本次實證分別驗證了License Server部署在本地和云端的表現(xiàn)。
云端硬件配置:本次實證涉及的考察因素比較多,尤其是本地和云上進(jìn)行了同步一對一對比。用戶希望和本地硬件配置盡量保持一致,有更好的可比性,所以選擇了跟本地接近的內(nèi)存密集型實例機型。
調(diào)度器:本次實證同時采用了SGE和Slurm兩種調(diào)度器。
技術(shù)架構(gòu)圖:兩個紅框表示EDA License Server分別部署在本地或云端。
應(yīng)A社對于數(shù)據(jù)保密的要求,本實證所有數(shù)據(jù)均經(jīng)過處理。


實證場景一


5000核大規(guī)模OPC業(yè)務(wù)上云驗證

結(jié)論:1、云端調(diào)度5000核計算資源運算一組OPC任務(wù),耗時為80核計算資源運算耗時的0.019倍,相當(dāng)于從一個月縮短到13.8小時;2、公有云廠商大內(nèi)存型資源數(shù)量不算多,單個區(qū)域想要一次性獲取高達(dá)5000核的內(nèi)存型實例很難實現(xiàn)。fastone平臺的Auto-Scale功能可在較短時間內(nèi),根據(jù)用戶需求,自動化跨區(qū)調(diào)度到大量目標(biāo)類型計算資源。
實證過程:
1、云端調(diào)度80核計算資源運算一組任務(wù),耗時為x;5、云端調(diào)度5000核計算資源運算一組任務(wù),耗時為0.019x。

關(guān)于通過fastone平臺的Auto-Scale功能基于用戶時間優(yōu)先策略和成本優(yōu)先策略自動調(diào)度本區(qū)域及其他區(qū)域的目標(biāo)類型或相似類型實例資源,這篇文章《生信云實證Vol.3:提速2920倍!用AutoDock Vina對接2800萬個分子》里有詳細(xì)說明。





實證場景二


License Server配置在本地VS云端
云上VS本地:計算性能/一致性/穩(wěn)定性驗證
結(jié)論:1、License Server部署在本地和云端對于計算結(jié)果無影響;2、云端和本地分別運行相同OPC任務(wù):計算性能:云上計算時間均優(yōu)于本地;一致性:云端和本地計算結(jié)果均完全一致;穩(wěn)定性:集群運行均無中斷,GUI啟動均正常。實證過程:1、License Server部署在本地,云上調(diào)度80/240/480/1600/3200/5000核計算資源運行OPC任務(wù),本地同步運行80/240/480/1600/3200/5000核相同OPC任務(wù);2、License Server部署在云端,云上調(diào)度80/240/480/1600/3200/5000核計算資源運行OPC任務(wù),本地同步運行80/240/480/1600/3200/5000核相同OPC任務(wù)。


實證場景三


License Server配置在本地VS云端云端擴展性驗證
結(jié)論一:1、License Server配置在本地,使用云端資源運算OPC任務(wù),性能隨資源增加線性提升。注:參考值分別為:80核-1、240核-0.3333、480核-0.1667、1600核-0.05、3200核-0.025,5000核-0.016。
實證過程:將License Server部署在本地:1、云端調(diào)度80核計算資源運算Case1,耗時為x;2、云端調(diào)度240核計算資源運算Case1,耗時為0.3375x;3、云端調(diào)度480核計算資源運算Case1,耗時為0.1679x;4、云端調(diào)度1600核計算資源運算Case1,耗時為0.0518x;5、云端調(diào)度3200核計算資源運算Case1,耗時為0.0285x;6、云端調(diào)度5000核計算資源運算Case1,耗時為0.0216x;7、云端調(diào)度80核計算資源運算Case2,耗時為y;8、云端調(diào)度240核計算資源運算Case2,耗時為0.3389y;9、云端調(diào)度480核計算資源運算Case2,耗時為0.1682y;10、云端調(diào)度1600核計算資源運算Case2,耗時為0.0529y;11、云端調(diào)度3200核計算資源運算Case2,耗時為0.0300y;12、云端調(diào)度5000核計算資源運算Case2,耗時為0.0230y。
結(jié)論二:License Server配置在云端,使用云端資源運算OPC任務(wù),性能隨資源增加線性提升。注:參考值分別為:80核-1、240核-0.3333、480核-0.1667、1600核-0.05、3200核-0.025,5000核-0.016。
實證過程:將License Server部署在云端:1、云端調(diào)度80核計算資源運算Case1,耗時為x;2、云端調(diào)度240核計算資源運算Case1,耗時為0.3346x;3、云端調(diào)度480核計算資源運算Case1,耗時為0.1672x;4、云端調(diào)度1600核計算資源運算Case1,耗時為0.0515x;5、云端調(diào)度3200核計算資源運算Case1,耗時為0.0270x;6、云端調(diào)度5000核計算資源運算Case1,耗時為0.0191x;7、云端調(diào)度80核計算資源運算Case2,耗時為y;8、云端調(diào)度240核計算資源運算Case2,耗時為0.3390y;9、云端調(diào)度480核計算資源運算Case2,耗時為0.1691y;10、云端調(diào)度1600核計算資源運算Case2,耗時為0.0588y;11、云端調(diào)度3200核計算資源運算Case2,耗時為0.0329y;12、云端調(diào)度5000核計算資源運算Case2,耗時為0.0262y。


實證場景四


不同調(diào)度器驗證:SGE VS Slurm
云端2000核/5000核
結(jié)論:1、分別使用SGE和Slurm調(diào)度云端2000核/5000核運行相同OPC任務(wù),對于計算結(jié)果無影響;2、云端和本地使用不同調(diào)度器分別運行相同OPC任務(wù):計算性能:云上計算時間均優(yōu)于本地;一致性:云端和本地計算結(jié)果均完全一致穩(wěn)定性:集群運行均無中斷,GUI啟動均正常。實證過程:1、使用SGE調(diào)度器,云上調(diào)度2000核計算資源運算一組OPC任務(wù),本地同步運行2000核相同OPC任務(wù);2、使用SGE調(diào)度器,云上調(diào)度5000核計算資源運算一組OPC任務(wù),本地同步運行5000核相同OPC任務(wù);3、使用Slurm調(diào)度器,云上調(diào)度2000核計算資源運算一組OPC任務(wù),本地同步運行2000核相同OPC任務(wù);4、使用Slurm調(diào)度器,云上調(diào)度5000核計算資源運算一組OPC任務(wù),本地同步運行5000核相同OPC任務(wù)。
這篇文章《億萬打工人的夢:16萬個CPU隨你用》里,我們基于這四家主流調(diào)度器:LSF/SGE/Slurm/PBS以及它們的9個演化版本進(jìn)行了梳理和盤點,尤其是對云的支持方面劃了重點。可以了解一下。


實證小結(jié)



1、Proteus?OPC任務(wù)在云端能有效運行;2、fastone平臺能夠大幅度縮短OPC任務(wù)運行時間;3、License Server配置在本地和云端,對計算性能/一致性/穩(wěn)定性沒有影響;4、fastone平臺使用不同調(diào)度器SGE/Slurm,對計算性能/一致性/穩(wěn)定性沒有影響;5、云端和本地運行相同OPC任務(wù),對計算結(jié)果沒有影響。

本次EDA行業(yè)Cloud HPC實證系列Vol.4就到這里了。在下一期實證中,我們將對Virtuoso使用速石平臺進(jìn)行驗證。請保持關(guān)注哦!??-?END?-
我們有個為應(yīng)用定義的EDA云平臺集成多種EDA應(yīng)用,大量任務(wù)多節(jié)點并行應(yīng)對短時間爆發(fā)性需求,連網(wǎng)即用跑任務(wù)快,原來幾個月甚至幾年,現(xiàn)在只需幾小時5分鐘快速上手,拖拉點選可視化界面,無需代碼支持高級用戶直接在云端創(chuàng)建集群?
掃碼免費試用,送300元體驗金,入股不虧~
更多電子書歡迎掃碼關(guān)注小F(ID:imfastone)獲取
你也許想了解具體的落地場景:這樣跑COMSOL,是不是就可以發(fā)Nature了
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個分子要花多少錢LS-DYNA求解效率深度測評 │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個VCS任務(wù)背后的“搬桌子”系列故事155個GPU!多云場景下的Amber自由能計算怎么把需要45天的突發(fā)性Fluent仿真計算縮短到4天之內(nèi)?
國內(nèi)最大規(guī)模OPC上云,5000核并行,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個分子從4天到1.75小時,如何讓Bladed仿真效率提升55倍?從30天到17小時,如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺這一屆科研計算人趕DDL紅寶書:學(xué)生篇
缺人!缺錢!趕時間!初創(chuàng)IC設(shè)計公司如何“絕地求生”?
速石科技獲元禾璞華領(lǐng)投數(shù)千萬美元B輪融資一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP速石科技成三星Foundry國內(nèi)首家SAFE?云合作伙伴EDA云平臺49問
國內(nèi)超算發(fā)展近40年,終于遇到了一個像樣的對手幫助CXO解惑上云成本的迷思,看這篇就夠了花費4小時5500美元,速石科技躋身全球超算TOP500

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉