當(dāng)前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]簡單來講在現(xiàn)代計(jì)算機(jī)環(huán)境下的日常使用中,整點(diǎn)運(yùn)算性能影響如壓縮與解壓縮,計(jì)算機(jī)進(jìn)程調(diào)度,編譯器語法分析,計(jì)算機(jī)電路輔助設(shè)計(jì),游戲AI處理類型的操作。而浮點(diǎn)運(yùn)算單元主要影響CPU的科學(xué)計(jì)算性能,如流體力

簡單來講在現(xiàn)代計(jì)算機(jī)環(huán)境下的日常使用中,整點(diǎn)運(yùn)算性能影響如壓縮與解壓縮,計(jì)算機(jī)進(jìn)程調(diào)度,編譯器語法分析,計(jì)算機(jī)電路輔助設(shè)計(jì),游戲AI處理類型的操作。

而浮點(diǎn)運(yùn)算單元主要影響CPU的科學(xué)計(jì)算性能,如流體力學(xué),量子力學(xué)等,而更貼近我們?nèi)粘D芤姷降膽?yīng)用就是多媒體相關(guān)的應(yīng)用,如音視頻的編解碼,圖像處理等操作。


ZEN的核心架構(gòu)圖

而我們通常在測試CPU時(shí)使用如Sandra 2018,Super Pi,wPrime,F(xiàn)ritz Chess Benchmark,WinRAR,7-zip,x264 FHD Benchmark等軟件,這些測試軟件就能夠體現(xiàn)處理器理論整數(shù)運(yùn)算單元和浮點(diǎn)運(yùn)算單元性能的。

在具體使用的軟件中,如壓縮解壓軟件WinRAR,7-zip,程序員使用的GCC編譯器,網(wǎng)絡(luò)路由的選擇,游戲中的AI以及我們?nèi)粘T囉貌僮飨到y(tǒng)調(diào)度都是整點(diǎn)運(yùn)算。而我們在使用lightroom等圖像處理軟件,語音識別,視頻的編解碼,以及科學(xué)家使用Matlab進(jìn)行科學(xué)計(jì)算時(shí)都用到了浮點(diǎn)運(yùn)算能力。

對于玩家最關(guān)心的就是這些到底對游戲有什么影響。首先CPU承擔(dān)著整個(gè)計(jì)算機(jī)中的任務(wù)進(jìn)程分配問題,所以如果游戲代碼優(yōu)化不好,進(jìn)行頻繁的Draw Call操作,會(huì)非常消耗CPU任務(wù)調(diào)度資源。同時(shí)現(xiàn)在游戲AI做操作行為判斷時(shí),也是使用整點(diǎn)運(yùn)算單元的。而現(xiàn)在很多游戲加入了防盜版機(jī)制,在運(yùn)行游戲時(shí)頻繁的加解密會(huì)消耗浮點(diǎn)運(yùn)算性能。所以有朋友使用較老的硬件運(yùn)行新游戲時(shí),會(huì)非常影響游戲運(yùn)行幀率。

所以整點(diǎn)運(yùn)算性能和浮點(diǎn)運(yùn)算性能都反映了CPU處理數(shù)據(jù)的能力。但是整點(diǎn)運(yùn)算性能還反映了控制程序流的的能力。

在計(jì)算機(jī)中,定點(diǎn)數(shù)不一定是整數(shù),而浮點(diǎn)數(shù)也不一定是小數(shù)。在計(jì)算機(jī)中,定點(diǎn)數(shù)是指小數(shù)點(diǎn)固定的數(shù),而浮點(diǎn)數(shù)是指小數(shù)點(diǎn)不固定的數(shù)。在計(jì)算機(jī)中采用IEEE 754標(biāo)準(zhǔn)進(jìn)行浮點(diǎn)數(shù)的存儲(chǔ)的,他可以精確的的表示某一個(gè)數(shù)據(jù)。

在早期浮點(diǎn)運(yùn)算單元并沒有一開始就加入到CPU設(shè)計(jì)中的。但是在計(jì)算機(jī)中,運(yùn)算單元都是邏輯電路,由浮點(diǎn)數(shù)的定義我們可以知道,在早期僅有整點(diǎn)數(shù)運(yùn)算單元而不帶有浮點(diǎn)數(shù)處理單元的 處理器上,處理浮點(diǎn)數(shù)的階碼、尾數(shù)的計(jì)算以及規(guī)格化就成為了很困難的事情,導(dǎo)致早期CPU在科學(xué)計(jì)算中依舊非常的緩慢。所以Intel就設(shè)計(jì)了獨(dú)立于8086和8088處理器外的8087數(shù)學(xué)輔助處理器。到后來隨著計(jì)算機(jī)不再是科學(xué)家的工具,也逐漸進(jìn)入了公眾視野,Intel在80486DX處理器核心內(nèi)首次集成了浮點(diǎn)運(yùn)算單元。


Intel 8087協(xié)處理器


Intel Core i7 7700k處理器的CPU-Z信息

早期的Intel x87系列數(shù)學(xué)運(yùn)算輔助處理器只是作為一個(gè)提高浮點(diǎn)運(yùn)算速度的處理器,而在現(xiàn)代處理器中,浮點(diǎn)計(jì)算功能會(huì)通過SIMD(Single Instruction Multiple Data,單指令多數(shù)據(jù)流)的技術(shù)實(shí)現(xiàn)并行計(jì)算能力。在打開CPU-Z后,開支持指令集一欄可以看到,現(xiàn)代處理器帶有的SSE指令集就有處理浮點(diǎn)運(yùn)算的能力。而在之后的發(fā)展中,也逐漸引入了SSE2,SSE3,SSE4,AVX,F(xiàn)MA等更加適用于現(xiàn)代軟件開發(fā)的擁有強(qiáng)大浮點(diǎn)運(yùn)算能力的指令集。

那接下來就有問題了,現(xiàn)代處理器加入了很多高度并行化的浮點(diǎn)運(yùn)算單元,相較以往單純CPU的浮點(diǎn)運(yùn)算能力有了非常大的飛躍,但是相對于現(xiàn)代的圖形處理器來說,這么些浮點(diǎn)運(yùn)算能力是不夠看的,那為什么不像幾十年前一樣不在CPU中集成浮點(diǎn)運(yùn)算單元呢??


Nvidia Geforce 256核心照片

對于這個(gè)問題,首先大家要了解為什么會(huì)獨(dú)立出來圖形處理器這種專有硬件的。在20世紀(jì)90年代,計(jì)算機(jī)多媒體逐漸開始興盛起來,在1998年到1999年間,Intel和AMD的CPU中已經(jīng)擁有了SSE或3DNow!這樣的SIMD浮點(diǎn)運(yùn)算指令集。但是隨著電子游戲的發(fā)展,計(jì)算機(jī)的使用者對于計(jì)算機(jī)的圖形性能有了更高的要求,但是此時(shí)的CPU內(nèi)浮點(diǎn)運(yùn)算性能并不滿足需求,所以在此后圖形處理器開始負(fù)擔(dān)更多的浮點(diǎn)運(yùn)算工作。


NvidiaCUDA核心工作流程

但圖形處理器的使用者看到如此高效能的浮點(diǎn)運(yùn)算處理器的時(shí)候就在思考如何能讓這類設(shè)備承擔(dān)除了圖形計(jì)算之外的浮點(diǎn)計(jì)算性能。乘著GPGPU(General-purpose GPU)概念的逐漸興起,顯卡上的統(tǒng)一渲染架構(gòu)的出現(xiàn),也讓這種計(jì)算方式真正成為現(xiàn)實(shí)。Nvidia在2007年正式發(fā)布了CUDA并行計(jì)算平臺(tái)。之后也出現(xiàn)了如openCL的通用計(jì)算API(應(yīng)用程序編程接口)。

到此我們突然發(fā)現(xiàn),GPU都來搶CPU的浮點(diǎn)運(yùn)算飯碗了,但為什么CPU非但沒有取消浮點(diǎn)運(yùn)算單元,反而其浮點(diǎn)運(yùn)算性能越來越強(qiáng)??


AMD推土機(jī)架構(gòu)示意圖

其實(shí)并不是沒有人想到這樣的情況,而是已經(jīng)與產(chǎn)品這么做了,就是AMD的推土機(jī)架構(gòu)。這個(gè)架構(gòu)放棄了之前的一個(gè)核心就由一套整數(shù)運(yùn)算單元和浮點(diǎn)運(yùn)算單元的組合,而是讓兩個(gè)核心共享一個(gè)浮點(diǎn)運(yùn)算單元組成一個(gè)簇,而AMD將這種架構(gòu)叫做CMT,又稱為群集多線程技術(shù),之后又將相對與Intel有優(yōu)勢的GPU核心集成進(jìn)CPU中,產(chǎn)生了APU處理器。

AMD當(dāng)時(shí)還為此成立了HSA基金會(huì),為解決CPU和GPU的內(nèi)存統(tǒng)一尋址問題,也提出了hUMA技術(shù)并用在了Sony的PS4游戲機(jī)上。


Sony Playstation 4主機(jī),CPU和GPU共享8GB GDDR5內(nèi)存

那為什么廠商做了這么多還是做不到用大規(guī)模的GPU取代CPU中的浮點(diǎn)運(yùn)算單元呢?運(yùn)算精度才是重點(diǎn)。CPU中的浮點(diǎn)運(yùn)算單元是為了更高精度浮點(diǎn)運(yùn)算準(zhǔn)備的。如在最新Intel處理器中的AVX指令集可以處理512位擴(kuò)展數(shù)據(jù),這樣大大提升了計(jì)算精度和速度。而GPU中的處理器都是為高度并行計(jì)算而設(shè)計(jì)的結(jié)構(gòu)相對簡單的核心,這些核心每一個(gè)都是SIMD處理器,但是能夠處理的數(shù)據(jù)精度是有限的,在Nvidia以及AMD圖形處理器上支持的數(shù)據(jù)精度大多是單精度和雙精度浮點(diǎn)計(jì)算(FP32和FP64),甚至隨著機(jī)器學(xué)習(xí),深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)的流行,最新的圖形處理器甚至支持了半精度浮點(diǎn)運(yùn)算(FP16)。

其次,由于在計(jì)算精度上相較于CPU中的浮點(diǎn)運(yùn)算單元不高,所以在這些處理器中也沒有內(nèi)置數(shù)據(jù)校驗(yàn)和數(shù)據(jù)補(bǔ)償處理的運(yùn)算單元。所以對于使用GPU進(jìn)行科學(xué)計(jì)算的人,需要在編程階段就避免這樣的問題。同時(shí)CPU和GPU在設(shè)計(jì)上就是非常不同的,CPU的浮點(diǎn)單元個(gè)數(shù)很少,但是單個(gè)浮點(diǎn)運(yùn)算單元所提供的性能是很強(qiáng)的。而GPU中是用過海量的SIMD單元堆砌出來的浮點(diǎn)運(yùn)算能力。在CPU設(shè)計(jì)時(shí),還需要設(shè)計(jì)大量的多級緩存來提高CPU的運(yùn)算速度。而GPU中通常只為這些SIMD處理單元內(nèi)置不多的緩存,而提供大量的內(nèi)存(顯存)。

所以綜合上面的分析,我們可以得出的結(jié)論是雖然GPU擁有更強(qiáng)大的浮點(diǎn)運(yùn)算性能,但是限于其計(jì)算單元的設(shè)計(jì),統(tǒng)一內(nèi)存架構(gòu)的設(shè)計(jì),其還是不能完全取代CPU中的浮點(diǎn)運(yùn)算核心。CPU中的整點(diǎn)運(yùn)算單元在肩負(fù)著如壓縮解壓,編譯器編譯程序,網(wǎng)絡(luò)路由,控制程序流等任務(wù)同時(shí),其浮點(diǎn)運(yùn)算核心也依舊在處理著圖像處理,科學(xué)計(jì)算等需要更高精度計(jì)算的任務(wù)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉