Intel發(fā)布基于10nm的下一代處理器架構(gòu)

時間：2018-12-17 11:12:06

關(guān)鍵字： intel英特爾 sunny cove架構(gòu)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]One API軟件：Intel宣布推出“One API”項目，以簡化跨CPU、GPU、FPGA、人工智能和其它加速器的各種計算引擎的編程。該項目包括一個全面、統(tǒng)一的開發(fā)工具組合，以將軟件匹配到能最大程

One API軟件：Intel宣布推出“One API”項目，以簡化跨CPU、GPU、FPGA、人工智能和其它加速器的各種計算引擎的編程。該項目包括一個全面、統(tǒng)一的開發(fā)工具組合，以將軟件匹配到能最大程度加速軟件代碼的硬件上。公開發(fā)行版本預(yù)計將于2019年發(fā)布。

傲騰技術(shù)：Intel傲騰數(shù)據(jù)中心級持久內(nèi)存作為一款新產(chǎn)品，集成了內(nèi)存般的性能以及數(shù)據(jù)的持久性和存儲的大容量。這項技術(shù)通過將更多數(shù)據(jù)放到更接近CPU的位置，使應(yīng)用在人工智能和大型數(shù)據(jù)庫中的更大量的數(shù)據(jù)集能夠獲得更快的處理速度。其大容量和數(shù)據(jù)的持久性減少了對存儲進行訪問時的時延損失，從而提高工作負載的性能。

Intel傲騰數(shù)據(jù)中心級持久內(nèi)存為CPU提供緩存行（64B）讀取。一般來說，當應(yīng)用把讀取操作定向到傲騰持久內(nèi)存或請求的數(shù)據(jù)不在DRAM中緩存時，傲騰持久內(nèi)存的平均空閑讀取延遲大約為350ns。如果實現(xiàn)規(guī)?；?，傲騰數(shù)據(jù)中心級固態(tài)盤的平均空閑讀取延遲約為10000ns（10μs），這將是顯著的改進。在某些情況下，當請求的數(shù)據(jù)在DRAM中時，不管是通過CPU的內(nèi)存控制器進行緩存還是由應(yīng)用所引導(dǎo)，內(nèi)存子系統(tǒng)的響應(yīng)速度預(yù)計與DRAM相同（小于100 ns）。

Intel還展示了傲騰與QLC固態(tài)硬盤的結(jié)合，將降低對最常用數(shù)據(jù)的訪問延遲?？傮w來說，這些對平臺和內(nèi)存的改進重塑了內(nèi)存和存儲層次結(jié)構(gòu)，從而為系統(tǒng)和應(yīng)用提供了完善的選擇組合。

深度學(xué)習(xí)參考堆棧（Deep Learning Reference Stack）：這是一個集成、高性能的開源堆棧，基于Intel至強可擴展平臺進行了優(yōu)化。該開源社區(qū)版本旨在確保人工智能開發(fā)者可以輕松訪問Intel平臺的所有特性和功能。深度學(xué)習(xí)參考堆棧經(jīng)過高度調(diào)優(yōu)，專為云原生環(huán)境而構(gòu)建。該版本可以降低集成多個軟件組件所帶來的復(fù)雜性，幫助開發(fā)人員快速進行原型開發(fā)，同時讓用戶有足夠的靈活度打造定制化的解決方案。

操作系統(tǒng)：Clear Linux 操作系統(tǒng)可根據(jù)個人開發(fā)需求進行定制，針對Intel平臺以及深度學(xué)習(xí)等特定用例進行了調(diào)優(yōu)；編排：Kubernetes可基于對Intel平臺的感知，管理和編排面向多節(jié)點集群的容器化應(yīng)用；容器：Docker容器和Kata容器利用Intel虛擬化技術(shù)來幫助保護容器；函數(shù)庫：Intel深度神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)核心函數(shù)庫（MKL DNN）是Intel高度優(yōu)化、面向數(shù)學(xué)函數(shù)性能的數(shù)學(xué)庫；運行時：Python針對Intel架構(gòu)進行了高度調(diào)優(yōu)和優(yōu)化，提供應(yīng)用和服務(wù)執(zhí)行運行時支持；框架：TensorFlow是一個領(lǐng)先的深度學(xué)習(xí)和機器學(xué)習(xí)框架；部署：KubeFlow是一個開源、行業(yè)驅(qū)動型部署工具，在Intel架構(gòu)上提供快速體驗，易于安裝和使用。