[導(dǎo)讀]硬盤是大家都很熟悉的設(shè)備,一路走來,從HDD到SSD,從SATA到NVMe,作為NVMe SSD的前端接口,PCIe再次進(jìn)入我們的視野。作為x86體系關(guān)鍵的一環(huán),PCIe標(biāo)準(zhǔn)歷經(jīng)PCI,PCI-X和PCIe,走過近30年時(shí)光。其中Host發(fā)現(xiàn)與查找設(shè)備的方式卻一脈沿襲,今天我們先來聊一聊PCIe設(shè)備在一個(gè)系統(tǒng)中是如何發(fā)現(xiàn)與訪問的。
硬盤是大家都很熟悉的設(shè)備,一路走來,從HDD到SSD,從SATA到NVMe,作為NVMe SSD的前端接口,PCIe再次進(jìn)入我們的視野。作為x86體系關(guān)鍵的一環(huán),PCIe標(biāo)準(zhǔn)歷經(jīng)PCI,PCI-X和PCIe,走過近30年時(shí)光。其中Host發(fā)現(xiàn)與查找設(shè)備的方式卻一脈沿襲,今天我們先來聊一聊PCIe設(shè)備在一個(gè)系統(tǒng)中是如何發(fā)現(xiàn)與訪問的。
首先我們來看一下在x86系統(tǒng)中,PCIe是什么樣的一個(gè)體系架構(gòu)。下圖是一個(gè)PCIe的拓?fù)浣Y(jié)構(gòu)示例,PCIe協(xié)議支持256個(gè)Bus, 每條Bus最多支持32個(gè)Device,每個(gè)Device最多支持8個(gè)Function,所以由BDF(Bus,device,function)構(gòu)成了每個(gè)PCIe設(shè)備節(jié)點(diǎn)的身份證號(hào)。
PCIe體系架構(gòu)一般由root complex,switch,endpoint等類型的PCIe設(shè)備組成,在root complex和switch中通常會(huì)有一些embeded endpoint(這種設(shè)備對(duì)外不出PCIe接口)。這么多的設(shè)備,CPU啟動(dòng)后要怎么去找到并認(rèn)出它們呢? Host對(duì)PCIe設(shè)備掃描是采用了深度優(yōu)先算法,其過程簡(jiǎn)要來說是對(duì)每一個(gè)可能的分支路徑深入到不能再深入為止,而且每個(gè)節(jié)點(diǎn)只能訪問一次。我們一般稱這個(gè)過程為PCIe設(shè)備枚舉。枚舉過程中host通過配置讀事物包來獲取下游設(shè)備的信息,通過配置寫事物包對(duì)下游設(shè)備進(jìn)行設(shè)置。
第一步,PCI Host主橋掃描Bus 0上的設(shè)備(在一個(gè)處理器系統(tǒng)中,一般將Root complex中與Host Bridge相連接的PCI總線命名為PCI Bus 0),系統(tǒng)首先會(huì)忽略Bus 0上的embedded EP等不會(huì)掛接PCI橋的設(shè)備,主橋發(fā)現(xiàn)Bridge 1后,將Bridge1 下面的PCI Bus定為 Bus 1,系統(tǒng)將初始化Bridge 1的配置空間,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成0和1,以表明Bridge1 的上游總線是0,下游總線是1,由于還無法確定Bridge1下掛載設(shè)備的具體情況,系統(tǒng)先暫時(shí)將Subordinate Bus Number設(shè)為0xFF。
第二步,系統(tǒng)開始掃描Bus 1,將會(huì)發(fā)現(xiàn)Bridge 3,并發(fā)現(xiàn)這是一個(gè)switch設(shè)備。系統(tǒng)將Bridge 3下面的PCI Bus定為Bus 2,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成1和2,和上一步一樣暫時(shí)把Bridge 3 的Subordinate Bus Number設(shè)為0xFF。
第三步,系統(tǒng)繼續(xù)掃描Bus 2,將會(huì)發(fā)現(xiàn)Bridge 4。繼續(xù)掃描,系統(tǒng)會(huì)發(fā)現(xiàn)Bridge下面掛載的NVMe SSD設(shè)備,系統(tǒng)將Bridge 4下面的PCI Bus定為Bus 3,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成2和3,因?yàn)锽us3下面掛的是端點(diǎn)設(shè)備(葉子節(jié)點(diǎn)),下面不會(huì)再有下游總線了,因此Bridge 4的Subordinate Bus Number的值可以確定為3。
第四步,完成Bus 3的掃描后,系統(tǒng)返回到Bus 2繼續(xù)掃描,會(huì)發(fā)現(xiàn)Bridge 5。繼續(xù)掃描,系統(tǒng)會(huì)發(fā)現(xiàn)下面掛載的NIC設(shè)備,系統(tǒng)將Bridge 5下面的PCI Bus設(shè)置為Bus 4,并將該橋的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成2和4,因?yàn)镹IC同樣是端點(diǎn)設(shè)備,Bridge 5的Subordinate Bus Number的值可以確定為4。
第五步,除了Bridge 4和Bridge 5以外,Bus2下面沒有其他設(shè)備了,因此返回到Bridge 3,Bus 4是找到的掛載在這個(gè)Bridge下的最后一個(gè)bus號(hào),因此將Bridge 3的Subordinate Bus Number設(shè)置為4。Bridge 3的下游設(shè)備都已經(jīng)掃描完畢,繼續(xù)向上返回到Bridge 1,同樣將Bridge 1的Subordinate Bus Number設(shè)置為4。
第六步,系統(tǒng)返回到Bus0繼續(xù)掃描,會(huì)發(fā)現(xiàn)Bridge 2,系統(tǒng)將Bridge 2下面的PCI Bus定為Bus 5。并將Bridge 2的Primary Bus Number 和 Secondary Bus Number寄存器分別設(shè)置成0和5, Graphics card也是端點(diǎn)設(shè)備,因此Bridge 2 的Subordinate Bus Number的值可以確定為5。
至此,掛在PCIe總線上的所有設(shè)備都被掃描到,枚舉過程結(jié)束,Host通過這一過程獲得了一個(gè)完整的PCIe設(shè)備拓?fù)浣Y(jié)構(gòu)。
系統(tǒng)上電以后,host會(huì)自動(dòng)完成上述的設(shè)備枚舉過程。除一些專有系統(tǒng)外,普通系統(tǒng)只會(huì)在開機(jī)階段進(jìn)行進(jìn)行設(shè)備的掃描,啟動(dòng)成功后(枚舉過程結(jié)束),即使插入一個(gè)PCIe設(shè)備,系統(tǒng)也不會(huì)再去識(shí)別它。
在linux操作系統(tǒng)中,我們可以通過lspci –v -t命令來查詢系統(tǒng)上電階段掃描到的PCIe設(shè)備,執(zhí)行結(jié)果會(huì)以一個(gè)樹的形式列出系統(tǒng)中所有的pcie設(shè)備。如下圖所示,其中黃色方框中的PCIe設(shè)備是北京憶芯科技公司(Bejing Starblaze Technology Co., LTD.)推出的STAR1000系列NVMe SSD主控芯片,圖中顯示的9d32是Starblaze在PCI-SIG組織的注冊(cè)碼,1000是設(shè)備系列號(hào)。
STAR1000設(shè)備的BDF也可以從上圖中找出,其中bus是0x3C,device是0x00,function是0x0,BDF表示為3C:00.0,與之對(duì)應(yīng)的上游端口是00:1d.0。
我們可以通過“l(fā)spci –xxx –s 3C:00.0”命令來列出該設(shè)備的PCIe詳細(xì)信息(技術(shù)發(fā)燒友或數(shù)字控請(qǐng)關(guān)注該部分)。這些內(nèi)容存儲(chǔ)在PCIe配置空間,它們描述的是PCIe本身的特性。如下圖所示(低位地址0x00在最左邊),可以看到這是一個(gè)非易失性存儲(chǔ)控制器,0x00起始地址是PCIe的Vendor ID和Device ID。Class code 0x010802表示這是一個(gè)NVMe存儲(chǔ)設(shè)備。0x40是第一組capability的指針,如果你需要查看PCIe的特性,就需要從這個(gè)位置開始去查詢,在每組特征的頭字段都會(huì)給出下一組特性的起始地址。從0x40地址開始依次是power management,MSI中斷,鏈路控制與狀態(tài),MSI-X中斷等特性組。這兒特別列出了鏈路特征中的一個(gè)0x43字段,表示STAR1000設(shè)備是一個(gè)x4lane的鏈接,支持PCIe Gen3速率(8Gbps)。
當(dāng)然也可以使用lspci –vvv –s 3C:00.0命令來查看設(shè)備特性,初學(xué)者看到下面的列表也就一目了然了。
Host在枚舉設(shè)備的同時(shí)也會(huì)對(duì)設(shè)備進(jìn)行配置,每個(gè)PCIe設(shè)備都會(huì)指定一段CPU memory訪問空間,從上面的圖中我們可以看到這個(gè)設(shè)備支持兩段訪問空間,一段的大小是1M byte,另一段的大小是256K byte,系統(tǒng)會(huì)分別指定它們的基地址?;刂放渲猛瓿梢院?,Host就可以通過地址來對(duì)PCIe memory空間進(jìn)行訪問了。
PCIe memory空間關(guān)聯(lián)的是PCIe設(shè)備物理功能,對(duì)于STAR1000系列芯片而言,物理功能是NVMe,memory中存放的是NMVe的控制與狀態(tài)信息,對(duì)于NMVe的控制以及工作狀態(tài)的獲取,都需要通過memory訪問來實(shí)現(xiàn)。
下面以NVMe命令下發(fā)為例簡(jiǎn)單描述PCIe設(shè)備的memory訪問。NVMe命令下發(fā)的基本操作是1)Host寫doorbell寄存器,此時(shí)使用PCIe memory寫請(qǐng)求。如下圖所示,host發(fā)出一個(gè)memory write(MWr)請(qǐng)求,該請(qǐng)求經(jīng)過switch到達(dá)要訪問的NVMe SSD設(shè)備。
這個(gè)請(qǐng)求會(huì)被端點(diǎn)設(shè)備接收并執(zhí)行2)NVMe讀取命令操作。如下圖所示,此時(shí)NVMe SSD作為請(qǐng)求者,發(fā)出一個(gè)memory read(MRd)請(qǐng)求,該請(qǐng)求經(jīng)過Switch到達(dá)Host,Host作為完成者會(huì)返回一個(gè)完成事物包(CplD),將訪問結(jié)果返回給NVMe SSD。
這樣,一個(gè)NVMe的命令下發(fā)過程就完成了。同樣,NVMe的其他操作比如各種隊(duì)列操作,命令與完成,數(shù)據(jù)傳輸都是通過PCIe memory訪問的方式進(jìn)行的,此處不再詳述。
通過上面的描述,相信能夠幫助大家了解PCIe的設(shè)備枚舉和memory空間訪問。以后會(huì)繼續(xù)與大家探討PCIe的其他內(nèi)容,比如PCIe的協(xié)議分層,鏈路建立,功耗管理等等。目前PCIe協(xié)議還正在不斷的快速演進(jìn)中,2017年發(fā)布的PCIe Gen4標(biāo)準(zhǔn),每條Serdes支持的速率已經(jīng)達(dá)到16Gbps,Gen5也在加速制定中,其速率會(huì)再翻一倍達(dá)到32Gbps。Starblaze會(huì)緊跟技術(shù)的發(fā)展趨勢(shì),提供速率更高,性能更好更穩(wěn)定的NVMe SSD系列產(chǎn)品。
版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系刪除。
成功為華為“續(xù)命:中國芯片之父張汝京
一個(gè)工程師的“噩夢(mèng)”:剛分清CPU和GPU,卻發(fā)現(xiàn)還有……
這位“華為天才少年”,竟然要我用“充電寶”打《只狼》
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!
欲知詳情,請(qǐng)下載word文檔
下載文檔
掃描二維碼,關(guān)注更多精彩內(nèi)容
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。
關(guān)鍵字:
阿維塔
塞力斯
華為
加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...
關(guān)鍵字:
AWS
AN
BSP
數(shù)字化
倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...
關(guān)鍵字:
汽車
人工智能
智能驅(qū)動(dòng)
BSP
北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...
關(guān)鍵字:
亞馬遜
解密
控制平面
BSP
8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。
關(guān)鍵字:
騰訊
編碼器
CPU
8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。
關(guān)鍵字:
華為
12nm
EDA
半導(dǎo)體
8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。
關(guān)鍵字:
華為
12nm
手機(jī)
衛(wèi)星通信
要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...
關(guān)鍵字:
通信
BSP
電信運(yùn)營商
數(shù)字經(jīng)濟(jì)
北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...
關(guān)鍵字:
VI
傳輸協(xié)議
音頻
BSP
北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長三角投資(上海)有限...
關(guān)鍵字:
BSP
信息技術(shù)
山海路引?嵐悅新程 三亞2024年8月27日 /美通社/ --?近日,海南地區(qū)六家凱悅系酒店與中國高端新能源車企嵐圖汽車(VOYAH)正式達(dá)成戰(zhàn)略合作協(xié)議。這一合作標(biāo)志著兩大品牌在高端出行體驗(yàn)和環(huán)保理念上的深度融合,將...
關(guān)鍵字:
新能源
BSP
PLAYER
ASIA
上海2024年8月28日 /美通社/ -- 8月26日至8月28日,AHN LAN安嵐與股神巴菲特的孫女妮可?巴菲特共同開啟了一場(chǎng)自然和藝術(shù)的療愈之旅。 妮可·巴菲特在療愈之旅活動(dòng)現(xiàn)場(chǎng)合影 ...
關(guān)鍵字:
MIDDOT
BSP
LAN
SPI
8月29日消息,近日,華為董事、質(zhì)量流程IT總裁陶景文在中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式上表示,中國科技企業(yè)不應(yīng)怕美國對(duì)其封鎖。
關(guān)鍵字:
華為
12nm
EDA
半導(dǎo)體
上海2024年8月26日 /美通社/ -- 近日,全球領(lǐng)先的消費(fèi)者研究與零售監(jiān)測(cè)公司尼爾森IQ(NielsenIQ)迎來進(jìn)入中國市場(chǎng)四十周年的重要里程碑,正式翻開在華發(fā)展新篇章。自改革開放以來,中國市場(chǎng)不斷展現(xiàn)出前所未有...
關(guān)鍵字:
BSP
NI
SE
TRACE
上海2024年8月26日 /美通社/ -- 第二十二屆跨盈年度B2B營銷高管峰會(huì)(CC2025)將于2025年1月15-17日在上海舉辦,本次峰會(huì)早鳥票注冊(cè)通道開啟,截止時(shí)間10月11日。 了解更多會(huì)議信息:cc.co...
關(guān)鍵字:
BSP
COM
AI
INDEX
上海2024年8月26日 /美通社/ -- 今日,高端全合成潤滑油品牌美孚1號(hào)攜手品牌體驗(yàn)官周冠宇,開啟全新旅程,助力廣大車主通過駕駛?cè)ヌ剿鞲鼜V闊的世界。在全新發(fā)布的品牌視頻中,周冠宇及不同背景的消費(fèi)者表達(dá)了對(duì)駕駛的熱愛...
關(guān)鍵字:
BSP
汽車制造
此次發(fā)布標(biāo)志著Cision首次為亞太市場(chǎng)量身定制全方位的媒體監(jiān)測(cè)服務(wù)。 芝加哥2024年8月27日 /美通社/ -- 消費(fèi)者和媒體情報(bào)、互動(dòng)及傳播解決方案的全球領(lǐng)導(dǎo)者Cis...
關(guān)鍵字:
CIS
IO
SI
BSP
上海2024年8月27日 /美通社/ -- 近來,具有強(qiáng)大學(xué)習(xí)、理解和多模態(tài)處理能力的大模型迅猛發(fā)展,正在給人類的生產(chǎn)、生活帶來革命性的變化。在這一變革浪潮中,物聯(lián)網(wǎng)成為了大模型技術(shù)發(fā)揮作用的重要陣地。 作為全球領(lǐng)先的...
關(guān)鍵字:
模型
移遠(yuǎn)通信
BSP
高通
北京2024年8月27日 /美通社/ -- 高途教育科技公司(紐約證券交易所股票代碼:GOTU)("高途"或"公司"),一家技術(shù)驅(qū)動(dòng)的在線直播大班培訓(xùn)機(jī)構(gòu),今日發(fā)布截至2024年6月30日第二季度未經(jīng)審計(jì)財(cái)務(wù)報(bào)告。 2...
關(guān)鍵字:
BSP
電話會(huì)議
COM
TE
8月26日消息,華為公司最近正式啟動(dòng)了“華為AI百校計(jì)劃”,向國內(nèi)高校提供基于昇騰云服務(wù)的AI計(jì)算資源。
關(guān)鍵字:
華為
12nm
EDA
半導(dǎo)體