當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件
[導(dǎo)讀]引 言  在視頻監(jiān)控、遠(yuǎn)程視頻播放等系統(tǒng)中,通常需要將視頻圖形數(shù)據(jù)通過網(wǎng)絡(luò)傳輸?shù)竭h(yuǎn)程處理機上。作為數(shù)字信號處理專用處理器,DSP雖然在視頻壓縮等方面有很大的優(yōu)勢,但對諸如任務(wù)管理,網(wǎng)絡(luò)通信等功能的實現(xiàn).


引 言

在視頻監(jiān)控、遠(yuǎn)程視頻播放等系統(tǒng)中,通常需要將視頻圖形數(shù)據(jù)通過網(wǎng)絡(luò)傳輸?shù)竭h(yuǎn)程處理機上。作為數(shù)字信號處理專用處理器,DSP雖然在視頻壓縮等方面有很大的優(yōu)勢,但對諸如任務(wù)管理,網(wǎng)絡(luò)通信等功能的實現(xiàn)較困難。運行于通用嵌入式處理器的Linux操作系統(tǒng),開源,可以根據(jù)需要修改內(nèi)核,支持各種網(wǎng)絡(luò)協(xié)議,并且其任務(wù)調(diào)度機制性能卓越。綜合二者的優(yōu)點,嵌入式視頻平臺可以由DSP完成圖形處理功能,并通過高速接口把視頻數(shù)據(jù)傳輸給嵌入式微處理器,然后由嵌入式Linux系統(tǒng)完成網(wǎng)絡(luò)傳輸功能。

目前DSP與微處理器之間的高速通信方式有以下幾種:共享內(nèi)存,此種技術(shù)對軟硬件的設(shè)計要求都非常高,同樣效率也最高;通用高速總線接口,如PCI、 USB等,這種類型的通信方式采用復(fù)雜的鏈路協(xié)議,軟件設(shè)計困難;專用接口,如TI公司DSP提供的HPI(Host Port Inter-face)。本文研究了TMS320E)M642的HPI接口,并提出一種在TMS320DM642和AT91RM9200間高速通信的軟硬件實現(xiàn)方案。通過HPI接口,TMS320DM642可以高速地將實時視頻數(shù)據(jù)傳輸給AT91RM9200;在AT91RM9200上,Lnux驅(qū)動實現(xiàn)存儲器映射I/O和物理內(nèi)存重映射,避免了視頻數(shù)據(jù)在應(yīng)用程序與內(nèi)核之間的二次拷貝,提高了應(yīng)用程序的網(wǎng)絡(luò)發(fā)包效率。

1 HPI接口硬件設(shè)計

HPI是一種并行接口,支持32位(HPl32)和16位(HPll6)數(shù)據(jù)總線,通過HPI的數(shù)據(jù)寄存器(HPIDA、HlPIDF),ARM可以間接存取DSP的存儲空間。在DSP內(nèi)部,數(shù)據(jù)從存儲單元到HPI數(shù)據(jù)寄存器的傳輸,是由EDMA(增強DMA)控制器完成的。

HPI控制器的外圍引腳包括HD[0-31]、數(shù)據(jù)總線。HCNTL[O-1]是寄存器訪問控制線,HPI控制器有4個寄存器,通過這兩根控制線,DSP 可以確定ARM要訪問的寄存器。其中,HPIA地址寄存器,存放當(dāng)前訪問單元的地址;HPIC為控制寄存器,實現(xiàn)各種控制命令;HPIDA自增長數(shù)據(jù)寄存器,每訪問一次該寄存器HPIA的內(nèi)容加4;HPIDF固定地址數(shù)據(jù)寄存器,與HPIDA不同之處在于,訪問該寄存器后HPIA的內(nèi)容不變。HHWIL,高低位訪問控制線,它只用于HPll6模式中,該控制引腳決定寄存器的高或低16位被主機訪問。HR/nW,HPI控制器4個寄存器的讀寫控制線。 HDSl、HDS2和HCS,其中HDSl、HDS2可連接ARM的讀、寫控制線,HCS連接ARM的nCS7片選線,三者在DSP內(nèi)部組合形成一個 HSTROBE信號,當(dāng)HCS低有效并且HDSl或HDS2的讀或?qū)懙陀行?,決定數(shù)據(jù)寄存器(HPIDA、HPIDF)的讀或?qū)懖僮鳌AS,地址鎖存線,當(dāng)主機的地址線與數(shù)據(jù)線復(fù)用時,主機可用該控制線通知。DSP鎖存地址;其他不用該控制線情況時,應(yīng)接高電平。nHRDY,DSP輸出線,表示HPI 總線是否可訪問。nHINT,中斷輸出線,用于中斷ARM。

DSP與ARM接口電路如圖1所示。采用HPI16模式,16根數(shù)據(jù)線通過16245數(shù)據(jù)隔離器接到ARM數(shù)據(jù)總線的低16位,將HPI的片選空間置于 ARM的nCS7片選線上,HR/nW讀寫信號經(jīng)反向器接到ARM的AB4地址線,HCNTL[O-1]與ARM的地址線AB[2-3]相連,則HPI的 4個寄存器的讀基地址為0x80000000,寫基地址為0x80000010。在ARM端從這兩個地址開始訪問,相應(yīng)地對HPI 4個寄存器訪問。



ARM通過HPI讀寫DSP數(shù)據(jù)空間,須按以下三步順序執(zhí)行:首先,對HPIC寄存器初始化,主要針對HPI16模式最低位HWOB位設(shè)置,決定數(shù)據(jù)傳輸格式是按高半字在前(設(shè)置為0),還是低半字在前(設(shè)置為1),該位對于HPI32模式無效,可不設(shè)置;然后,對HPIA寄存器初始化,設(shè)置訪問單元的地址;最后通過讀寫數(shù)據(jù)寄存器(HPIDA、HPIDF)實現(xiàn)數(shù)據(jù)讀寫操作,其中讀寫HPIDA寄存器是完成連續(xù)地址單元讀寫操作,讀寫HPIDF寄存器是完成固定地址單元讀寫操作。注意,在ARM讀寫的過程中,如果DSP的nHRDY控制線一直為高,表示HPI數(shù)據(jù)總線未準(zhǔn)備好,ARM的讀寫操作必須等待;當(dāng)nHRDY為低后,ARM才繼續(xù)向下執(zhí)行指令。

2 Linux驅(qū)動設(shè)計

Linux雖然是一種整體式操作系統(tǒng),但允許在運行時動態(tài)加載或刪除功能模塊。這個特點方便了驅(qū)動功能模塊的開發(fā)。Linux系統(tǒng)支持兩種模塊調(diào)用方式:一種是靜態(tài)編譯,直接編譯進(jìn)內(nèi)核,在系統(tǒng)啟動時就運行;另外一種是動態(tài)加載,在內(nèi)核運行時,用insmod/rmmod實現(xiàn)模塊的加載和刪除功能。在嵌入式系統(tǒng)開發(fā)中,一般采用動態(tài)加載方式,避免了系統(tǒng)頻繁重啟。當(dāng)最終發(fā)布產(chǎn)品時,可以把模塊直接編譯進(jìn)內(nèi)核。這種處理方式比較簡單,且效率高。

Linux系統(tǒng)中,內(nèi)存地址主要涉及以下幾個概念:物理地址、內(nèi)核虛擬地址(包括內(nèi)核邏輯地址)和進(jìn)程虛擬地址。在內(nèi)核層,當(dāng)內(nèi)核要訪問某內(nèi)存空間時,用的是內(nèi)核虛擬地址,再由MMU(存儲器管理單元)將內(nèi)核虛擬地址轉(zhuǎn)換為物理地址。采用虛擬內(nèi)存技術(shù),每個進(jìn)程都有互不干涉的虛擬空間。三者直接映射的關(guān)系如圖2所示,其中內(nèi)核函數(shù)zap_page_range完成去掉物理地址與進(jìn)程虛擬地址映射關(guān)系的功能。



2.1 驅(qū)動結(jié)構(gòu)

在Linux中,設(shè)備也是作為文件來訪問的。VFS(虛擬文件系統(tǒng))為各種不同的文件系統(tǒng)提供了統(tǒng)一的訪問接口,通過這些接口,應(yīng)用程序可以直接使用open、read和IOctl等系統(tǒng)調(diào)用對設(shè)備進(jìn)行訪問和控制。

本例中,把HPI作為一個外圍設(shè)備,其驅(qū)動主要實現(xiàn)對設(shè)備的打開、關(guān)閉、內(nèi)存映射、視頻數(shù)據(jù)緩沖區(qū)管理和物理內(nèi)存切換等功能。根據(jù)原理圖,可以確定HPI 四個寄存器對應(yīng)的物理地址,在驅(qū)動初始化過程中,調(diào)用ioremap_uncache函數(shù)把物理地址映射為內(nèi)核虛擬地址,在驅(qū)動層通過內(nèi)核虛擬地址訪問 HPI的4個寄存器。

存儲器映射I/O把HPI驅(qū)動分配的數(shù)據(jù)空間直接映射到應(yīng)用程序的虛擬地址空間,應(yīng)用程序直接訪問該空間,避免了用read/write系統(tǒng)調(diào)用導(dǎo)致的視頻數(shù)據(jù)二次拷貝。在內(nèi)核里,由驅(qū)動分配一定的緩存,當(dāng)應(yīng)用程序不能及時處理DSP發(fā)送過來的視頻數(shù)據(jù),可以緩存這些數(shù)據(jù);當(dāng)應(yīng)用程序處理完一幀圖像時,采用Linux的物理內(nèi)存切換技術(shù),把下一幀數(shù)據(jù)所在的物理地址重映射到應(yīng)用程序的同一虛擬地址,這樣,應(yīng)用程序不用頻繁調(diào)用mmap函數(shù)映射內(nèi)存。



2.2 存儲器映射I/O

一般情況下,當(dāng)應(yīng)用程序用read/write讀寫設(shè)備數(shù)據(jù)時,該設(shè)備的驅(qū)動先將設(shè)備數(shù)據(jù)從設(shè)備上采樣到內(nèi)核緩沖區(qū),再從內(nèi)核緩沖區(qū)拷貝到應(yīng)用程序緩沖區(qū),數(shù)據(jù)經(jīng)過了兩次拷貝。當(dāng)數(shù)據(jù)量比較小時,如一些控制命令或狀態(tài)信息,對系統(tǒng)性能幾乎沒有影響。但是,如果一次傳輸?shù)臄?shù)據(jù)量比較大,比如視頻顯卡上的實時視頻圖像,兩次拷貝將大大影響系統(tǒng)的數(shù)據(jù)處理效率。這時,可采用存儲器映射I/O技術(shù),在內(nèi)核層存儲器映射I/O由函數(shù) remap_page_range完成。

由remap_page_range函數(shù)的原型可以知道,該函數(shù)的意義在于通過將特定物理地址映射到進(jìn)程虛擬地址,進(jìn)程可以訪問特定的物理地址,而這在普通情況下是不可能的。在本例中,當(dāng)進(jìn)程調(diào)用mmap函數(shù)進(jìn)行存儲映射時,內(nèi)核會調(diào)用驅(qū)動注冊的hpi_mmap函數(shù),傳入的參數(shù)之一包括進(jìn)程虛擬地址。在 hpi_mmap函數(shù)里,調(diào)用remap_page_range完成從緩沖區(qū)物理地址到進(jìn)程虛擬地址的映射。hpi_mmap函數(shù)實現(xiàn)如下:



其中vm_flags字段設(shè)置了VM_RESERVED,表示該數(shù)據(jù)緩沖區(qū)一直常駐內(nèi)存,在內(nèi)存不足時,不會被交換出去。內(nèi)核和進(jìn)程同時對數(shù)據(jù)緩沖區(qū)讀寫,為了保證數(shù)據(jù)的一致性,對該區(qū)域的訪問不應(yīng)該經(jīng)過CPU內(nèi)部的緩沖區(qū),所以用pgprot_noncached設(shè)置非緩沖標(biāo)志。

mmap系統(tǒng)調(diào)用返回一個進(jìn)程虛擬地址,該地址就是vma->vm_start字段,進(jìn)程對該虛擬地址的訪問,最終變?yōu)閷ξ锢淼刂稢ACHE_PHY的訪問。

2.3 數(shù)據(jù)緩沖管理

緩沖管理的主要任務(wù)是,當(dāng)ARM接收到新的一幀時,為其分配相應(yīng)的緩存,并將在物理地址重映射到進(jìn)程虛擬地址。當(dāng)應(yīng)用程序處理該幀時,緩沖管理負(fù)責(zé)內(nèi)存區(qū)域的回收。

當(dāng)Linux內(nèi)核啟動時,可以傳人參數(shù)mem=PHY_LEN,指定存儲空間的大小。在本例中,內(nèi)核啟動時為HPI驅(qū)動預(yù)留8 MB的高端物理內(nèi)存。在本例中,借助Linux中對普通外設(shè)I/O內(nèi)存(PCI卡內(nèi)存等)管理的思想,用高度為2的樹表示一塊連續(xù)的區(qū)域。該數(shù)據(jù)結(jié)構(gòu)的優(yōu)點在于,資源分配簡單,把離散的小內(nèi)存合并為一塊連續(xù)的大緩沖區(qū)的算法復(fù)雜度為O(1)。具體實現(xiàn)請參閱內(nèi)核源碼中resource結(jié)構(gòu)相關(guān)部分。

重映射新一幀視頻數(shù)據(jù)到進(jìn)程虛擬地址是緩沖管理的另一任務(wù)。因為前一幀數(shù)據(jù)物理地址已經(jīng)映射到進(jìn)程虛擬地址,需要先將前幀物理地址與進(jìn)程虛擬地址的映射關(guān)系去掉,然后重映射當(dāng)前幀數(shù)據(jù)到進(jìn)程虛擬地址。去掉物理地址與進(jìn)程虛擬地址的映射關(guān)系由內(nèi)核函數(shù)zap_page_range完成,調(diào)用該函數(shù)后,如果進(jìn)程再訪問該虛擬地址,內(nèi)核會產(chǎn)生缺頁中斷。這時再用remap_page_range建立當(dāng)前幀數(shù)據(jù)物理地址與進(jìn)程虛擬地址間的映射關(guān)系,進(jìn)程就可以通過同一虛擬地址訪問當(dāng)前幀的數(shù)據(jù)了。該方法的意義在于,進(jìn)程不用頻繁調(diào)用mmap建立物理地址與虛擬地址的映射,只用調(diào)用一次,當(dāng)有新數(shù)據(jù)到達(dá)時,驅(qū)動自動將新幀數(shù)據(jù)映射到先前的進(jìn)程虛擬地址,提高了進(jìn)程處理視頻數(shù)據(jù)的效率。實現(xiàn)代碼如下:



結(jié) 語

在當(dāng)前視頻處理平臺上,視頻處理、視頻傳輸、復(fù)雜任務(wù)管理等工作一般都是由一塊DSP處理器單獨完成,結(jié)合其他嵌入式微處理器協(xié)同工作的技術(shù)方案剛剛起步。經(jīng)測試,在基于本文提出的高速通信方法設(shè)計的視頻處理平臺上,TMS320DM642與AT9lRM9200間的通信速率可以達(dá)到50 Mbps,帶寬足夠用來傳輸MPEG等壓縮視頻數(shù)據(jù)。如果用HPl32模式,速度還會大幅度提高。同時,因為Linux系統(tǒng)的實時性不是很強,如果采用其他實時性強的操作系統(tǒng),如Vxworks等,系統(tǒng)性能還會有大的提高。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉