基于DSP的HPI接口的視頻數(shù)據(jù)傳輸系統(tǒng)設計

時間：2018-06-21 19:20:01

關鍵字： DSP hpi接口傳輸系統(tǒng) 總線與接口視頻數(shù)據(jù)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]引言　　在視頻監(jiān)控、遠程視頻播放等系統(tǒng)中，通常需要將視頻圖形數(shù)據(jù)通過網絡傳輸?shù)竭h程處理機上。作為數(shù)字信號處理專用處理器，DSP雖然在視頻壓縮等方面有很大的優(yōu)勢，但對諸如任務管理，網絡通信等功能的實現(xiàn).

引言

在視頻監(jiān)控、遠程視頻播放等系統(tǒng)中，通常需要將視頻圖形數(shù)據(jù)通過網絡傳輸?shù)竭h程處理機上。作為數(shù)字信號處理專用處理器，DSP雖然在視頻壓縮等方面有很大的優(yōu)勢，但對諸如任務管理，網絡通信等功能的實現(xiàn)較困難。運行于通用嵌入式處理器的Linux操作系統(tǒng)，開源，可以根據(jù)需要修改內核，支持各種網絡協(xié)議，并且其任務調度機制性能卓越。綜合二者的優(yōu)點，嵌入式視頻平臺可以由DSP完成圖形處理功能，并通過高速接口把視頻數(shù)據(jù)傳輸給嵌入式微處理器，然后由嵌入式Linux系統(tǒng)完成網絡傳輸功能。

目前DSP與微處理器之間的高速通信方式有以下幾種：共享內存，此種技術對軟硬件的設計要求都非常高，同樣效率也最高；通用高速總線接口，如PCI、 USB等，這種類型的通信方式采用復雜的鏈路協(xié)議，軟件設計困難；專用接口，如TI公司DSP提供的HPI(Host Port Inter-face)。本文研究了TMS320E)M642的HPI接口，并提出一種在TMS320DM642和AT91RM9200間高速通信的軟硬件實現(xiàn)方案。通過HPI接口，TMS320DM642可以高速地將實時視頻數(shù)據(jù)傳輸給AT91RM9200；在AT91RM9200上，Lnux驅動實現(xiàn)存儲器映射I／O和物理內存重映射，避免了視頻數(shù)據(jù)在應用程序與內核之間的二次拷貝，提高了應用程序的網絡發(fā)包效率。

1 HPI接口硬件設計

HPI是一種并行接口，支持32位(HPl32)和16位(HPll6)數(shù)據(jù)總線，通過HPI的數(shù)據(jù)寄存器(HPIDA、HlPIDF)，ARM可以間接存取DSP的存儲空間。在DSP內部，數(shù)據(jù)從存儲單元到HPI數(shù)據(jù)寄存器的傳輸，是由EDMA(增強DMA)控制器完成的。

HPI控制器的外圍引腳包括HD[0-31]、數(shù)據(jù)總線。HCNTL[O-1]是寄存器訪問控制線，HPI控制器有4個寄存器，通過這兩根控制線，DSP 可以確定ARM要訪問的寄存器。其中，HPIA地址寄存器，存放當前訪問單元的地址；HPIC為控制寄存器，實現(xiàn)各種控制命令；HPIDA自增長數(shù)據(jù)寄存器，每訪問一次該寄存器HPIA的內容加4；HPIDF固定地址數(shù)據(jù)寄存器，與HPIDA不同之處在于，訪問該寄存器后HPIA的內容不變。HHWIL，高低位訪問控制線，它只用于HPll6模式中，該控制引腳決定寄存器的高或低16位被主機訪問。HR／nW，HPI控制器4個寄存器的讀寫控制線。 HDSl、HDS2和HCS，其中HDSl、HDS2可連接ARM的讀、寫控制線，HCS連接ARM的nCS7片選線，三者在DSP內部組合形成一個 HSTROBE信號，當HCS低有效并且HDSl或HDS2的讀或寫低有效，決定數(shù)據(jù)寄存器(HPIDA、HPIDF)的讀或寫操作。HAS，地址鎖存線，當主機的地址線與數(shù)據(jù)線復用時，主機可用該控制線通知。DSP鎖存地址；其他不用該控制線情況時，應接高電平。nHRDY，DSP輸出線，表示HPI 總線是否可訪問。nHINT，中斷輸出線，用于中斷ARM。

DSP與ARM接口電路如圖1所示。采用HPI16模式，16根數(shù)據(jù)線通過16245數(shù)據(jù)隔離器接到ARM數(shù)據(jù)總線的低16位，將HPI的片選空間置于 ARM的nCS7片選線上，HR／nW讀寫信號經反向器接到ARM的AB4地址線，HCNTL[O-1]與ARM的地址線AB[2-3]相連，則HPI的 4個寄存器的讀基地址為0x80000000，寫基地址為0x80000010。在ARM端從這兩個地址開始訪問，相應地對HPI 4個寄存器訪問。

ARM通過HPI讀寫DSP數(shù)據(jù)空間，須按以下三步順序執(zhí)行：首先，對HPIC寄存器初始化，主要針對HPI16模式最低位HWOB位設置，決定數(shù)據(jù)傳輸格式是按高半字在前(設置為0)，還是低半字在前(設置為1)，該位對于HPI32模式無效，可不設置；然后，對HPIA寄存器初始化，設置訪問單元的地址；最后通過讀寫數(shù)據(jù)寄存器(HPIDA、HPIDF)實現(xiàn)數(shù)據(jù)讀寫操作，其中讀寫HPIDA寄存器是完成連續(xù)地址單元讀寫操作，讀寫HPIDF寄存器是完成固定地址單元讀寫操作。注意，在ARM讀寫的過程中，如果DSP的nHRDY控制線一直為高，表示HPI數(shù)據(jù)總線未準備好，ARM的讀寫操作必須等待；當nHRDY為低后，ARM才繼續(xù)向下執(zhí)行指令。

2 Linux驅動設計

Linux雖然是一種整體式操作系統(tǒng)，但允許在運行時動態(tài)加載或刪除功能模塊。這個特點方便了驅動功能模塊的開發(fā)。Linux系統(tǒng)支持兩種模塊調用方式：一種是靜態(tài)編譯，直接編譯進內核，在系統(tǒng)啟動時就運行；另外一種是動態(tài)加載，在內核運行時，用insmod／rmmod實現(xiàn)模塊的加載和刪除功能。在嵌入式系統(tǒng)開發(fā)中，一般采用動態(tài)加載方式，避免了系統(tǒng)頻繁重啟。當最終發(fā)布產品時，可以把模塊直接編譯進內核。這種處理方式比較簡單，且效率高。

Linux系統(tǒng)中，內存地址主要涉及以下幾個概念：物理地址、內核虛擬地址(包括內核邏輯地址)和進程虛擬地址。在內核層，當內核要訪問某內存空間時，用的是內核虛擬地址，再由MMU(存儲器管理單元)將內核虛擬地址轉換為物理地址。采用虛擬內存技術，每個進程都有互不干涉的虛擬空間。三者直接映射的關系如圖2所示，其中內核函數(shù)zap_page_range完成去掉物理地址與進程虛擬地址映射關系的功能。

2．1 驅動結構

在Linux中，設備也是作為文件來訪問的。VFS(虛擬文件系統(tǒng))為各種不同的文件系統(tǒng)提供了統(tǒng)一的訪問接口，通過這些接口，應用程序可以直接使用open、read和IOctl等系統(tǒng)調用對設備進行訪問和控制。

本例中，把HPI作為一個外圍設備，其驅動主要實現(xiàn)對設備的打開、關閉、內存映射、視頻數(shù)據(jù)緩沖區(qū)管理和物理內存切換等功能。根據(jù)原理圖，可以確定HPI 四個寄存器對應的物理地址，在驅動初始化過程中，調用ioremap_uncache函數(shù)把物理地址映射為內核虛擬地址，在驅動層通過內核虛擬地址訪問 HPI的4個寄存器。

存儲器映射I／O把HPI驅動分配的數(shù)據(jù)空間直接映射到應用程序的虛擬地址空間，應用程序直接訪問該空間，避免了用read／write系統(tǒng)調用導致的視頻數(shù)據(jù)二次拷貝。在內核里，由驅動分配一定的緩存，當應用程序不能及時處理DSP發(fā)送過來的視頻數(shù)據(jù)，可以緩存這些數(shù)據(jù)；當應用程序處理完一幀圖像時，采用Linux的物理內存切換技術，把下一幀數(shù)據(jù)所在的物理地址重映射到應用程序的同一虛擬地址，這樣，應用程序不用頻繁調用mmap函數(shù)映射內存。

2．2 存儲器映射I／O

一般情況下，當應用程序用read／write讀寫設備數(shù)據(jù)時，該設備的驅動先將設備數(shù)據(jù)從設備上采樣到內核緩沖區(qū)，再從內核緩沖區(qū)拷貝到應用程序緩沖區(qū)，數(shù)據(jù)經過了兩次拷貝。當數(shù)據(jù)量比較小時，如一些控制命令或狀態(tài)信息，對系統(tǒng)性能幾乎沒有影響。但是，如果一次傳輸?shù)臄?shù)據(jù)量比較大，比如視頻顯卡上的實時視頻圖像，兩次拷貝將大大影響系統(tǒng)的數(shù)據(jù)處理效率。這時，可采用存儲器映射I／O技術，在內核層存儲器映射I／O由函數(shù) remap_page_range完成。

由remap_page_range函數(shù)的原型可以知道，該函數(shù)的意義在于通過將特定物理地址映射到進程虛擬地址，進程可以訪問特定的物理地址，而這在普通情況下是不可能的。在本例中，當進程調用mmap函數(shù)進行存儲映射時，內核會調用驅動注冊的hpi_mmap函數(shù)，傳入的參數(shù)之一包括進程虛擬地址。在 hpi_mmap函數(shù)里，調用remap_page_range完成從緩沖區(qū)物理地址到進程虛擬地址的映射。hpi_mmap函數(shù)實現(xiàn)如下：

其中vm_flags字段設置了VM_RESERVED，表示該數(shù)據(jù)緩沖區(qū)一直常駐內存，在內存不足時，不會被交換出去。內核和進程同時對數(shù)據(jù)緩沖區(qū)讀寫，為了保證數(shù)據(jù)的一致性，對該區(qū)域的訪問不應該經過CPU內部的緩沖區(qū)，所以用pgprot_noncached設置非緩沖標志。

mmap系統(tǒng)調用返回一個進程虛擬地址，該地址就是vma->vm_start字段，進程對該虛擬地址的訪問，最終變?yōu)閷ξ锢淼刂稢ACHE_PHY的訪問。

2．3 數(shù)據(jù)緩沖管理

緩沖管理的主要任務是，當ARM接收到新的一幀時，為其分配相應的緩存，并將在物理地址重映射到進程虛擬地址。當應用程序處理該幀時，緩沖管理負責內存區(qū)域的回收。

當Linux內核啟動時，可以傳人參數(shù)mem=PHY_LEN，指定存儲空間的大小。在本例中，內核啟動時為HPI驅動預留8 MB的高端物理內存。在本例中，借助Linux中對普通外設I／O內存(PCI卡內存等)管理的思想，用高度為2的樹表示一塊連續(xù)的區(qū)域。該數(shù)據(jù)結構的優(yōu)點在于，資源分配簡單，把離散的小內存合并為一塊連續(xù)的大緩沖區(qū)的算法復雜度為O(1)。具體實現(xiàn)請參閱內核源碼中resource結構相關部分。

重映射新一幀視頻數(shù)據(jù)到進程虛擬地址是緩沖管理的另一任務。因為前一幀數(shù)據(jù)物理地址已經映射到進程虛擬地址，需要先將前幀物理地址與進程虛擬地址的映射關系去掉，然后重映射當前幀數(shù)據(jù)到進程虛擬地址。去掉物理地址與進程虛擬地址的映射關系由內核函數(shù)zap_page_range完成，調用該函數(shù)后，如果進程再訪問該虛擬地址，內核會產生缺頁中斷。這時再用remap_page_range建立當前幀數(shù)據(jù)物理地址與進程虛擬地址間的映射關系，進程就可以通過同一虛擬地址訪問當前幀的數(shù)據(jù)了。該方法的意義在于，進程不用頻繁調用mmap建立物理地址與虛擬地址的映射，只用調用一次，當有新數(shù)據(jù)到達時，驅動自動將新幀數(shù)據(jù)映射到先前的進程虛擬地址，提高了進程處理視頻數(shù)據(jù)的效率。實現(xiàn)代碼如下：

結語

在當前視頻處理平臺上，視頻處理、視頻傳輸、復雜任務管理等工作一般都是由一塊DSP處理器單獨完成，結合其他嵌入式微處理器協(xié)同工作的技術方案剛剛起步。經測試，在基于本文提出的高速通信方法設計的視頻處理平臺上，TMS320DM642與AT9lRM9200間的通信速率可以達到50 Mbps，帶寬足夠用來傳輸MPEG等壓縮視頻數(shù)據(jù)。如果用HPl32模式，速度還會大幅度提高。同時，因為Linux系統(tǒng)的實時性不是很強，如果采用其他實時性強的操作系統(tǒng)，如Vxworks等，系統(tǒng)性能還會有大的提高。