傳統的嵌入式產品只能實現某種特定的功能,不能滿足用戶可變的豐富多彩的應用需求。為解決這個問題,本文設計并實現了一種使用Java作為軟件平臺的基于FPGA的可編程嵌入式系統,以實現系統對多種本地應用和網絡的支持。
1. 概述
傳統的嵌入式系統設計的主要目標是找到一種優(yōu)化的體系結構來完成單一的,特定的功能。對這樣的系統來說,ASIC和核心處理器是作為特別的構件模塊加以考慮的:設計者根據應用的要求選擇適當的ASIC,根據給定的性能要求比如處理器主頻,系統穩(wěn)定性,以及對功耗的要求等選用適當的處理器內核。
然而,在當今移動通信已經進入每個人的生活的今天,現在的嵌入式系統比如PDA等已經不同于傳統意義上的嵌入式系統了,它們有自己的獨特特點??陀^需要要求它們能夠支持多種應用功能如網頁瀏覽,播放音頻/視頻文件,以及進行無線網絡通信等。
這樣看來,傳統的設計思路因為只面向單一的應用,無法滿足多應用嵌入式系統的需求。而解決這一問題的良好途徑便是向嵌入式系統引入可編程能力,以使得系統能夠根據用戶的不同要求實現對不同應用的支持。
為了向系統中引入可編程能力,我們考慮在系統中嵌入FPGA,因為FPGA具有下列特點,使得它成為我們的首選:
1.現在的FPGA的處理能力和邏輯容量已經接近于專用ASIC,功耗也比較低,能夠滿足我們系統設計的要求;
2.由于FPGA具有的可重編程能力,使用了FPGA的嵌入式系統能夠滿足各種不同的應用要求;
從嵌入式系統管理的角度來說,對網絡通信的支持也是很有必要的,也是很有特色的一個應用,因為它使得從遠端服務器下載新的應用程序并在本地運行成為可能。為實現對這個功能的支持,我們采用Java作為軟件平臺。因為Java運行在Java虛擬機之上,它能夠下載并執(zhí)行新的應用程序代碼,并且無需在下載后重新啟動系統。
綜上所述,這個新的嵌入式系統是基于Java的,有一個FPGA和標準處理器相連。我們通過網絡下載Java代碼和可以對FPGA進行編程的比特流。該系統也支持對FPGA的動態(tài)重新配置。為了實現硬件(FPGA)和軟件(Java應用程序代碼)之間的通信,又定義了一組本地API,以使得從Java應用層能夠訪問到底層的硬件。為了調用這些本地API,采用了Java本地接口(JNI)。在本文中,將一些Java函數(Java method)用FPGA可編程硬件來實現,稱之為硬件方法(HW method)。
2. 系統設計
實現一個Java函數功能的對應的硬件方法實現的邏輯結構圖如圖1所示。
輸入緩存和輸出緩存分別用來接收輸入參數和存儲輸出結果??刂凭彺嬗糜趯τ布椒ǖ目刂坪蜋z測,比如向硬件方法發(fā)出啟動指令,檢查其所處的狀態(tài)并判斷操作是否完成等。該模塊中的所有緩存都映射到處理器物理地址空間中,處理器可以使用正常的讀寫指令完成對這些緩存的訪問。
圖2是該嵌入式系統的硬件平臺,由一個標準處理器,一個FPGA和一個系統存儲單元構成。它們之間通過共享的系統總線連接在一起。
當處理器向一個硬件方法發(fā)出讀寫操作指令時,該硬件方法在其自己的地址解碼器的幫助下向數據總線上發(fā)送對應的響應信號。在這里,我們可以認為是處理器發(fā)起的硬件/軟件通信指令,而FPGA則是作為一個從屬單元做出回應。因為在處理器發(fā)起初始指令后,就由可配置管理器來負責管理FPGA編程。這樣一來,就實現了處理器和FPGA的并行運行。
如圖3所示,我們選擇Java作為軟件平臺,并且裝載了一個嵌入式操作系統為Java實時應用程序提供基本的服務,比如線程和其它硬件管理等。
通過系統管理器,可以從遠程服務器下載Java應用程序。系統管理器主要實現了下面3種協議:
1. 應用程序代碼(包括可對FPGA進行編程的比特流)下載協議;
2. 用于遠程管理的系統維護相關的協議;
3. 控制對嵌入式系統訪問權限的認證協議。
系統管理器包括基于socket連接的客戶端類加載器。遠端應用程序可以下載到本地并按照下面的過程執(zhí)行:
1. 完成認證過程,系統進入管理模式;
2. 下載應用程序代碼,完成系統初始化,比如加載FPGA可編程比特流到相應的存儲單元;
3. 執(zhí)行新的應用程序。
在該系統中,為了簡化起見,預先映射硬件方法地址到確定的系統物理存儲區(qū),目的是為了尋址操作的方便快捷。
由于我們使用了Java軟件平臺,應用程序就無法直接訪問底層的硬件。這就是說,運行在處理器Java虛擬機上的應用程序不能直接訪問映射到FPGA中硬件方法的緩存區(qū)域。為解決這個問題,理論上可以采用下面兩種方法:
1. 修改Java虛擬機,使其具有對處理器物理地址的直接訪問能力;
2. 單獨設計一種Java本地接口(JNI),使得應用程序通過該接口提供的功能實現對硬件方法映射到的物理地址的訪問。
盡管第一種方案的效率較高,并且沒有引入額外開銷,但是修改Java虛擬機內核是相當繁雜的工作,同時也可能會引起潛在的系統不穩(wěn)定。第二種方案雖然引入了一定的額外開銷,但便于移植和實現。因此,我們采用方案二,在Java虛擬機和Java本地接口之外又設計了一個本地通信庫。
本地通信庫API形式如下:
int hwWriteXXX(int addr, XXX p);
int hwWriteArrayXXX(int addr, XXX[] p);
XXX hwReadXXX(int addr);
XXX[] hwReadArrayXXX(int addr);
int hwConfig(int cf_mem_addr, int bitstr_size);
Java本地接口層接口的形式如下:
class HWInterface{
static int ConfigStatus;
public static native int setParam(CID hw_cid, object P)
{
if(type_of_P == XXX)
err = hwWriteXXX(hw_cid.addr, (XXX)P);
return err;
}
public static native int getResult(CID hw_cid, object R);
public static native int setCMD(CID hw_cid, int cmd);
public static native int getStatus(CID hw_cid);
public synchronized static native int configHW( CID hw_cid);
}
在上面代碼中,XXX表示基本的Java數據類型如整型(integer)、浮點型(float)、雙精度型(double)等。
Java應用程序通過類HWInterface提供的方法訪問本地庫。上面的代碼中給出了setParam的具體實現。其中,CID是包括硬件方法映射到的緩存地址的一個對象,對應于每個硬件方法的CID都是唯一的,因此,該地址和緩存區(qū)大小都是事先已經確定了的。但是,由于系統中只有一個配置控制器,我們無法同時就兩個或多個硬件方法向FPGA進行編程,也可以說同一時刻只能有一個硬件方法在使用配置控制器。為此,引入了一個靜態(tài)變量ConfigStatus來反映配置控制器的當前狀態(tài)。所以,訪問配置控制器的函數configHW()是靜態(tài)的同步的。
使用上面給出的接口,則下面這段代碼
methodA()
{
…;
int a = objA.m1(2); //SW method
int b = objB.m2(3); //HW method
int c = a + b;
…;
}
就應該寫成下面的形式:
methodA()
{
…;
1 HWInterface.configHW(cid2); // cid2 is the ID of HW method m2
2 Object P = new Integer(3);
3 HWInterface.SetParam(cid2,P);
4 HWInterface.startHW(cid2);
5 int a = objA.m1(2);
6 Object R = new Integer();
7 While(HWInterface.getResult(cid2, R) == 0)
; //wait until HW method finished
8 HWInterface.getResult(cid2, R);
9 int b = ((Integer)R.getValue());
10 int c = a + b;
…;
}
在上例中,為了執(zhí)行FPGA中的函數objB.m2(),首先對FPGA進行編程(Line1)。然后,將參數拷貝到硬件方法的輸 入緩存中(Line3),并對硬件方法進行初始化(Line4)。最后,采用了一個循環(huán)函數持續(xù)檢查硬件方法緩存的狀態(tài)(Line7,8),直至計算完成,然后拷貝得到結果(Line9)。
3. 系統實現
使用ARM710T處理器和Virtex的FPGA,根據上文給出的設計方案,我們實現了一個嵌入式系統開發(fā)平臺。該平臺包括一個網絡接口,兩個調試接口,一個PCI主機接口和一個串行口。并移植了一個嵌入式操作系統和一個小巧的Java實時運行環(huán)境。如圖4:
4. 總結
本文用一種全新的思路,對傳統的嵌入式系統進行了改進,實現了一種能夠支持多種應用的嵌入式系統平臺。利用FPGA的可編程性和Java平臺良好的移植性能,該平臺完全能夠滿足我們的設計要求。當然,也有不足之處,比如對配置控制器的狀態(tài)的獲取,可以考慮使用中斷的方式來實現,而不是采用本文中的循環(huán)查詢機制。這將在以后的工作中加以改進。