通用異步串行接口的VHDL實用化設(shè)計
摘 要:通用異步串行接口(Universal AsynchrONous Receiver TraNSmitter,UART)在通信、控制等領(lǐng)域得到了廣泛應(yīng)用。根據(jù)UART接口特點和應(yīng)用需求,以提高VHDL設(shè)計的穩(wěn)定性和降低功耗為目標(biāo),本文討論了UART接口中時鐘域劃分、時鐘分頻、亞穩(wěn)態(tài)、同步FIFO設(shè)計等問題和解決方案。
關(guān)鍵詞:通用異步串行接口 VHDL 亞穩(wěn)態(tài) 現(xiàn)場可編程邏輯陣列
1 引言
FPGA從實現(xiàn)粘合邏輯逐步發(fā)展成為設(shè)計平臺的核心,在電子、通信以及航空航天等領(lǐng)域得到了廣泛應(yīng)用。本人最近實現(xiàn)的中頻軟件無線電硬件平臺,就以FPGA為核心,實現(xiàn)上變頻、下變頻等中頻數(shù)字信號處理,并且構(gòu)成A/D/A、DSP和ARM模塊之間的通信中心。這種以FPGA為核心的架構(gòu)使得硬件平臺結(jié)構(gòu)靈活,具有可重構(gòu)性,為軟件無線電的各種算法分配方案提供了有力支撐。
除了和TMS320C6416之間的數(shù)據(jù)流采用EMIF接口外,F(xiàn)PGA的其它接口均采用UART。為了軟件開發(fā)和移植的便利,UART設(shè)計要做到兼容ST16C550的功能。穩(wěn)定可靠則是作為軟件無線電硬件平臺關(guān)鍵接口的基本要求??紤]到嵌入式系統(tǒng)的特點,在設(shè)計中應(yīng)盡量降低功耗。本文圍繞這些目標(biāo),介紹了在UART實用化設(shè)計中所遇到的一些重要問題、解決方案以及最終結(jié)果。
2 UART及ST16C550概述
UART是廣泛使用的串行數(shù)據(jù)傳輸協(xié)議,它在收發(fā)分離的串行鏈路上進(jìn)行全雙工異步通信。發(fā)送過程接收來自數(shù)據(jù)總線上的并行數(shù)據(jù),按照低位序方式并串轉(zhuǎn)換,然后根據(jù)控制寄存器的設(shè)置生成串行數(shù)據(jù)流;相應(yīng)的,接收過程把串行數(shù)據(jù)流轉(zhuǎn)換成并行數(shù)據(jù),產(chǎn)生中斷以及狀態(tài)信息,并對數(shù)據(jù)傳輸過程中的異常進(jìn)行處理。
ST16C550是廣泛使用的一款UART接口芯片,是NS16C550的改進(jìn)版本。它收發(fā)均帶有16字節(jié)的FIFO,可以通過設(shè)定波特率設(shè)置寄存器來進(jìn)行收發(fā)時鐘的分頻控制,傳輸速率從50bps到1.5Mbps。具體內(nèi)容可參見數(shù)據(jù)手冊[1]。
3 實用化設(shè)計的主要問題和解決方案
3.1 框架設(shè)計
根據(jù)UART的功能和數(shù)據(jù)流特點,系統(tǒng)劃分為5個模塊:時鐘生成模塊,完成時鐘分頻和時鐘分配;界面模塊,完成UART其它模塊和數(shù)據(jù)總線的交互;發(fā)送模塊,緩沖接收到的數(shù)據(jù)并按照設(shè)置生成串行信號;接收模塊,按照設(shè)置將接收信號串并變換并將數(shù)據(jù)送到FIFO中;Modem模塊完成與Modem信息交互和控制,功能相對簡單獨立。
3.2 時鐘域的劃分
在同步電路設(shè)計中,減小時鐘數(shù)量可簡化設(shè)計,提高系統(tǒng)的穩(wěn)定性。不相關(guān)的時鐘域之間的數(shù)據(jù)傳遞不可避免的存在亞穩(wěn)態(tài)問題,帶來穩(wěn)定性能的下降。時鐘速率與功耗呈線性關(guān)系,當(dāng)工藝一定時,低功耗設(shè)計要求我們降低時鐘頻率和信號翻轉(zhuǎn)次數(shù)。下面從這些設(shè)計策略和通信效率來分析不同時鐘域劃分方案。
方案一:低速時鐘方案。首先根據(jù)控制寄存器的設(shè)置對外部提供的時鐘進(jìn)行分頻,生成全局唯一的時鐘。這種方案的優(yōu)點是系統(tǒng)實現(xiàn)簡單、面積最小、功耗最低。缺點也很明顯,CPU時鐘遠(yuǎn)遠(yuǎn)高于芯片的工作時鐘,與UART傳遞數(shù)據(jù)時將占用CPU過多的時間。
方案二:高速時鐘方案。系統(tǒng)直接采用外部提供的時鐘為唯一時鐘,根據(jù)控制寄存器的設(shè)置生成收發(fā)模塊的同步時鐘使能信號,來達(dá)到分頻的目的。這種方案全局只有一個時鐘,設(shè)計簡單。唯一缺點是功耗較大。
在實際設(shè)計中,綜合考慮效率和功耗的要求,采用了兩個關(guān)聯(lián)時鐘的方案。與CPU的接口界面直接采用外部提供的最高時鐘信號,而其它模塊采用由波特率設(shè)置寄存器控制的分頻時鐘。這樣在系統(tǒng)中存在兩個關(guān)聯(lián)的時鐘域,設(shè)計時需要對兩個時鐘域邊界的邏輯進(jìn)行分析和處理。
3.3 時鐘分頻
同步數(shù)字電路設(shè)計中,時鐘是整個電路中最重要的信號。時鐘信號上的毛刺會引起系統(tǒng)的邏輯混亂,大規(guī)模的數(shù)字芯片還對時鐘歪斜(Clock skew)和負(fù)載提出了要求。為了適應(yīng)這些需求,F(xiàn)PGA內(nèi)部一般設(shè)有數(shù)量不等的全局時鐘網(wǎng)絡(luò)。
使用同步計數(shù)器或狀態(tài)機(jī)進(jìn)行時鐘分頻是一種較好的方案。在設(shè)計中計數(shù)器或狀態(tài)機(jī)應(yīng)直接產(chǎn)生分頻時鐘信號,而不應(yīng)該對計數(shù)器或狀態(tài)機(jī)進(jìn)行譯碼來產(chǎn)生時鐘信號,因為譯碼等組合邏輯可能給時鐘帶來毛刺,引起系統(tǒng)不穩(wěn)定。UART當(dāng)波特率設(shè)置寄存器為0或1時,時鐘信號不需要分頻,故分頻電路中使用了一個多路選擇器。
3.4 異步時鐘與亞穩(wěn)態(tài)
UART使用獨立的時鐘信號,使得CPU與UART以及UART之間的信號都處在不同的時鐘域。為了減少時序上的沖突,跨時鐘域的數(shù)據(jù)傳遞首先需要同步處理。但由于時鐘頻率和相位的差異,就不可避免存在亞穩(wěn)態(tài)問題[2]。所謂亞穩(wěn)態(tài),是指觸發(fā)器/鎖存器的輸入信號時序不能滿足設(shè)置時間和保持時間的要求,將有可能使得觸發(fā)器/鎖存器的輸出沒有正確的鎖定到邏輯0或邏輯1,處在一個未知的狀態(tài),如滯留在中間狀態(tài),或者震蕩。這里以SN74ABT7819的參數(shù)為例來分析亞穩(wěn)態(tài)、說明提高系統(tǒng)穩(wěn)定性的方法[3]。
亞穩(wěn)態(tài)滯留時間是隨機(jī)的,服從參量為的負(fù)指數(shù)分布。T0表示器件進(jìn)入亞穩(wěn)態(tài)可能性的孔徑時間。SN74ABT7819在室溫、5V電壓時,t=0.30ns,T0=7ps,輸入信號建立時間TSU1=5ns,傳播延時TPD1=9ns,芯片內(nèi)部觸發(fā)器建立時間以及傳播延時約TPD2+TSU2=1.3ns。設(shè)定觸發(fā)器異步輸入信號邊沿頻率FD=10MHz,芯片工作頻率即觸發(fā)器時鐘FC=50MHZ。則每個接收外界輸入信號的觸發(fā)器平均失效時間MTBF(the Mean Time Between Failures)為:
系統(tǒng)中有多路并行信號跨越不同的時鐘域,這樣系統(tǒng)總的MTBF會很小,將以小時或分鐘計??梢妴斡|發(fā)器同步電路不能滿足穩(wěn)定性的要求。為了減小亞穩(wěn)態(tài)的影響,將亞穩(wěn)態(tài)控制在時鐘域邊界,可以采用傳統(tǒng)的握手通訊方式[4]或者雙觸發(fā)器同步電路,前一方案在通信速率較低時有效,后者則在實踐中廣泛使用,這里僅對后者進(jìn)一步說明。三級觸發(fā)器同步電路一般是不必要的。
異步輸入經(jīng)過兩級觸發(fā)器同步生成同步輸出。即使第一個觸發(fā)器輸出存在亞穩(wěn)態(tài),經(jīng)過一個時鐘周期后,第二個觸發(fā)器輸出仍處于亞穩(wěn)態(tài)的概率非常小,此電路的平均失效時間MTBF已經(jīng)是一個無限長的時間:
Xilinx未給出Virtex II系列的亞穩(wěn)態(tài)描述參數(shù),它能工作在更高的時鐘頻率上,亞穩(wěn)態(tài)的參數(shù)會比SN74ABT7819優(yōu)秀。但以上分析和設(shè)計規(guī)則依然適用。
3.5 同步FIFO的設(shè)計
設(shè)計中根據(jù)收發(fā)模塊對狀態(tài)標(biāo)志要求的不同,分別進(jìn)行同步FIFO的設(shè)計以節(jié)約邏輯資源。其中,發(fā)送模塊的FIFO只需要全空/全滿標(biāo)志,采用地址相等不相等的比較邏輯和地址繞回指示位來產(chǎn)生。具體過程為:地址隨著相應(yīng)的操作遞增,寫指針由內(nèi)存的最后位置返回到初始位置時將地址繞回指示位置1,讀指針返回時則置0。因此,當(dāng)讀寫指針地址相同時,若地址繞回指示位為0,則讀寫指針經(jīng)歷了相同次數(shù)的循環(huán)移動, FIFO處于空狀態(tài)(圖4a);若地址繞回指示位為1,則寫指針比讀指針多循環(huán)一次,F(xiàn)IFO處于滿狀態(tài)。
接收模塊需要在FIFO中數(shù)據(jù)量達(dá)到一個設(shè)定的數(shù)值時產(chǎn)生一個中斷,由于設(shè)定的數(shù)值是任意的,這樣空/滿標(biāo)記的產(chǎn)生必須使用減法器,消耗的邏輯資源稍大。綜合后的邏輯資源使用情況也說明了這點。
3.6 鎖存器的使用
使電路復(fù)雜化的常見原因之一是設(shè)計中存在許多不必要的鎖存器,使得電路復(fù)雜,工作速度降低,系統(tǒng)可靠性變差。綜合時應(yīng)該仔細(xì)檢查是否合理使用了鎖存器。由于UART接口的功能特點,設(shè)計中共使用了4個鎖存器,用來鎖存A(2:0)和CSn信號。當(dāng)UART和CPU總線處在同一個芯片中時,這些鎖存器可以用寄存器取代。
4 綜合結(jié)果
整個設(shè)計以VHDL語言來實現(xiàn)。在SYNOPSYS Design Compiler中使用LSI_10K庫,設(shè)定系統(tǒng)工作頻率為25MHz,其他使用預(yù)定的選項,綜合后最大路徑延時為10.66ns,預(yù)期工作頻率大于90MHz。資源使用情況如表1所示。
在XC2V1000-6芯片中,以Synplify為綜合工具,則使用了188個寄存器,占用了1%的邏輯資源。最大路徑延遲預(yù)期9.043ns,預(yù)期工作頻率110MHz。
5 仿真與驗證
設(shè)計中對UART各模塊分別撰寫了相應(yīng)的測試程序,驗證了各模塊的正確性。然后把這些模塊裝配在一起,在系統(tǒng)級上再進(jìn)行了接收、發(fā)送和中斷功能的門級驗證。這種模塊化分層次的驗證過程在調(diào)試中有效地縮小了查找錯誤的范圍,提高了調(diào)試效率并保證了代碼的健壯性。
6 結(jié)束語
穩(wěn)定性和低功耗是嵌入式通信系統(tǒng)的重要設(shè)計目標(biāo)。實現(xiàn)需要的功能有時并不困難,難的是提高系統(tǒng)穩(wěn)定性和有效降低功耗。時鐘的規(guī)劃和亞穩(wěn)態(tài)的處理與這兩個目標(biāo)有著非常密切的關(guān)系,是實用化設(shè)計關(guān)注的重點之一。通過穩(wěn)定性、功耗與資源等方面的綜合考慮,該設(shè)計在所實現(xiàn)的軟件無線電硬件平臺上得到了成功應(yīng)用,達(dá)到了實用化設(shè)計的目標(biāo)。