在FPGA設(shè)計(jì)環(huán)境中加時(shí)序約束的技巧

時(shí)間：2018-08-15 08:40:03

關(guān)鍵字：技巧時(shí)序環(huán)境中加

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

在給FPGA做邏輯綜合和布局布線時(shí)，需要在工具中設(shè)定時(shí)序的約束。通常，在FPGA設(shè)計(jì)工具中都FPGA中包含有4種路徑：從輸入端口到寄存器，從寄存器到寄存器，從寄存器到輸出，從輸入到輸出的純組合邏輯。通常，需要對(duì)這幾種路徑分別進(jìn)行約束，以便使設(shè)計(jì)工具能夠得到最優(yōu)化的結(jié)果。下面對(duì)這幾種路徑分別進(jìn)行討論。

(1)從輸入端口到寄存器：

這種路徑的約束是為了讓FPGA設(shè)計(jì)工具能夠盡可能的優(yōu)化從輸入端口到第一級(jí)寄存器之間的路徑延遲，使其能夠保證系統(tǒng)時(shí)鐘可靠的采到從外部芯片到FPGA的信號(hào)。約束名稱(chēng)：input delay. 約束條件的影響主要有4個(gè)因素：外部芯片的Tco，電路板上信號(hào)延遲Tpd，F(xiàn)PGA的Tsu, 時(shí)鐘延遲Tclk. Tco的參數(shù)通常需要查外部芯片的數(shù)據(jù)手冊(cè)。計(jì)算公式：input delay = Tco+Tpd+Tsu-Tclk. FPGA的Tsu也需要查FPGA芯片的手冊(cè)。FPGA速度等級(jí)不同，這個(gè)參數(shù)也不同。Tpd和Tclk需要根據(jù)電路板實(shí)際的參數(shù)來(lái)計(jì)算。通常，每10cm的線長(zhǎng)可以按照1ns來(lái)計(jì)算. 例如：系統(tǒng)時(shí)鐘100MHz,電路板上最大延遲2ns, 時(shí)鐘最大延遲 1.7ns, Tco 3ns, FPGA的Tsu為0.2ns. 那么輸入延遲的值：max Input delay = 2+3+0.2-1.7=3.5ns. 這個(gè)參數(shù)的含義是指讓FPGA的設(shè)計(jì)工具把FPGA的輸入端口到第一級(jí)寄存器之間的路徑延遲（包括門(mén)延遲和線延遲）控制在 10ns-3.5ns=6.5ns 以?xún)?nèi)。

(2)寄存器到寄存器：

這種路徑的約束是為了讓FPGA設(shè)計(jì)工具能夠優(yōu)化FPGA內(nèi)寄存器到寄存器之間的路徑，使其延遲時(shí)間必須小于時(shí)鐘周期，這樣才能確保信號(hào)被可靠的傳遞。由于這種路徑只存在于FPGA內(nèi)部，通常通過(guò)設(shè)定時(shí)鐘頻率的方式就可以對(duì)其進(jìn)行約束。對(duì)于更深入的優(yōu)化方法，還可以采用對(duì)寄存器的輸入和寄存器的輸出加入適當(dāng)?shù)募s束，來(lái)使邏輯綜合器和布線器能夠?qū)δ硹l路徑進(jìn)行特別的優(yōu)化。還可以通過(guò)設(shè)定最大扇出數(shù)來(lái)迫使工具對(duì)其進(jìn)行邏輯復(fù)制，減少扇出數(shù)量，提高性能。

(3)寄存器到輸出：

這種路徑的約束是為了讓FPGA設(shè)計(jì)工具能夠優(yōu)化FPGA內(nèi)部從最后一級(jí)寄存器到輸出端口的路徑，確保其輸出的信號(hào)能夠被下一級(jí)芯片正確的采到。約束的名稱(chēng):output delay,約束條件的影響主要有3個(gè)因素：外部芯片的Tsu，電路板上信號(hào)延遲Tpd，時(shí)鐘延遲Tclk.Tsu的參數(shù)通常需要查外部芯片的數(shù)據(jù)手冊(cè)。計(jì)算公式：output delay = Tsu+Tpd-Tclk.例如：系統(tǒng)時(shí)鐘100MHz,電路板上最大延遲2ns, 時(shí)鐘最大延遲 1.7ns, Tsu 1ns, 輸出延遲的值：max output delay = 1+2-1.7=1.3ns . 這個(gè)參數(shù)的含義是指讓FPGA的設(shè)計(jì)工具把最后一級(jí)寄存器到輸出端口之間的路徑延遲（包括門(mén)延遲和線延遲）控制在 10ns-1.3ns=8.7ns 以?xún)?nèi)。

(4)從輸入端口到輸出端口：

這種路徑是指組合邏輯的延遲，指信號(hào)從輸入到輸出沒(méi)有經(jīng)過(guò)任何寄存器。給這種路徑加約束條件，需要虛擬一個(gè)時(shí)鐘，然后通過(guò)約束來(lái)指定哪些路徑是要受該虛擬時(shí)鐘的約束。在Synplifypro和Precision中都有相應(yīng)的約束來(lái)處理這種路徑。

關(guān)于輸入輸出延遲的一些參數(shù)，如果要把這些參數(shù)和xilinx的軟件結(jié)合起來(lái)，也不是一件容易的事情。以前似乎大家也不太看重約束條件的設(shè)定，大多時(shí)候都是無(wú)論如何先上板，然后通過(guò)signaltap和Chipscope來(lái)調(diào)。當(dāng)FPGA規(guī)模大了之后，布線一次都需要很長(zhǎng)時(shí)間，這種方法的弊端就越來(lái)越嚴(yán)重。實(shí)際上可以借鑒ASIC的設(shè)計(jì)方法：加比較完善的約束條件，然后通過(guò)RTL仿真，時(shí)序分析，后仿真來(lái)解決問(wèn)題，盡量避免在FPGA電路板上來(lái)調(diào)試。altera最先意識(shí)到這一點(diǎn)，它采用了Synopsys的SDC格式。SDC的格式也得到了邏輯綜合器的支持。而且設(shè)定方法比較容易掌握。這個(gè)帖子會(huì)詳細(xì)討論一下這種格式的約束設(shè)定方法。

時(shí)鐘的設(shè)定方法：時(shí)鐘要分成兩種，一種是從端口上直接輸入的時(shí)鐘，另一種是在FPGA內(nèi)部產(chǎn)生的時(shí)鐘。內(nèi)部產(chǎn)生的時(shí)鐘又要分成兩種，從鎖相環(huán)出來(lái)的（包括altera的PLL和Xilinx的DLL)和從邏輯單元出來(lái)的，例如一般的計(jì)數(shù)器分頻就是這種情況。從鎖相環(huán)出來(lái)的時(shí)鐘可以通過(guò)端口直接加，因?yàn)橐话愕木C合工具和布線工具都能夠自動(dòng)的把端口的時(shí)鐘約束傳遞到鎖相環(huán)，并且根據(jù)鎖相環(huán)的倍頻關(guān)系自動(dòng)施加到下一級(jí)。而從邏輯單元出來(lái)的就需要單獨(dú)對(duì)其進(jìn)行約束。

在SDC格式中，創(chuàng)建時(shí)鐘的命令 create_clock, 后面要帶3個(gè)參數(shù)：name ,period, waveform. name的含義是指創(chuàng)建這個(gè)時(shí)鐘約束的名字，而不是時(shí)鐘本身的名字。要把這個(gè)約束和時(shí)鐘信號(hào)關(guān)聯(lián)起來(lái)，還需要在后面加些東西。period的單位缺省是ns. waveform是用來(lái)指定占空比。除了這三個(gè)參數(shù)以外，常常還要加 get_ports的命令，來(lái)指定時(shí)鐘的輸入端口。下面的例子是一個(gè)較為完整的設(shè)定時(shí)鐘的例子：
create_clock -name clk1 -period 10.000 –waveform { 2.000 8.000 } [get_ports sysclk]
這個(gè)例子表示，有一個(gè)clk1的約束，在這個(gè)約束中設(shè)定了時(shí)鐘的周期為10ns, 占空比為2ns低電平，8ns高電平。這個(gè)叫做clk1的約束是針對(duì)sysclk這個(gè)端口的。

如果是利用內(nèi)部鎖相環(huán)分頻出來(lái)很多其他時(shí)鐘的約束,可以不再另外施加其他約束，邏輯綜合器和布線器都能根據(jù)鎖相環(huán)的參數(shù)自動(dòng)計(jì)算。如果是利用內(nèi)部的邏輯單元分頻出來(lái)的信號(hào)，則必須利用get_registers指定分頻的寄存器名。例如上例：

create_clock -name clk1 -period 10.000 –waveform { 2.000 8.000 } [get_registers cnt_clk].
對(duì)于邏輯單元分頻的時(shí)鐘信號(hào)，也可以采用命令create_generated_clock會(huì)更加精確。舉例如下：
create_generated_clk -name clk2 -source [getports sysclk] -div 4 [get_registers cnt_clk]
這個(gè)約束命令描述了一個(gè)clk2的約束，約束的對(duì)象是由sysclk分頻4次得到的時(shí)鐘，這個(gè)時(shí)鐘是由cnt_clk這個(gè)寄存器產(chǎn)生的。

在高速的系統(tǒng)中，對(duì)時(shí)鐘的描述可能會(huì)要求的更多，更加細(xì)致。例如，會(huì)要求對(duì)時(shí)鐘的抖動(dòng)和時(shí)鐘的延遲進(jìn)行描述。在SDC的文件格式中，可以通過(guò)兩個(gè)命令來(lái)描述：set_clock_uncertainty 和 set_clock_latency 來(lái)設(shè)定。

時(shí)鐘的延遲相對(duì)來(lái)講比較簡(jiǎn)單。延遲一般分為外部延遲和內(nèi)部時(shí)鐘線網(wǎng)的延遲。通常在約束時(shí)只對(duì)外部延遲做約束，在set_clock_latency的命令后帶 -source的參數(shù)就可以了。例如：

set_clock_latency -source 2 [get_clocks {clk_in}]
時(shí)鐘的抖動(dòng)要稍微復(fù)雜一些。因?yàn)檫@個(gè)值不但會(huì)影響到對(duì)Tsu的分析，也會(huì)影響到對(duì)Thold的分析。因此，采用set_clock_uncertainty的參數(shù)要多一些。如果要理解這個(gè)命令對(duì)系統(tǒng)時(shí)序分析的影響，就需要對(duì)altera的延時(shí)計(jì)算的概念需要做更多的說(shuō)明。

對(duì)于set_clock_uncertainty的情況，就稍微復(fù)雜一些。因?yàn)閟et_clock_uncertainty的值既影響建立時(shí)間的計(jì)算，也影響保持時(shí)間的計(jì)算，因此，需要在設(shè)定時(shí)分別指明：
set_clock_undertainty –setup 0.500 –from clkA –to clkA
set_clock_uncertainty –hold 0.300 –from clkA –to clkA

前面的內(nèi)容里面提供了計(jì)算輸入輸出延遲的計(jì)算方法。輸出延遲的命令是set_output_delay. 有幾個(gè)參數(shù)要加：參考時(shí)鐘，最大最小值，和端口的名稱(chēng)。如下面的例子中描述。
set_output_delay -clock CLK -max 1.200 [get_ports OUT]
set_output_delay -clock CLK -min 0.800 [get_ports OUT]
輸入延遲的命令很類(lèi)似：
set_input_delay -clock CLK -max 2.000 [get_ports IN]
set_input_delay -clock CLK -min 1.600 [get_ports IN]

對(duì)一些特殊的設(shè)計(jì)要求，例如不關(guān)心的數(shù)據(jù)傳遞路徑和多拍的路徑，還需要增加false path 和 Multicycle的設(shè)定。這兩個(gè)約束比較簡(jiǎn)單，容易設(shè)定，但是非常關(guān)鍵。如果設(shè)定的不好，系統(tǒng)性能會(huì)大打折扣。false path是指在時(shí)序分析中不考慮其延遲計(jì)算的路徑。例如有些跨越時(shí)鐘域的電路等。設(shè)定的方法：
set_false_path -from [get_clocks clkA] -to [get_clocks clkB]
set_false_path -from regA -to regB

第一條命令是設(shè)定了從時(shí)鐘域clkA到時(shí)鐘域clkB的所有路徑都為false path。第二條命令設(shè)定了從 regA到regB的路徑為false path。這兩種路徑在做時(shí)序分析時(shí)都會(huì)被忽略。multicycle的設(shè)定和false path的設(shè)定方法差不多。

為了讓邏輯綜合器和布局布線器能夠根據(jù)時(shí)序的約束條件找到真正需要優(yōu)化的路徑，我們還需要對(duì)時(shí)序報(bào)告進(jìn)行分析，結(jié)合邏輯綜合器的時(shí)序報(bào)告，布線器的時(shí)序報(bào)告，通過(guò)分析，可以看出是否芯片的潛能已經(jīng)被完全挖掘出來(lái)