1 LWIP設計思路
與許多其他的TCP/IP實現(xiàn)一樣,LWIP也是以分層的協(xié)議為參照來設計實現(xiàn)TCP/IP。大部分的TCP/IP實現(xiàn)在應用層和底層協(xié)議層之間進行了嚴格的劃分,底層協(xié)議之間可以進行或多或少的交叉存??;而LWIP在應用層與低層協(xié)議則使用了內(nèi)存共享這種比較松散的通信機制。每一個協(xié)議作為一個模塊被實現(xiàn)。LWIP采取將所有協(xié)議駐留在同一個進程的方式,以便獨立于操作系統(tǒng)內(nèi)核之外。應用程序既可以駐留在LWIP的進程中,也可以使用一個單獨的進程。應用程序與TCP/IP協(xié)議棧通信可以采用兩種方法:一種是函數(shù)調(diào)用,適用于應用程序與LWIP使用同一個進程的情況;另一種是使用更抽象的API。整個協(xié)議??驁D如圖1所示。
由于在傳輸層UDP比TCP協(xié)議要簡單得多,故僅以TCP為例。
在接收數(shù)據(jù)方面,鏈路層的ethernetifinpuIt()函數(shù)在收到數(shù)據(jù)包后,將IP包交付ip_input()函數(shù),ARP包交付etharp_arp_input()函數(shù)處理。ip_input()則負責拆解IP包,將ICMP包交付icmp_input()函數(shù)處理,將TCP包交付tcp_input處理。tcp_input()負責收到的TCP包,完成TCP頭部驗證,放入相應的狀態(tài)鏈,并交付tcp_process()處理。tcp_process完成TCP無限狀態(tài)機的處理。tcp_receive()將收到的包放在接收隊列中,這些接收隊列中的數(shù)據(jù)最終被應用程序使用。
在發(fā)送數(shù)據(jù)方面,tcp_write()檢查是否允許發(fā)送數(shù)據(jù),當允許發(fā)送時,就調(diào)用tcp_enqueue()進行發(fā)送。tcp_enqueue()將數(shù)據(jù)放入發(fā)送隊列。tcp_output()發(fā)送數(shù)據(jù)并在可能時捎帶確認。ip_output_if()在接到數(shù)據(jù)后,填充IP頭,交付netif一>output,即etharp_output()處理。etharp_output()判斷是單播地址后,交付etharp_query()。etharp_query()填入源、目標mac地址,并最終交付low_level_output()發(fā)送。
2 ICMP層的不足
LWIP在ICMP層的處理流程如圖2所示。
ICMP模塊僅實現(xiàn)了echo_reply包的回應處理,顯得過于簡單。對小型的協(xié)議棧而言,其所在的網(wǎng)絡環(huán)境相對簡單,因而在大多數(shù)情況下都是適用的。
LWIP一般使用在終端設備上。終端設備所在的情形可作如下的劃分:一是單網(wǎng)卡、單網(wǎng)關的情形;二是單網(wǎng)卡、多網(wǎng)關的情形;三是多網(wǎng)卡、多網(wǎng)關的情形。單網(wǎng)卡、單網(wǎng)關的情形是LWIP最適合的情形。因為LWIP本身沒有實現(xiàn)路由緩存,單網(wǎng)關的情形恰好不需要路由緩存,因為此情形下網(wǎng)關總是唯一的,下一跳總是不變的。多網(wǎng)卡、多網(wǎng)關的情形可以看成是單網(wǎng)卡、多網(wǎng)關的特殊情形。
在單網(wǎng)卡、多網(wǎng)關的情形下,如果默認網(wǎng)關的下一跳不是最優(yōu)下一跳,那么終端會收到一個路由重定向ICMP消息,告訴終端去往這個方向上,這個下一跳不是最優(yōu)的,并給出最優(yōu)下一跳。這就是所謂的路由重定向。如果終端一直不采用這個最優(yōu)下一跳,那么每一個發(fā)出的非最優(yōu)下一跳IP包都會收到路由器發(fā)來的一個重定向包。LWIP由于沒有實現(xiàn)路由緩存,不能記錄下網(wǎng)關發(fā)來的最優(yōu)下一跳,故對此消息的處理是忽略。忽略的結果是LWIP源源不斷地收到重定向包,這個包會經(jīng)過數(shù)據(jù)鏈路層、IP層,最終在ICMP層被丟棄,引起不必要的開銷。
3 改進思路
改進的思路是在多網(wǎng)關情況下,處理ICMP包;但LWIP并沒有路由緩存功能,所以需要引入路由緩存功能,將此重定向的路由記錄下來,以使得下次可使用。為降低內(nèi)存開銷,可以在收到ICMP重定向包的情況下(此時表明是多網(wǎng)關情形,下一跳非最優(yōu)),再開啟緩存,緩存這個下一跳地址。如果一段時間不用這個緩存,則清理出去。當最后一條緩存也被清理后,就關閉緩存功能。這相當于一個自適應功能的路由緩存。在沒有重定向消息時,使用原有的LWIP工作方式,不會引起額外的開銷;在收到重定向消息時,開啟這個緩存功能,以避免重定向消息引起的額外處理開銷。當IP包的流向在一定時間內(nèi)集中于少數(shù)幾個目的地時,這種方法會特別有效。
對路由緩存的更新,可采用一種類似于LFU(LeastFrequently Used)的算法。為此引入一個計數(shù)器,跟蹤當前條目被使用的情況,定義MAX_CA_COUNT表示已經(jīng)過期,O~MAX_CA_COUNT之間的數(shù)字表示當前計數(shù)值,同時每隔一段時間增加這個計數(shù)值。當這個計數(shù)值增至MAx_CA_COUNT時,認為這個條目已經(jīng)過時。同時在插入條目時,可利用這個計數(shù)器,總是選用這個數(shù)值最大的條目作為被替換對象(LFU算法)。
考慮到LWIP是個小型協(xié)議棧,不應設置過于復雜的數(shù)據(jù)結構及針對此種數(shù)據(jù)結構的操作,把路由緩存的數(shù)據(jù)結構定義為結構體數(shù)組。數(shù)組的條目也不宜過多,以免占用過多資源;另外作為終端設備,在一小段既定的時間內(nèi),與其通信的對端具有一定的確定性,一般來說比較少,重定向的條目也比較少,這也為使用較小的數(shù)組提供了一個理由。
4 實 現(xiàn)
對ICMP層改進的實現(xiàn)代碼主要集中于3處。
第一處位于ICMP模塊的icmp_input()函數(shù),針對ICMP的消息處理機制,增加了路由重定向的處理。整個函數(shù)的處理流程如圖3所示。其中虛線框起來的部分為我們增加的功能。首先檢查是不是重定向包,然后檢驗包的完整性和有效性。在這些檢查都通過以后,判斷緩存功能是否啟用。啟用與否由一個全局變量控制,默認是關閉的。如果沒有啟用緩存,則對重定向包進行計數(shù),當達到上限后,啟用緩存功能。重定向計數(shù)器應當定時歸零,這樣在一段時間內(nèi)沒有收到足夠的重定向包,緩存功能仍然不會開啟。這可以把這個重定向計數(shù)器加入其他需要定時執(zhí)行的函數(shù)中來實現(xiàn)(比如arp_timer()函數(shù))。開啟緩存后,初始化緩存表,將每個條目的老化計數(shù)器置為最大,表示已過期,即所有條目都是空閑可用狀態(tài)。然后啟用定時老化功能。LWIP提供sys_timeout(interval,func_handler,arg)函數(shù),用于每隔interval時間后,執(zhí)行函數(shù)func_handler(arg)。定向老化功能可以將函數(shù)實現(xiàn)后,向這個sys_timeout()注冊來實現(xiàn)。如果緩存已經(jīng)開啟,那么緩存這個收到的重定向包,總是把它插入老化計數(shù)器最大的條目,以實現(xiàn)LFU算法。
第二處改進仍然位于ICMP模塊,但添加了一個函數(shù)rou_cache_timer()。它是一個定時老化路由緩存的函數(shù),用于老化、清理緩存條目,并再次向sys_timeout()注冊自己。其函數(shù)流程如圖4所示。
在所有緩存條目都已過圖4定時老化、清理路由緩存期后,應當關閉緩存功能,同時注銷定時老化函數(shù)。這些功能由rou_cache_timer()來完成。
第三處改進位于數(shù)據(jù)鏈路層的etharp_output()函數(shù)內(nèi)。這個函數(shù)負責將下一跳的IP地址對應的MAC地址填入。
顯然,路由緩存的使用正在于此。在它使用默認網(wǎng)關地址前,應當查詢一下緩存中是否已將此路由重定向了。如果確實重定向了,那么在此下一跳IP被使用前,應該替換已重定向的IP。整個函數(shù)的流程如圖5所示。虛線框起來的部分是加入的功能。
結 語
本設計針對LWIP在多網(wǎng)關情況下不處理重定向IC—MP消息而作出了改進。這種改進包括接收這個ICMP消息并緩存路由信息,為此加入了自適應路由緩存的功能,即只在有重定向消息的時候自動開啟緩存,在緩存全部老化后又自動關閉緩存。路由緩存在比較完整的TCP/IP協(xié)議棧上都得到實現(xiàn),但復雜度較高。這里使用一種較簡單的路由緩存結構以降低代碼量及資源使用開銷。本文提出的思路不僅適用于LWIP,在其他的小型協(xié)議棧上也適用。