多Agent在城市交通系統(tǒng)中的應(yīng)用
1 引言
Agent 是運行于動態(tài)環(huán)境中的具有較高自制能力的實體,具有自主性、分布性、協(xié)調(diào)性和一定學(xué)習(xí)、推理能力。多智能體系統(tǒng)通過Agent 間的通訊、合作、協(xié)調(diào)和控制表達(dá)系統(tǒng)功能及行為特性。城市交通系統(tǒng)是自然的、分布的、復(fù)雜的、動態(tài)的、規(guī)模龐大的系統(tǒng),采用多Agent 技術(shù)建模城市交通系統(tǒng)可為交通決策者和使用者提供良好的解決方案。從二十世紀(jì)80 年代末,就有學(xué)者將多Agent 技術(shù)引入到城市交通系統(tǒng)的建模中,利用其協(xié)作、存儲、智能性和自治性為使用者提供在線決策支持、實時交通控制,或利用其對客觀世界的準(zhǔn)確描述進(jìn)行交通系統(tǒng)運行仿真,發(fā)現(xiàn)交通系統(tǒng)中的問題、規(guī)律或驗證新的理論和算法。本文從ITS 框架中的先進(jìn)的交通管理系統(tǒng)(ATMS)、先進(jìn)的出行者信息系統(tǒng)(ATIS)、先進(jìn)的公交系統(tǒng)(APTS)三個方面對Agent 技術(shù)在城市交通系統(tǒng)中的應(yīng)用現(xiàn)狀展開論述,最后指出多Agent 技術(shù)在城市交通系統(tǒng)的應(yīng)用中需解決的問題以及發(fā)展趨勢。
2 多Agent在ATMS中的應(yīng)用
在ATMS 中,多Agent 技術(shù)主要用于提供實時的決策支持并進(jìn)行適當(dāng)?shù)墓芾砜刂?。根?jù)Agent 慎思型和反應(yīng)型兩種模型結(jié)構(gòu),建構(gòu)基于Agent 的城市交通管理系統(tǒng)也有兩種思路:分層遞階式和完全分布式。
2.1 分層遞階式結(jié)構(gòu)
分層遞階式結(jié)構(gòu)的每一級都由功能、結(jié)構(gòu)類似的Agent 組成,同級Agent 間可相互協(xié)調(diào),上級Agent可作為對應(yīng)下級Agent 的協(xié)調(diào)單元,下級Agent 向所屬上級Agent 傳輸局部系統(tǒng)環(huán)境和系統(tǒng)控制的反饋信息,為上級Agent 提供決策依據(jù)。最早的分層遞階式系統(tǒng)就是KITS 和TRYS.
KITS 產(chǎn)生于在1992-1994 年間,將交通領(lǐng)域知識分解成與路網(wǎng)拓?fù)浣Y(jié)構(gòu)相匹配的單元集合,提供專門的推理機(jī)制進(jìn)行交通決策和管理。如圖1 所示,底層的Agent 通過協(xié)作完成交通監(jiān)控和管理任務(wù),Actor 是直接和問題區(qū)域?qū)?yīng)的交通評價和管理單元,Supervisor 負(fù)責(zé)全局路況分析、解釋以及合成全局行動方案。KITS 的成功表明:基于知識的模型可以和多Agent 技術(shù)相集合來提高城市交通系統(tǒng)的監(jiān)控和管理能力。
圖 1 KITS 架構(gòu)圖
TRYS 是在1991-1994 年間建立的實時自適應(yīng)的交通管理決策系統(tǒng)。如圖2 所示,TRYS 的結(jié)構(gòu)與KITS 相似,通過Agent 訪問實時采集的路況數(shù)據(jù),并由Agent 內(nèi)部的知識庫和推理引擎對數(shù)據(jù)進(jìn)行分析處理,coordinator 負(fù)責(zé)協(xié)調(diào)各Agent的工作以形成全局解決方案。與KITS 不同的是,TRYS 中的問題區(qū)域由獨立的、功能強(qiáng)大的Agent負(fù)責(zé)監(jiān)督。
圖 2 TRYS 架構(gòu)圖。
翟高壽和Choy根據(jù)遞階控制結(jié)構(gòu)理論及城市交通系統(tǒng)的結(jié)構(gòu)特征,提出了四層的分層遞階式結(jié)構(gòu),分別是:決策層(城市交通控制決策系統(tǒng))、戰(zhàn)略控制層(若干區(qū)域協(xié)調(diào)控制系統(tǒng))、戰(zhàn)術(shù)控制層(若干路口控制系統(tǒng))、執(zhí)行層(檢測器、信號控制器和信號燈等)。
該結(jié)構(gòu)的協(xié)調(diào)控制策略在TRYS 基礎(chǔ)上進(jìn)一步下放到了路口級,建立了路口Agent,每個路口成了一個智能的知識系統(tǒng),可及時根據(jù)路口交通狀況進(jìn)行控制策略的實時部署與調(diào)整,更好地適應(yīng)了交通系統(tǒng)動態(tài)性、實時性強(qiáng)的特點,對突發(fā)性交通流的變化有很好的適應(yīng)和調(diào)節(jié)能力。
2.2 完全分布式結(jié)構(gòu)
在完全分布式結(jié)構(gòu)的系統(tǒng)中,Agent 憑借自身的知識和智能與相鄰區(qū)域Agent 協(xié)調(diào)共同完成路口的管制。最初的應(yīng)用就是西班牙的TRYSA2 系統(tǒng),如圖3 所示。TRYSA2 Agent 有一個控制計劃集,每個計劃都被賦予了能夠減輕交通壓力的效用值。系統(tǒng)可通過評估相關(guān)Agent 的計劃效用值合成系統(tǒng)最優(yōu)的解決方案。Oliveira 、承向軍、楊兆升等學(xué)者也先后提出了以路口Agent 為基本控制單元的完全分布式控制結(jié)構(gòu),系統(tǒng)中的Agent 都具備了一定的存儲、匹配和智能計算功能,可依靠良好的協(xié)調(diào)算法實現(xiàn)多Agent 之間的協(xié)調(diào)與合作以達(dá)到整體優(yōu)化和控制的目的。
圖 3 TRYSA2 架構(gòu)圖。
2.3 兩種架構(gòu)的性能比較
分層遞階式充分體現(xiàn)了集中和分散控制的有機(jī)結(jié)合,考慮到了全局利益,可使協(xié)調(diào)有目的地進(jìn)行,但是區(qū)域Agent 和主控Agent 的實現(xiàn)稍顯復(fù)雜。完全分布式具有反應(yīng)快速、靈活性強(qiáng)等特點,可充分發(fā)揮Agent 的自治性、協(xié)調(diào)性,但由于Agent 自身能力有限、系統(tǒng)的知識又過于分散,解決全局問題的能力略顯不足,Agent 間的協(xié)調(diào)機(jī)制會對系統(tǒng)性能產(chǎn)生較大影響。在擴(kuò)展性上,完全分布式只需把新Agent 注冊到其他Agent 中并修改相應(yīng)的方案和知識庫即可將新Agent 擴(kuò)充到當(dāng)前的Agent 群體中,而分層遞階式需要整合區(qū)域控制中心和主控中心,重新賦予各Agent優(yōu)先權(quán)關(guān)系。在協(xié)作復(fù)雜度上,分層遞階式從每一個Agent 控制方案中選擇一個本地最優(yōu)的方案,完全分布式在所有的Agent 中通過搜索策略來查找最佳方案,因此后者工作量較大。
2.4 多Agent 的協(xié)調(diào)控制與優(yōu)化
多Agent 通過協(xié)調(diào)實現(xiàn)系統(tǒng)的分布式并行運行,提高任務(wù)的執(zhí)行效率。在基于多Agent 的ATMS 中,有三種協(xié)調(diào)方式:①建立專門的協(xié)調(diào)Agent;②將協(xié)調(diào)行為分散至各Agent 中,由Agent 自主地完成;③集中與分布相結(jié)合的方法,Agent 自身即可以完成某些協(xié)調(diào)行為,又可以接受高層Agent 制定的規(guī)劃。當(dāng)前常用的協(xié)調(diào)方法有黑板模型、博弈模型、協(xié)調(diào)器、交換意見等。
黑板模型信息傳輸量大,對信息傳輸?shù)姆€(wěn)定性也有一定的要求,適用于簡單的分布式多路口控制。博弈論模型適用于分層遞階結(jié)構(gòu)的上下級Agent 間和完全分布結(jié)構(gòu)的同級Agent 間的協(xié)調(diào),但由于重復(fù)博弈過程中需要進(jìn)行復(fù)雜的均衡點收斂控制,所以基于交通信息博弈的計算量較大。協(xié)調(diào)器可基于一定的目標(biāo)將同級和下級Agent 產(chǎn)生的提案合成全局的提案。協(xié)調(diào)器降低了系統(tǒng)的通信量和其他Agent 的實現(xiàn)復(fù)雜度,但卻增加了協(xié)調(diào)器Agent 自身的設(shè)計復(fù)雜度和計算量。交換意見法對系統(tǒng)通信的穩(wěn)定性有很大的要求,當(dāng)單個Agent 節(jié)點出現(xiàn)通信故障時,系統(tǒng)將無法正常工作。
從上述幾種方法的分析中可以看到,協(xié)調(diào)過程需要傳輸大量數(shù)據(jù),因此容易造成傳輸網(wǎng)絡(luò)的擁塞。目前,很多學(xué)者都采用強(qiáng)化學(xué)習(xí)的方法來優(yōu)化本地的交通信息。強(qiáng)化學(xué)習(xí)方法是以環(huán)境提供的加強(qiáng)信號作為性能評價的反饋,完成從狀態(tài)到行為的映射的學(xué)習(xí),特別適合處理不斷變化的路網(wǎng)環(huán)境。Baher、歐海濤等都基于強(qiáng)化學(xué)習(xí)研究了實時自適應(yīng)的交通信號控制,減少路口節(jié)點間的大量通訊需求,增強(qiáng)了決策的可靠性。
2.5 相關(guān)應(yīng)用研究
Ronald通過將分離獨立的交通設(shè)施建模成能互相協(xié)作的Agent,研究了動態(tài)交通管理設(shè)備互相協(xié)作的可能性。Filippo實現(xiàn)了一種基于多Agent 架構(gòu)的交通管理系統(tǒng)CARTESIUS,在分析偶發(fā)性阻塞和在線制定集成控制方案過程中展示了良好的協(xié)作推理和解決沖突的能力,可為交通管理人員協(xié)調(diào)多區(qū)域間的快車道和地面街道的路網(wǎng)阻塞提供實時決策支持。
Bo Chen等人將移動Agent 技術(shù)融入到交通管理系統(tǒng)中,增強(qiáng)了處理不確定事件和環(huán)境動態(tài)變化的能力,提出了一種基于柔性Agent 的實時交通檢測和管理系統(tǒng)。
3 多Agent在ATIS中的應(yīng)用
ATIS 可以影響出行行為,增強(qiáng)路網(wǎng)性能。當(dāng)前采用Agent 技術(shù)研究ATIS 主要是針對不同的出行需求構(gòu)建各式智能的出行信息系統(tǒng),為出行者提供高質(zhì)量的出行信息和導(dǎo)航服務(wù);另外是研究ATIS 條件下的出行者行為以及ATIS 對城市交通的影響。
3.1 基于Agent 的典型出行信息系統(tǒng)框架
為實現(xiàn)路網(wǎng)管理者和出行者之間的有效協(xié)調(diào),需要在不嚴(yán)重影響個體出行者的使用偏好(出行類型、路徑選擇、離開/到達(dá)時間等)基礎(chǔ)上有效地基于時空二維分配路網(wǎng)?;诖?,Adler 和Blue 研究了智能出行信息系統(tǒng)(IT IS),專為出行者提供出行計劃和導(dǎo)航輔助信息,提出一種代表出行者的車載智能導(dǎo)航Agent,可以學(xué)習(xí)、定義并校準(zhǔn)路徑和出行計劃偏好。在此基礎(chǔ)上,他們又提出基于多Agent 的交通管理和路徑導(dǎo)航協(xié)作系統(tǒng)(CTMRGS)的概念框架,使路網(wǎng)管理者、信息提供者和出行者之間能有效的協(xié)調(diào)和溝通。系統(tǒng)采用原則協(xié)商指導(dǎo)出行者Agent 和信息提供者Agent 之間的交互,找到一個時最優(yōu)的出行方案,最后指出更多的智能將會被用來捕捉和呈現(xiàn)出行者的真實意圖和行為。
3.2 ATIS 影響下的基于多Agent 仿真的出行者行為研究
ATIS 的有效性取決于系統(tǒng)提供信息的能力以及出行者對出行信息的反應(yīng)。因此,了解出行者的行為及其在出行信息下的決策過程便顯得尤為重要,這將有助于設(shè)計出高效的ATIS.目前,國內(nèi)外很多學(xué)者都采用Agent 仿真方法研究ATIS 環(huán)境下的出行者行為。
Dia首先提出利用多Agent 仿真來研究實時交通信息影響下的駕駛員行為。通過對駕駛員行為(特性、心理、知識、偏好等)的調(diào)查采用BDI(信念-渴望-意圖)結(jié)構(gòu)建模,配合交通仿真組件評價交通實時信息對駕駛員行為的影響。Rossetti基于BDI 架構(gòu)提出了基于DRACULA(一種結(jié)合用戶學(xué)習(xí)和微觀模擬的動態(tài)路徑分配模型)的多Agent 擴(kuò)展模型對出行者進(jìn)行建模,允許出行者對出行路徑和離開時間做出理性選擇。
駕駛員的行為會影響到ATIS 系統(tǒng)收益和系統(tǒng)的整體性能。Rossetti 基于謂詞邏輯表達(dá)方式對出行者Agent 建模,使決策過程中呈現(xiàn)了更多的出行者心理因素。仿真結(jié)果表明,系統(tǒng)的整體性能會受到出行信息需求和交通網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的影響,當(dāng)出行信息單獨向個體提供的時候,總體影響可以得到很大改善。
Joachim將出行者建模成Agent,基于兩條平行路徑的路網(wǎng)分析了ATIS 環(huán)境中的出行者路徑選擇行為,研究指出出行信息的特性很大程度上影響了ATIS的潛在收益。趙凜在Joachim 的基礎(chǔ)上,通過對系統(tǒng)中的微觀行為建立基于Agent 的仿真模型來觀察系統(tǒng)"涌現(xiàn)"出來的宏觀特征。仿真結(jié)果顯示ATIS對通勤者出行前的出行規(guī)劃有一定影響,隨著交通量的增加,交通系統(tǒng)的不確定性也隨之增加,ATIS 系統(tǒng)收益會有所提高。
3.3 相關(guān)應(yīng)用研究
Zargayouna提出了一種基于Agent 的出行者信息服務(wù)中心架構(gòu),通過實例化大量的交通實體,建立了基于環(huán)境的服務(wù)、信息資源和出行者主動交互支持模型,允許實體間建立各自感興趣的交互。
Wahle提出了一個基于多Agent 的實時交通流在線仿真和預(yù)測框架,通過歷史數(shù)據(jù)的啟發(fā)結(jié)合當(dāng)前動態(tài)數(shù)據(jù)可提供對路徑選擇行為和交通走向的短期預(yù)測。王健采用數(shù)據(jù)挖掘中的決策樹方法獲取出行者信息需求,使用Agent 技術(shù)建立了基于移動終端的信息服務(wù)網(wǎng)絡(luò)框架。Chou構(gòu)建了基于多Agent的停車導(dǎo)航協(xié)商網(wǎng)絡(luò),將汽車、停車場和導(dǎo)航系統(tǒng)建模成Agent,通過各Agent 的協(xié)作為駕駛員選擇價格和路線最優(yōu)的停車場。
4 多Agent在APTS中的應(yīng)用
4.1 基于多Agent 的公交運行狀態(tài)檢測
公交運行狀態(tài)檢測對于確保公交系統(tǒng)的正點到站、運行具有重要的意義。采用AVM 系統(tǒng)獲取公交運行數(shù)據(jù)進(jìn)行擾動(延遲和超行)檢測缺乏對全局路況的總覽而且穩(wěn)定性差,很難提供基于時空二維的路況進(jìn)展?fàn)顟B(tài)。因此,F(xiàn)lavien提出了采用多Agent 技術(shù)診斷公交擾動以及檢測定位數(shù)據(jù)傳輸?shù)倪B貫性。公交車和站點被建模成Agent,站點Agent 備有公交運行時間表,負(fù)責(zé)計算公交到站后的調(diào)度;公交車Agent負(fù)責(zé)向STOP Agent 報告路網(wǎng)實際狀態(tài),供STOPAgent 將車輛到達(dá)的理論時間和當(dāng)前實際時間相比較以檢測公交擾動。在此基礎(chǔ)上,他們又對擾動的整個生命周期進(jìn)行了動態(tài)建模,把擾動模型融合到多Agent 決策支持系統(tǒng)中,研究了擾動對路網(wǎng)活動的影響。模型包括三個信息區(qū)域:后繼區(qū)域(延遲公交車后繼站點),關(guān)鍵區(qū)域(延遲公交車所在的站點),先前區(qū)域(延遲公交車的前驅(qū)站點)。如圖4 所示,最底層的STOP Agent 接收BUS Agent 傳來的信息,中間層的STOPAREA Agent 負(fù)責(zé)從STOP Agent 中收集信息合成交通評價、客流信息、路況進(jìn)展系數(shù)等,頂層的INCIDENT Agent 形成綜合的實時調(diào)度決策。
圖4 基于分級多Agent 公交擾動檢測框架圖。
4.2 基于多Agent 的公交系統(tǒng)運行仿真
公交系統(tǒng)的運行仿真可用于調(diào)整公交調(diào)度、評價公交路網(wǎng)結(jié)構(gòu)以及制定策略。David采用多Agent仿真方法描述了公交系統(tǒng)運行,將公交車和出行者建模成Agent,所有的模型都結(jié)合了公交操作、出行者行為和道路交通負(fù)載。文中使用了多項logit 模型配備交通需求,評價了步行、汽車、公交模式的效用,并基于效用模型制定了出行者的出行路線和交通行為。仿真主要關(guān)注了公交乘客載荷和乘客等待時間。
仿真結(jié)果表明,通過將公交車和出行者建模成Agent,可方便地模擬公交車在運行過程中可能出現(xiàn)的各種狀況(飽和、不足),為特殊事件(事故、阻塞)的發(fā)生制定有效的調(diào)度策略。
5 結(jié)論與展望
ITS 的將來會被各式智能、自治的Agent 布滿整個交通系統(tǒng)中,通過互聯(lián)網(wǎng)、無線網(wǎng)絡(luò)或自組織網(wǎng)絡(luò)連接,不斷采集信息做出智能決策,最終使交通系統(tǒng)獲得徹底的智能。要使Agent 發(fā)揮更大的作用,還需要在實際應(yīng)用中充分考慮城市交通系統(tǒng)及其內(nèi)含實體的特點(出行方式特征、交通規(guī)則、路網(wǎng)結(jié)構(gòu)、出行心里),緩解通信需求、降低運算量及協(xié)調(diào)復(fù)雜度、優(yōu)化系統(tǒng)組織結(jié)構(gòu)、增強(qiáng)系統(tǒng)的穩(wěn)定性和安全性。多Agent 今后在城市交通系統(tǒng)中的研究方向應(yīng)主要集中在以下幾方面:
(1) 多個Agent 系統(tǒng)的信息融合,如在交通管理系統(tǒng)、出行信息系統(tǒng)、導(dǎo)航系統(tǒng)、停車系統(tǒng)間共享信息,通過協(xié)調(diào)多系統(tǒng)的工作,提高路網(wǎng)運行效率和出行信息服務(wù)質(zhì)量;
(2) 針對城市交通系統(tǒng)存在的問題,研究面向特定應(yīng)用領(lǐng)域的多Agent 系統(tǒng)結(jié)構(gòu)、協(xié)調(diào)算法和組織優(yōu)化技術(shù),形成規(guī)范的技術(shù)體系,包括通信環(huán)境、建模方法、評價方法等;
(3) 將更多Agent 新技術(shù)引入到城市交通系統(tǒng)設(shè)計當(dāng)中,如移動Agent、Agent 規(guī)范、Agent 體系結(jié)構(gòu)、Agent 通信和語言、Agent 組織與聯(lián)盟、Agent學(xué)習(xí)與規(guī)劃、Agent 協(xié)商與協(xié)調(diào)等方向上的新技術(shù);
(4) Agent 技術(shù)理論研究在城市交通中的應(yīng)用已形成一定的規(guī)模,如何更高效地發(fā)揮Agent 的特性使之與城市交通更緊密的結(jié)合與適應(yīng)將會成為新的研究熱點;
(5) Agent 的廣泛應(yīng)用會把更多的人工智能、系統(tǒng)工程、控制理論、優(yōu)化算法和分布式計算技術(shù)引入到實際的交通問題解決中來,為Agent 的具體應(yīng)用提供更多的新思路。