多智能體在城市交通系統(tǒng)中應(yīng)用現(xiàn)狀綜述

時間：2012-10-19 21:06:21

關(guān)鍵字：智能體 AGENT ST

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]　1 引言　　Agent 是運行于動態(tài)環(huán)境中的具有較高自制能力的實體，具有自主性、分布性、協(xié)調(diào)性和一定學(xué)習(xí)、推理能力。多智能體系統(tǒng)通過Agent 間的通訊、合作、協(xié)調(diào)和控制表達系統(tǒng)功能及行為特性。城市交通系統(tǒng)是自然

　1 引言

　　Agent 是運行于動態(tài)環(huán)境中的具有較高自制能力的實體，具有自主性、分布性、協(xié)調(diào)性和一定學(xué)習(xí)、推理能力。多智能體系統(tǒng)通過Agent 間的通訊、合作、協(xié)調(diào)和控制表達系統(tǒng)功能及行為特性。城市交通系統(tǒng)是自然的、分布的、復(fù)雜的、動態(tài)的、規(guī)模龐大的系統(tǒng)，采用多Agent 技術(shù)建模城市交通系統(tǒng)可為交通決策者和使用者提供良好的解決方案。從二十世紀80 年代末，就有學(xué)者將多Agent 技術(shù)引入到城市交通系統(tǒng)的建模中，利用其協(xié)作、存儲、智能性和自治性為使用者提供在線決策支持、實時交通控制，或利用其對客觀世界的準確描述進行交通系統(tǒng)運行仿真，發(fā)現(xiàn)交通系統(tǒng)中的問題、規(guī)律或驗證新的理論和算法。本文從ITS 框架中的先進的交通管理系統(tǒng)（ATMS）、先進的出行者信息系統(tǒng)（ATIS）、先進的公交系統(tǒng)（APTS）三個方面對Agent 技術(shù)在城市交通系統(tǒng)中的應(yīng)用現(xiàn)狀展開論述，最后指出多Agent 技術(shù)在城市交通系統(tǒng)的應(yīng)用中需解決的問題以及發(fā)展趨勢。

　　2 多Agent在ATMS中的應(yīng)用

　　在ATMS 中，多Agent 技術(shù)主要用于提供實時的決策支持并進行適當(dāng)?shù)墓芾砜刂?。根?jù)Agent 慎思型和反應(yīng)型兩種模型結(jié)構(gòu)，建構(gòu)基于Agent 的城市交通管理系統(tǒng)也有兩種思路：分層遞階式和完全分布式。

　　2.1 分層遞階式結(jié)構(gòu)

　　分層遞階式結(jié)構(gòu)的每一級都由功能、結(jié)構(gòu)類似的Agent 組成，同級Agent 間可相互協(xié)調(diào)，上級Agent可作為對應(yīng)下級Agent 的協(xié)調(diào)單元，下級Agent 向所屬上級Agent 傳輸局部系統(tǒng)環(huán)境和系統(tǒng)控制的反饋信息，為上級Agent 提供決策依據(jù)。最早的分層遞階式系統(tǒng)就是KITS 和TRYS.

　　KITS 產(chǎn)生于在1992-1994 年間，將交通領(lǐng)域知識分解成與路網(wǎng)拓撲結(jié)構(gòu)相匹配的單元集合，提供專門的推理機制進行交通決策和管理。如圖1 所示，底層的Agent 通過協(xié)作完成交通監(jiān)控和管理任務(wù)，Actor 是直接和問題區(qū)域?qū)?yīng)的交通評價和管理單元，Supervisor 負責(zé)全局路況分析、解釋以及合成全局行動方案。KITS 的成功表明：基于知識的模型可以和多Agent 技術(shù)相集合來提高城市交通系統(tǒng)的監(jiān)控和管理能力。

圖 1 KITS 架構(gòu)圖

　　TRYS 是在1991-1994 年間建立的實時自適應(yīng)的交通管理決策系統(tǒng)。如圖2 所示，TRYS 的結(jié)構(gòu)與KITS 相似，通過Agent 訪問實時采集的路況數(shù)據(jù)，并由Agent 內(nèi)部的知識庫和推理引擎對數(shù)據(jù)進行分析處理，coordinator 負責(zé)協(xié)調(diào)各Agent的工作以形成全局解決方案。與KITS 不同的是，TRYS 中的問題區(qū)域由獨立的、功能強大的Agent負責(zé)監(jiān)督。

圖 2 TRYS 架構(gòu)圖。

　　翟高壽和Choy根據(jù)遞階控制結(jié)構(gòu)理論及城市交通系統(tǒng)的結(jié)構(gòu)特征，提出了四層的分層遞階式結(jié)構(gòu)，分別是：決策層（城市交通控制決策系統(tǒng)）、戰(zhàn)略控制層（若干區(qū)域協(xié)調(diào)控制系統(tǒng)）、戰(zhàn)術(shù)控制層（若干路口控制系統(tǒng)）、執(zhí)行層（檢測器、信號控制器和信號燈等）。

　　該結(jié)構(gòu)的協(xié)調(diào)控制策略在TRYS 基礎(chǔ)上進一步下放到了路口級，建立了路口Agent,每個路口成了一個智能的知識系統(tǒng)，可及時根據(jù)路口交通狀況進行控制策略的實時部署與調(diào)整，更好地適應(yīng)了交通系統(tǒng)動態(tài)性、實時性強的特點，對突發(fā)性交通流的變化有很好的適應(yīng)和調(diào)節(jié)能力。

2.2 完全分布式結(jié)構(gòu)

　　在完全分布式結(jié)構(gòu)的系統(tǒng)中，Agent 憑借自身的知識和智能與相鄰區(qū)域Agent 協(xié)調(diào)共同完成路口的管制。最初的應(yīng)用就是西班牙的TRYSA2 系統(tǒng)，如圖3 所示。TRYSA2 Agent 有一個控制計劃集，每個計劃都被賦予了能夠減輕交通壓力的效用值。系統(tǒng)可通過評估相關(guān)Agent 的計劃效用值合成系統(tǒng)最優(yōu)的解決方案。Oliveira 、承向軍、楊兆升等學(xué)者也先后提出了以路口Agent 為基本控制單元的完全分布式控制結(jié)構(gòu)，系統(tǒng)中的Agent 都具備了一定的存儲、匹配和智能計算功能，可依靠良好的協(xié)調(diào)算法實現(xiàn)多Agent 之間的協(xié)調(diào)與合作以達到整體優(yōu)化和控制的目的。

圖 3 TRYSA2 架構(gòu)圖。

　　2.3 兩種架構(gòu)的性能比較

　　分層遞階式充分體現(xiàn)了集中和分散控制的有機結(jié)合，考慮到了全局利益，可使協(xié)調(diào)有目的地進行，但是區(qū)域Agent 和主控Agent 的實現(xiàn)稍顯復(fù)雜。完全分布式具有反應(yīng)快速、靈活性強等特點，可充分發(fā)揮Agent 的自治性、協(xié)調(diào)性，但由于Agent 自身能力有限、系統(tǒng)的知識又過于分散，解決全局問題的能力略顯不足，Agent 間的協(xié)調(diào)機制會對系統(tǒng)性能產(chǎn)生較大影響。在擴展性上，完全分布式只需把新Agent 注冊到其他Agent 中并修改相應(yīng)的方案和知識庫即可將新Agent 擴充到當(dāng)前的Agent 群體中，而分層遞階式需要整合區(qū)域控制中心和主控中心，重新賦予各Agent優(yōu)先權(quán)關(guān)系。在協(xié)作復(fù)雜度上，分層遞階式從每一個Agent 控制方案中選擇一個本地最優(yōu)的方案，完全分布式在所有的Agent 中通過搜索策略來查找最佳方案，因此后者工作量較大。

　　2.4 多Agent 的協(xié)調(diào)控制與優(yōu)化

　　多Agent 通過協(xié)調(diào)實現(xiàn)系統(tǒng)的分布式并行運行，提高任務(wù)的執(zhí)行效率。在基于多Agent 的ATMS 中，有三種協(xié)調(diào)方式：①建立專門的協(xié)調(diào)Agent;②將協(xié)調(diào)行為分散至各Agent 中，由Agent 自主地完成；③集中與分布相結(jié)合的方法，Agent 自身即可以完成某些協(xié)調(diào)行為，又可以接受高層Agent 制定的規(guī)劃。當(dāng)前常用的協(xié)調(diào)方法有黑板模型、博弈模型、協(xié)調(diào)器、交換意見等。

　　黑板模型信息傳輸量大，對信息傳輸?shù)姆€(wěn)定性也有一定的要求，適用于簡單的分布式多路口控制。博弈論模型適用于分層遞階結(jié)構(gòu)的上下級Agent 間和完全分布結(jié)構(gòu)的同級Agent 間的協(xié)調(diào)，但由于重復(fù)博弈過程中需要進行復(fù)雜的均衡點收斂控制，所以基于交通信息博弈的計算量較大。協(xié)調(diào)器可基于一定的目標(biāo)將同級和下級Agent 產(chǎn)生的提案合成全局的提案。協(xié)調(diào)器降低了系統(tǒng)的通信量和其他Agent 的實現(xiàn)復(fù)雜度，但卻增加了協(xié)調(diào)器Agent 自身的設(shè)計復(fù)雜度和計算量。交換意見法對系統(tǒng)通信的穩(wěn)定性有很大的要求，當(dāng)單個Agent 節(jié)點出現(xiàn)通信故障時，系統(tǒng)將無法正常工作。

　　從上述幾種方法的分析中可以看到，協(xié)調(diào)過程需要傳輸大量數(shù)據(jù)，因此容易造成傳輸網(wǎng)絡(luò)的擁塞。目前，很多學(xué)者都采用強化學(xué)習(xí)的方法來優(yōu)化本地的交通信息。強化學(xué)習(xí)方法是以環(huán)境提供的加強信號作為性能評價的反饋，完成從狀態(tài)到行為的映射的學(xué)習(xí)，特別適合處理不斷變化的路網(wǎng)環(huán)境。Baher、歐海濤等都基于強化學(xué)習(xí)研究了實時自適應(yīng)的交通信號控制，減少路口節(jié)點間的大量通訊需求，增強了決策的可靠性。

　　2.5 相關(guān)應(yīng)用研究

　　Ronald通過將分離獨立的交通設(shè)施建模成能互相協(xié)作的Agent,研究了動態(tài)交通管理設(shè)備互相協(xié)作的可能性。Filippo實現(xiàn)了一種基于多Agent 架構(gòu)的交通管理系統(tǒng)CARTESIUS,在分析偶發(fā)性阻塞和在線制定集成控制方案過程中展示了良好的協(xié)作推理和解決沖突的能力，可為交通管理人員協(xié)調(diào)多區(qū)域間的快車道和地面街道的路網(wǎng)阻塞提供實時決策支持。

　　Bo Chen等人將移動Agent 技術(shù)融入到交通管理系統(tǒng)中，增強了處理不確定事件和環(huán)境動態(tài)變化的能力，提出了一種基于柔性Agent 的實時交通檢測和管理系統(tǒng)。

　　3 多Agent在ATIS中的應(yīng)用

　　ATIS 可以影響出行行為，增強路網(wǎng)性能。當(dāng)前采用Agent 技術(shù)研究ATIS 主要是針對不同的出行需求構(gòu)建各式智能的出行信息系統(tǒng)，為出行者提供高質(zhì)量的出行信息和導(dǎo)航服務(wù)；另外是研究ATIS 條件下的出行者行為以及ATIS 對城市交通的影響。

　　3.1 基于Agent 的典型出行信息系統(tǒng)框架

　　為實現(xiàn)路網(wǎng)管理者和出行者之間的有效協(xié)調(diào)，需要在不嚴重影響個體出行者的使用偏好（出行類型、路徑選擇、離開/到達時間等）基礎(chǔ)上有效地基于時空二維分配路網(wǎng)。基于此，Adler 和Blue 研究了智能出行信息系統(tǒng)（IT IS），專為出行者提供出行計劃和導(dǎo)航輔助信息，提出一種代表出行者的車載智能導(dǎo)航Agent,可以學(xué)習(xí)、定義并校準路徑和出行計劃偏好。在此基礎(chǔ)上，他們又提出基于多Agent 的交通管理和路徑導(dǎo)航協(xié)作系統(tǒng)（CTMRGS）的概念框架，使路網(wǎng)管理者、信息提供者和出行者之間能有效的協(xié)調(diào)和溝通。系統(tǒng)采用原則協(xié)商指導(dǎo)出行者Agent 和信息提供者Agent 之間的交互，找到一個時空最優(yōu)的出行方案，最后指出更多的智能將會被用來捕捉和呈現(xiàn)出行者的真實意圖和行為。

　　3.2 ATIS 影響下的基于多Agent 仿真的出行者行為研究

　　ATIS 的有效性取決于系統(tǒng)提供信息的能力以及出行者對出行信息的反應(yīng)。因此，了解出行者的行為及其在出行信息下的決策過程便顯得尤為重要，這將有助于設(shè)計出高效的ATIS.目前，國內(nèi)外很多學(xué)者都采用Agent 仿真方法研究ATIS 環(huán)境下的出行者行為。

　　Dia首先提出利用多Agent 仿真來研究實時交通信息影響下的駕駛員行為。通過對駕駛員行為（特性、心理、知識、偏好等）的調(diào)查采用BDI（信念-渴望-意圖）結(jié)構(gòu)建模，配合交通仿真組件評價交通實時信息對駕駛員行為的影響。Rossetti基于BDI 架構(gòu)提出了基于DRACULA（一種結(jié)合用戶學(xué)習(xí)和微觀模擬的動態(tài)路徑分配模型）的多Agent 擴展模型對出行者進行建模，允許出行者對出行路徑和離開時間做出理性選擇。

　　駕駛員的行為會影響到ATIS 系統(tǒng)收益和系統(tǒng)的整體性能。Rossetti 基于謂詞邏輯表達方式對出行者Agent 建模，使決策過程中呈現(xiàn)了更多的出行者心理因素。仿真結(jié)果表明，系統(tǒng)的整體性能會受到出行信息需求和交通網(wǎng)絡(luò)拓撲結(jié)構(gòu)的影響，當(dāng)出行信息單獨向個體提供的時候，總體影響可以得到很大改善。

　　Joachim將出行者建模成Agent,基于兩條平行路徑的路網(wǎng)分析了ATIS 環(huán)境中的出行者路徑選擇行為，研究指出出行信息的特性很大程度上影響了ATIS的潛在收益。趙凜在Joachim 的基礎(chǔ)上，通過對系統(tǒng)中的微觀行為建立基于Agent 的仿真模型來觀察系統(tǒng)"涌現(xiàn)"出來的宏觀特征。仿真結(jié)果顯示ATIS對通勤者出行前的出行規(guī)劃有一定影響，隨著交通量的增加，交通系統(tǒng)的不確定性也隨之增加，ATIS 系統(tǒng)收益會有所提高。

3.3 相關(guān)應(yīng)用研究

　　Zargayouna提出了一種基于Agent 的出行者信息服務(wù)中心架構(gòu)，通過實例化大量的交通實體，建立了基于環(huán)境的服務(wù)、信息資源和出行者主動交互支持模型，允許實體間建立各自感興趣的交互。

　　Wahle提出了一個基于多Agent 的實時交通流在線仿真和預(yù)測框架，通過歷史數(shù)據(jù)的啟發(fā)結(jié)合當(dāng)前動態(tài)數(shù)據(jù)可提供對路徑選擇行為和交通走向的短期預(yù)測。王健采用數(shù)據(jù)挖掘中的決策樹方法獲取出行者信息需求，使用Agent 技術(shù)建立了基于移動終端的信息服務(wù)網(wǎng)絡(luò)框架。Chou構(gòu)建了基于多Agent的停車導(dǎo)航協(xié)商網(wǎng)絡(luò)，將汽車、停車場和導(dǎo)航系統(tǒng)建模成Agent,通過各Agent 的協(xié)作為駕駛員選擇價格和路線最優(yōu)的停車場。

　　4 多Agent在APTS中的應(yīng)用

　　4.1 基于多Agent 的公交運行狀態(tài)檢測

　　公交運行狀態(tài)檢測對于確保公交系統(tǒng)的正點到站、運行具有重要的意義。采用AVM 系統(tǒng)獲取公交運行數(shù)據(jù)進行擾動（延遲和超行）檢測缺乏對全局路況的總覽而且穩(wěn)定性差，很難提供基于時空二維的路況進展?fàn)顟B(tài)。因此，F(xiàn)lavien提出了采用多Agent 技術(shù)診斷公交擾動以及檢測定位數(shù)據(jù)傳輸?shù)倪B貫性。公交車和站點被建模成Agent,站點Agent 備有公交運行時間表，負責(zé)計算公交到站后的調(diào)度；公交車Agent負責(zé)向STOP Agent 報告路網(wǎng)實際狀態(tài)，供STOPAgent 將車輛到達的理論時間和當(dāng)前實際時間相比較以檢測公交擾動。在此基礎(chǔ)上，他們又對擾動的整個生命周期進行了動態(tài)建模，把擾動模型融合到多Agent 決策支持系統(tǒng)中，研究了擾動對路網(wǎng)活動的影響。模型包括三個信息區(qū)域：后繼區(qū)域（延遲公交車后繼站點），關(guān)鍵區(qū)域（延遲公交車所在的站點），先前區(qū)域（延遲公交車的前驅(qū)站點）。如圖4 所示，最底層的STOP Agent 接收BUS Agent 傳來的信息，中間層的STOPAREA Agent 負責(zé)從STOP Agent 中收集信息合成交通評價、客流信息、路況進展系數(shù)等，頂層的INCIDENT Agent 形成綜合的實時調(diào)度決策。

圖4 基于分級多Agent 公交擾動檢測框架圖。

　　4.2 基于多Agent 的公交系統(tǒng)運行仿真

　　公交系統(tǒng)的運行仿真可用于調(diào)整公交調(diào)度、評價公交路網(wǎng)結(jié)構(gòu)以及制定策略。David采用多Agent仿真方法描述了公交系統(tǒng)運行，將公交車和出行者建模成Agent,所有的模型都結(jié)合了公交操作、出行者行為和道路交通負載。文中使用了多項logit 模型配備交通需求，評價了步行、汽車、公交模式的效用，并基于效用模型制定了出行者的出行路線和交通行為。仿真主要關(guān)注了公交乘客載荷和乘客等待時間。

　　仿真結(jié)果表明，通過將公交車和出行者建模成Agent,可方便地模擬公交車在運行過程中可能出現(xiàn)的各種狀況（飽和、不足），為特殊事件（事故、阻塞）的發(fā)生制定有效的調(diào)度策略。

　　5 結(jié)論與展望

　　ITS 的將來會被各式智能、自治的Agent 布滿整個交通系統(tǒng)中，通過互聯(lián)網(wǎng)、無線網(wǎng)絡(luò)或自組織網(wǎng)絡(luò)連接，不斷采集信息做出智能決策，最終使交通系統(tǒng)獲得徹底的智能。要使Agent 發(fā)揮更大的作用，還需要在實際應(yīng)用中充分考慮城市交通系統(tǒng)及其內(nèi)含實體的特點（出行方式特征、交通規(guī)則、路網(wǎng)結(jié)構(gòu)、出行心里），緩解通信需求、降低運算量及協(xié)調(diào)復(fù)雜度、優(yōu)化系統(tǒng)組織結(jié)構(gòu)、增強系統(tǒng)的穩(wěn)定性和安全性。多Agent 今后在城市交通系統(tǒng)中的研究方向應(yīng)主要集中在以下幾方面：

　?。?）多個Agent 系統(tǒng)的信息融合，如在交通管理系統(tǒng)、出行信息系統(tǒng)、導(dǎo)航系統(tǒng)、停車系統(tǒng)間共享信息，通過協(xié)調(diào)多系統(tǒng)的工作，提高路網(wǎng)運行效率和出行信息服務(wù)質(zhì)量；

　　（2）針對城市交通系統(tǒng)存在的問題，研究面向特定應(yīng)用領(lǐng)域的多Agent 系統(tǒng)結(jié)構(gòu)、協(xié)調(diào)算法和組織優(yōu)化技術(shù)，形成規(guī)范的技術(shù)體系，包括通信環(huán)境、建模方法、評價方法等；

　?。?）將更多Agent 新技術(shù)引入到城市交通系統(tǒng)設(shè)計當(dāng)中，如移動Agent、Agent 規(guī)范、Agent 體系結(jié)構(gòu)、Agent 通信和語言、Agent 組織與聯(lián)盟、Agent學(xué)習(xí)與規(guī)劃、Agent 協(xié)商與協(xié)調(diào)等方向上的新技術(shù)；

　　（4） Agent 技術(shù)理論研究在城市交通中的應(yīng)用已形成一定的規(guī)模，如何更高效地發(fā)揮Agent 的特性使之與城市交通更緊密的結(jié)合與適應(yīng)將會成為新的研究熱點；

　?。?） Agent 的廣泛應(yīng)用會把更多的人工智能、系統(tǒng)工程、控制理論、優(yōu)化算法和分布式計算技術(shù)引入到實際的交通問題解決中來，為Agent 的具體應(yīng)用提供更多的新思路。