多Agent在城市交通系統(tǒng)中的應用

時間：2012-12-06 17:47:40

關鍵字： AGENT BSP ST

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]1 引言Agent 是運行于動態(tài)環(huán)境中的具有較高自制能力的實體，具有自主性、分布性、協(xié)調性和一定學習、推理能力。多智能體系統(tǒng)通過Agent 間的通訊、合作、協(xié)調和控制表達系統(tǒng)功能及行為特性。城市交通系統(tǒng)是自然的、分

1 引言

Agent 是運行于動態(tài)環(huán)境中的具有較高自制能力的實體，具有自主性、分布性、協(xié)調性和一定學習、推理能力。多智能體系統(tǒng)通過Agent 間的通訊、合作、協(xié)調和控制表達系統(tǒng)功能及行為特性。城市交通系統(tǒng)是自然的、分布的、復雜的、動態(tài)的、規(guī)模龐大的系統(tǒng)，采用多Agent 技術建模城市交通系統(tǒng)可為交通決策者和使用者提供良好的解決方案。從二十世紀80 年代末，就有學者將多Agent 技術引入到城市交通系統(tǒng)的建模中，利用其協(xié)作、存儲、智能性和自治性為使用者提供在線決策支持、實時交通控制，或利用其對客觀世界的準確描述進行交通系統(tǒng)運行仿真，發(fā)現(xiàn)交通系統(tǒng)中的問題、規(guī)律或驗證新的理論和算法。本文從ITS 框架中的先進的交通管理系統(tǒng)(ATMS)、先進的出行者信息系統(tǒng)(ATIS)、先進的公交系統(tǒng)(APTS)三個方面對Agent 技術在城市交通系統(tǒng)中的應用現(xiàn)狀展開論述，最后指出多Agent 技術在城市交通系統(tǒng)的應用中需解決的問題以及發(fā)展趨勢。

2 多Agent在ATMS中的應用

在ATMS 中，多Agent 技術主要用于提供實時的決策支持并進行適當?shù)墓芾砜刂?。根?jù)Agent 慎思型和反應型兩種模型結構，建構基于Agent 的城市交通管理系統(tǒng)也有兩種思路：分層遞階式和完全分布式。

2.1 分層遞階式結構

分層遞階式結構的每一級都由功能、結構類似的Agent 組成，同級Agent 間可相互協(xié)調，上級Agent可作為對應下級Agent 的協(xié)調單元，下級Agent 向所屬上級Agent 傳輸局部系統(tǒng)環(huán)境和系統(tǒng)控制的反饋信息，為上級Agent 提供決策依據(jù)。最早的分層遞階式系統(tǒng)就是KITS 和TRYS.

KITS 產(chǎn)生于在1992-1994 年間，將交通領域知識分解成與路網(wǎng)拓撲結構相匹配的單元集合，提供專門的推理機制進行交通決策和管理。如圖1 所示，底層的Agent 通過協(xié)作完成交通監(jiān)控和管理任務，Actor 是直接和問題區(qū)域對應的交通評價和管理單元，Supervisor 負責全局路況分析、解釋以及合成全局行動方案。KITS 的成功表明：基于知識的模型可以和多Agent 技術相集合來提高城市交通系統(tǒng)的監(jiān)控和管理能力。

圖 1 KITS 架構圖

TRYS 是在1991-1994 年間建立的實時自適應的交通管理決策系統(tǒng)。如圖2 所示，TRYS 的結構與KITS 相似，通過Agent 訪問實時采集的路況數(shù)據(jù)，并由Agent 內部的知識庫和推理引擎對數(shù)據(jù)進行分析處理，coordinator 負責協(xié)調各Agent的工作以形成全局解決方案。與KITS 不同的是，TRYS 中的問題區(qū)域由獨立的、功能強大的Agent負責監(jiān)督。

圖 2 TRYS 架構圖。

翟高壽和Choy根據(jù)遞階控制結構理論及城市交通系統(tǒng)的結構特征，提出了四層的分層遞階式結構，分別是：決策層(城市交通控制決策系統(tǒng))、戰(zhàn)略控制層(若干區(qū)域協(xié)調控制系統(tǒng))、戰(zhàn)術控制層(若干路口控制系統(tǒng))、執(zhí)行層(檢測器、信號控制器和信號燈等)。

該結構的協(xié)調控制策略在TRYS 基礎上進一步下放到了路口級，建立了路口Agent,每個路口成了一個智能的知識系統(tǒng)，可及時根據(jù)路口交通狀況進行控制策略的實時部署與調整，更好地適應了交通系統(tǒng)動態(tài)性、實時性強的特點，對突發(fā)性交通流的變化有很好的適應和調節(jié)能力。

2.2 完全分布式結構

在完全分布式結構的系統(tǒng)中，Agent 憑借自身的知識和智能與相鄰區(qū)域Agent 協(xié)調共同完成路口的管制。最初的應用就是西班牙的TRYSA2 系統(tǒng)，如圖3 所示。TRYSA2 Agent 有一個控制計劃集，每個計劃都被賦予了能夠減輕交通壓力的效用值。系統(tǒng)可通過評估相關Agent 的計劃效用值合成系統(tǒng)最優(yōu)的解決方案。Oliveira 、承向軍、楊兆升等學者也先后提出了以路口Agent 為基本控制單元的完全分布式控制結構，系統(tǒng)中的Agent 都具備了一定的存儲、匹配和智能計算功能，可依靠良好的協(xié)調算法實現(xiàn)多Agent 之間的協(xié)調與合作以達到整體優(yōu)化和控制的目的。

圖 3 TRYSA2 架構圖。

2.3 兩種架構的性能比較

分層遞階式充分體現(xiàn)了集中和分散控制的有機結合，考慮到了全局利益，可使協(xié)調有目的地進行，但是區(qū)域Agent 和主控Agent 的實現(xiàn)稍顯復雜。完全分布式具有反應快速、靈活性強等特點，可充分發(fā)揮Agent 的自治性、協(xié)調性，但由于Agent 自身能力有限、系統(tǒng)的知識又過于分散，解決全局問題的能力略顯不足，Agent 間的協(xié)調機制會對系統(tǒng)性能產(chǎn)生較大影響。在擴展性上，完全分布式只需把新Agent 注冊到其他Agent 中并修改相應的方案和知識庫即可將新Agent 擴充到當前的Agent 群體中，而分層遞階式需要整合區(qū)域控制中心和主控中心，重新賦予各Agent優(yōu)先權關系。在協(xié)作復雜度上，分層遞階式從每一個Agent 控制方案中選擇一個本地最優(yōu)的方案，完全分布式在所有的Agent 中通過搜索策略來查找最佳方案，因此后者工作量較大。

2.4 多Agent 的協(xié)調控制與優(yōu)化

多Agent 通過協(xié)調實現(xiàn)系統(tǒng)的分布式并行運行，提高任務的執(zhí)行效率。在基于多Agent 的ATMS 中，有三種協(xié)調方式：①建立專門的協(xié)調Agent;②將協(xié)調行為分散至各Agent 中，由Agent 自主地完成;③集中與分布相結合的方法，Agent 自身即可以完成某些協(xié)調行為，又可以接受高層Agent 制定的規(guī)劃。當前常用的協(xié)調方法有黑板模型、博弈模型、協(xié)調器、交換意見等。

黑板模型信息傳輸量大，對信息傳輸?shù)姆€(wěn)定性也有一定的要求，適用于簡單的分布式多路口控制。博弈論模型適用于分層遞階結構的上下級Agent 間和完全分布結構的同級Agent 間的協(xié)調，但由于重復博弈過程中需要進行復雜的均衡點收斂控制，所以基于交通信息博弈的計算量較大。協(xié)調器可基于一定的目標將同級和下級Agent 產(chǎn)生的提案合成全局的提案。協(xié)調器降低了系統(tǒng)的通信量和其他Agent 的實現(xiàn)復雜度，但卻增加了協(xié)調器Agent 自身的設計復雜度和計算量。交換意見法對系統(tǒng)通信的穩(wěn)定性有很大的要求，當單個Agent 節(jié)點出現(xiàn)通信故障時，系統(tǒng)將無法正常工作。

從上述幾種方法的分析中可以看到，協(xié)調過程需要傳輸大量數(shù)據(jù)，因此容易造成傳輸網(wǎng)絡的擁塞。目前，很多學者都采用強化學習的方法來優(yōu)化本地的交通信息。強化學習方法是以環(huán)境提供的加強信號作為性能評價的反饋，完成從狀態(tài)到行為的映射的學習，特別適合處理不斷變化的路網(wǎng)環(huán)境。Baher、歐海濤等都基于強化學習研究了實時自適應的交通信號控制，減少路口節(jié)點間的大量通訊需求，增強了決策的可靠性。

2.5 相關應用研究

Ronald通過將分離獨立的交通設施建模成能互相協(xié)作的Agent,研究了動態(tài)交通管理設備互相協(xié)作的可能性。Filippo實現(xiàn)了一種基于多Agent 架構的交通管理系統(tǒng)CARTESIUS,在分析偶發(fā)性阻塞和在線制定集成控制方案過程中展示了良好的協(xié)作推理和解決沖突的能力，可為交通管理人員協(xié)調多區(qū)域間的快車道和地面街道的路網(wǎng)阻塞提供實時決策支持。

Bo Chen等人將移動Agent 技術融入到交通管理系統(tǒng)中，增強了處理不確定事件和環(huán)境動態(tài)變化的能力，提出了一種基于柔性Agent 的實時交通檢測和管理系統(tǒng)。

3 多Agent在ATIS中的應用

ATIS 可以影響出行行為，增強路網(wǎng)性能。當前采用Agent 技術研究ATIS 主要是針對不同的出行需求構建各式智能的出行信息系統(tǒng)，為出行者提供高質量的出行信息和導航服務;另外是研究ATIS 條件下的出行者行為以及ATIS 對城市交通的影響。

3.1 基于Agent 的典型出行信息系統(tǒng)框架

為實現(xiàn)路網(wǎng)管理者和出行者之間的有效協(xié)調，需要在不嚴重影響個體出行者的使用偏好(出行類型、路徑選擇、離開/到達時間等)基礎上有效地基于時空二維分配路網(wǎng)?；诖耍珹dler 和Blue 研究了智能出行信息系統(tǒng)(IT IS)，專為出行者提供出行計劃和導航輔助信息，提出一種代表出行者的車載智能導航Agent,可以學習、定義并校準路徑和出行計劃偏好。在此基礎上，他們又提出基于多Agent 的交通管理和路徑導航協(xié)作系統(tǒng)(CTMRGS)的概念框架，使路網(wǎng)管理者、信息提供者和出行者之間能有效的協(xié)調和溝通。系統(tǒng)采用原則協(xié)商指導出行者Agent 和信息提供者Agent 之間的交互，找到一個時最優(yōu)的出行方案，最后指出更多的智能將會被用來捕捉和呈現(xiàn)出行者的真實意圖和行為。

3.2 ATIS 影響下的基于多Agent 仿真的出行者行為研究

ATIS 的有效性取決于系統(tǒng)提供信息的能力以及出行者對出行信息的反應。因此，了解出行者的行為及其在出行信息下的決策過程便顯得尤為重要，這將有助于設計出高效的ATIS.目前，國內外很多學者都采用Agent 仿真方法研究ATIS 環(huán)境下的出行者行為。

Dia首先提出利用多Agent 仿真來研究實時交通信息影響下的駕駛員行為。通過對駕駛員行為(特性、心理、知識、偏好等)的調查采用BDI(信念-渴望-意圖)結構建模，配合交通仿真組件評價交通實時信息對駕駛員行為的影響。Rossetti基于BDI 架構提出了基于DRACULA(一種結合用戶學習和微觀模擬的動態(tài)路徑分配模型)的多Agent 擴展模型對出行者進行建模，允許出行者對出行路徑和離開時間做出理性選擇。

駕駛員的行為會影響到ATIS 系統(tǒng)收益和系統(tǒng)的整體性能。Rossetti 基于謂詞邏輯表達方式對出行者Agent 建模，使決策過程中呈現(xiàn)了更多的出行者心理因素。仿真結果表明，系統(tǒng)的整體性能會受到出行信息需求和交通網(wǎng)絡拓撲結構的影響，當出行信息單獨向個體提供的時候，總體影響可以得到很大改善。

Joachim將出行者建模成Agent,基于兩條平行路徑的路網(wǎng)分析了ATIS 環(huán)境中的出行者路徑選擇行為，研究指出出行信息的特性很大程度上影響了ATIS的潛在收益。趙凜在Joachim 的基礎上，通過對系統(tǒng)中的微觀行為建立基于Agent 的仿真模型來觀察系統(tǒng)"涌現(xiàn)"出來的宏觀特征。仿真結果顯示ATIS對通勤者出行前的出行規(guī)劃有一定影響，隨著交通量的增加，交通系統(tǒng)的不確定性也隨之增加，ATIS 系統(tǒng)收益會有所提高。

3.3 相關應用研究

Zargayouna提出了一種基于Agent 的出行者信息服務中心架構，通過實例化大量的交通實體，建立了基于環(huán)境的服務、信息資源和出行者主動交互支持模型，允許實體間建立各自感興趣的交互。

Wahle提出了一個基于多Agent 的實時交通流在線仿真和預測框架，通過歷史數(shù)據(jù)的啟發(fā)結合當前動態(tài)數(shù)據(jù)可提供對路徑選擇行為和交通走向的短期預測。王健采用數(shù)據(jù)挖掘中的決策樹方法獲取出行者信息需求，使用Agent 技術建立了基于移動終端的信息服務網(wǎng)絡框架。Chou構建了基于多Agent的停車導航協(xié)商網(wǎng)絡，將汽車、停車場和導航系統(tǒng)建模成Agent,通過各Agent 的協(xié)作為駕駛員選擇價格和路線最優(yōu)的停車場。

4 多Agent在APTS中的應用

4.1 基于多Agent 的公交運行狀態(tài)檢測

公交運行狀態(tài)檢測對于確保公交系統(tǒng)的正點到站、運行具有重要的意義。采用AVM 系統(tǒng)獲取公交運行數(shù)據(jù)進行擾動(延遲和超行)檢測缺乏對全局路況的總覽而且穩(wěn)定性差，很難提供基于時空二維的路況進展狀態(tài)。因此，F(xiàn)lavien提出了采用多Agent 技術診斷公交擾動以及檢測定位數(shù)據(jù)傳輸?shù)倪B貫性。公交車和站點被建模成Agent,站點Agent 備有公交運行時間表，負責計算公交到站后的調度;公交車Agent負責向STOP Agent 報告路網(wǎng)實際狀態(tài)，供STOPAgent 將車輛到達的理論時間和當前實際時間相比較以檢測公交擾動。在此基礎上，他們又對擾動的整個生命周期進行了動態(tài)建模，把擾動模型融合到多Agent 決策支持系統(tǒng)中，研究了擾動對路網(wǎng)活動的影響。模型包括三個信息區(qū)域：后繼區(qū)域(延遲公交車后繼站點)，關鍵區(qū)域(延遲公交車所在的站點)，先前區(qū)域(延遲公交車的前驅站點)。如圖4 所示，最底層的STOP Agent 接收BUS Agent 傳來的信息，中間層的STOPAREA Agent 負責從STOP Agent 中收集信息合成交通評價、客流信息、路況進展系數(shù)等，頂層的INCIDENT Agent 形成綜合的實時調度決策。

圖4 基于分級多Agent 公交擾動檢測框架圖。

4.2 基于多Agent 的公交系統(tǒng)運行仿真

公交系統(tǒng)的運行仿真可用于調整公交調度、評價公交路網(wǎng)結構以及制定策略。David采用多Agent仿真方法描述了公交系統(tǒng)運行，將公交車和出行者建模成Agent,所有的模型都結合了公交操作、出行者行為和道路交通負載。文中使用了多項logit 模型配備交通需求，評價了步行、汽車、公交模式的效用，并基于效用模型制定了出行者的出行路線和交通行為。仿真主要關注了公交乘客載荷和乘客等待時間。

仿真結果表明，通過將公交車和出行者建模成Agent,可方便地模擬公交車在運行過程中可能出現(xiàn)的各種狀況(飽和、不足)，為特殊事件(事故、阻塞)的發(fā)生制定有效的調度策略。

5 結論與展望

ITS 的將來會被各式智能、自治的Agent 布滿整個交通系統(tǒng)中，通過互聯(lián)網(wǎng)、無線網(wǎng)絡或自組織網(wǎng)絡連接，不斷采集信息做出智能決策，最終使交通系統(tǒng)獲得徹底的智能。要使Agent 發(fā)揮更大的作用，還需要在實際應用中充分考慮城市交通系統(tǒng)及其內含實體的特點(出行方式特征、交通規(guī)則、路網(wǎng)結構、出行心里)，緩解通信需求、降低運算量及協(xié)調復雜度、優(yōu)化系統(tǒng)組織結構、增強系統(tǒng)的穩(wěn)定性和安全性。多Agent 今后在城市交通系統(tǒng)中的研究方向應主要集中在以下幾方面：

(1) 多個Agent 系統(tǒng)的信息融合，如在交通管理系統(tǒng)、出行信息系統(tǒng)、導航系統(tǒng)、停車系統(tǒng)間共享信息，通過協(xié)調多系統(tǒng)的工作，提高路網(wǎng)運行效率和出行信息服務質量;

(2) 針對城市交通系統(tǒng)存在的問題，研究面向特定應用領域的多Agent 系統(tǒng)結構、協(xié)調算法和組織優(yōu)化技術，形成規(guī)范的技術體系，包括通信環(huán)境、建模方法、評價方法等;

(3) 將更多Agent 新技術引入到城市交通系統(tǒng)設計當中，如移動Agent、Agent 規(guī)范、Agent 體系結構、Agent 通信和語言、Agent 組織與聯(lián)盟、Agent學習與規(guī)劃、Agent 協(xié)商與協(xié)調等方向上的新技術;

(4) Agent 技術理論研究在城市交通中的應用已形成一定的規(guī)模，如何更高效地發(fā)揮Agent 的特性使之與城市交通更緊密的結合與適應將會成為新的研究熱點;

(5) Agent 的廣泛應用會把更多的人工智能、系統(tǒng)工程、控制理論、優(yōu)化算法和分布式計算技術引入到實際的交通問題解決中來，為Agent 的具體應用提供更多的新思路。