1 Agent 基本概述
1.1 基本概念
目前學術界對 Agent 的定義多種多樣,難以形成一個統(tǒng)一確切的概念。Agent 的一般描述為:Agent 是一個具有自主性、社會性、反應性、主動性的抽象實體,它能在一定環(huán)境下能獨立自主地運行,作用于環(huán)境也受環(huán)境影響,且能不斷地從環(huán)境中獲取知識以提高自己的能力。Agent 具有以下特點:自主性、社會性、反應性和主動性。
1.2 Agent 的理論模型
由于 Agent 理論模型是Agent 技術的基礎,因此,關于Agent 模型結(jié)構的研究是目前主要的研究領域之一。當前,人們側(cè)重研究信念(Belief)、愿望(Desire)、意圖(IntentiON)的關系和形式化描述,建立Agent 的BDI 模型。
1.3 Agent 的體系結(jié)構
Agent 結(jié)構需要解決的問題是Agent 由哪些模塊組成,它們之間如何交互信息,如何將這些模塊組合起來形成一個有機整體,所以說對Agent 的基本結(jié)構進行描述和研究是必要的。一般來說,Agent 一般組成和結(jié)構主要包括Agent 的基本屬性和通訊模塊、學習模塊、推理模塊和事件處理模塊等。
2 維修人員的決策過程分析
維修人員需求的確定,主要是根據(jù)維修工作分析中記錄的維修工作與人員專業(yè)、技術等級與數(shù)量之間的關系,以及*各維修級別維修人員的編制,裝備的部署數(shù)量和年使用時間,從而確定出在各個維修級別上需配備的人員專業(yè)、技術等級與數(shù)量。決策流程圖如圖3所示。具體的分析工作可分為以下3 步:
?、俑鶕?jù)維修工作分析中記錄的維修工作與維修人員之間的關系,確定出所需人員數(shù)量、專業(yè)及技術等級一些信息;
?、诟鶕?jù)設備信息,按照設備的使用量和維修率來計算每件設備在各個維修級別上的工作量;
?、鄹鶕?jù)所要求的人員、可用有效工時以及工作量的要求,確定出各個專業(yè)、技術等級的人員數(shù)量需求。
3 裝備維修人員配備模型
裝備維修是保持和恢復裝備的戰(zhàn)斗力,充分發(fā)揮裝備軍事效能的主要手段,根據(jù)不同的裝備特點和任務要求,合理的組織裝備維修力量,以保證裝備遂行作戰(zhàn)、訓練或其它任務的順利完成。維修人員是裝備維修保障決策中最具有活力和變化的因素,裝備維修人員的素質(zhì)起著決定性的作用,充分發(fā)揮維修人力資源的效能和利用率有著重要的作用。
對于裝備維修人員的配備數(shù)量問題,一方面要求有足夠的人力,以保證裝備維修的需要;另一方面,又要求提高人員的利用率,避免人員編制的浪費。在進行了裝備維修人員配備之前,需要考慮的幾個因素有:
?、俅S修裝備的類型及各類型的數(shù)量。待維修裝備的類型和數(shù)量決定了整個維修任務的工作量,是確定維修人員組成的決定性因素。②維修同型裝備的器材設施數(shù)量。維修設施的數(shù)量,將制約著維修任務的同時進行,是維修過程中的限定性條件,它制約著同一類型的裝備維修是并行維修還是串行維修。③各型維修備件的數(shù)量。維修備件的數(shù)量,限定了實際能維修的損壞裝備的數(shù)量,因此維修備件的數(shù)量也是一個限定因素。下面的維修人員配備模型是在損壞裝備數(shù)量和類型、維修人員都己確定的條件下建立,如果備件數(shù)量不受限制,其主要的*價指標就是維修任務完成的總時間。如果備件數(shù)量有限時,*價指標就有兩個:一是維修任務完成的總時間;二是配套裝備的數(shù)量。維修人員的配備組成,即確定哪些人員參加及分配每個人的任務,可以通過求解任務安排問題而確定。任務即是損壞的裝備,而維修人員就是等待分配任務的維修人員。本模型討論的人力資源配備主要是指作戰(zhàn)指揮員通過該系統(tǒng)對人員、設備等可用資源的任務分配,也就是資源調(diào)配問題。為了綜合考慮這些因素的影響,必須設計一個合適的目標函數(shù)coST,這個目標函數(shù)cost 體現(xiàn)出MAS 對子任務分配問題的要求,并體現(xiàn)整個任務組完成后的時間消耗。這個函數(shù)可以是如下形式:
其中,,即每個人員Agent最大的工作時間為。
求解MAS子任務分配的最優(yōu)解過程就是尋找一組解使得目標函數(shù)cost達到最優(yōu)值。在這里我們利用遺傳算法與模擬退火算法結(jié)合來實現(xiàn)任務分配求解。
遺傳算法 (Genetic Algorithm)是一類模擬自然過程,特別是模擬生物界自然進化和遺傳過程的隨機搜索算法,具有在復雜空間求解近似最優(yōu)解的能力。它采用簡單的編碼技術來表示各種復雜的結(jié)構,并通過對一組編碼表示進行簡單的遺傳操作和優(yōu)勝劣汰的自然選擇來指導學習和確定搜索的方向。遺傳算法的操作對象是一群二進制(稱為染色體、個體),即種群。這里每一個染色體都對應問題的一個解。從初始種群出發(fā),采用基于適應值比例的選擇策略在當前種群中選擇個體,使用雜交和變異來產(chǎn)生下一代種群。如此模仿生命的進化一代代演化下去,直到滿足期望的終止條件為止。其基本步驟:
(1)定義一個目標函數(shù),即函數(shù)cost;
(2)將可行解群體在一定的約束條件下初始化,每一個可行解用一個向量x來編碼,稱為一條染色體,向量的分量代表基因,它對應可行解的某一決策變量;
(3)計算群體中每條染色體xi(i =1,2,...,n)所對應的目標函數(shù)值,并以此計算適應值,按F的大小來*價該可行解的好壞;
(4)以優(yōu)勝劣汰的機制,將適應值差的染色體淘汰掉,對幸存的染色體根據(jù)其適應值的好壞,按概率隨機選擇,進行繁殖,形成新的群體;
(5)通過雜交和變異的操作,產(chǎn)生子代。雜交是隨機選擇兩條染色體(雙親),將某一點或多點的基因互換而產(chǎn)生兩個新個體,變異是基因中的某一點或多點發(fā)生突變。
對于子代群體重復步驟(3)至(5)的操作,進行新一輪遺傳進化過程,直到迭代收斂(適應值趨穩(wěn)定)即找到了最優(yōu)解或準最優(yōu)解。模擬退火算法(Simulated AnneALIng)的研究對象是由一個參數(shù)集所確定的某種配置。對配置的優(yōu)化過程即是對目標函數(shù)cost的極小化過程。極小化過程模擬自然界的退火過程,由一個逐步冷卻溫度temp控制。在每個極小化步驟中,隨機選擇一個新的配置并計算cost函數(shù)。如cost比以前的小,則選定新的配置;如大,則計算概率值。
這里k為玻爾茲曼常數(shù)。然后在(0,1)上產(chǎn)生隨機數(shù)rand,如果rands prob,則選擇新的配置方案;如果rand a prob,仍保留原方案,重復這些步驟直到冷卻不再產(chǎn)生更好的配置為止。
系統(tǒng)中維修人員決策推理的核心工作就是對裝備維修人員的配備進行分析,特別是戰(zhàn)時搶修時,考慮戰(zhàn)場環(huán)境的復雜性以及時間的寶貴性,選擇適當?shù)娜藛T進行維修,關系到戰(zhàn)爭的成敗,所以應該在對裝備維修人員的技能進行*估之后,根據(jù)維修任務的多少,對裝備維修人員進行適當?shù)倪x擇配備。其推理的整個過程:首先根據(jù)損壞裝備維修的類型與數(shù)量,進行規(guī)則推理從模型Agent中確定要使用的模型,再利用裝備實際數(shù)據(jù)、歷史數(shù)據(jù)和相應的信息處理方法,得到?jīng)Q策模型要使用的參數(shù),最后確定所需得維修人員配備的最佳方案,維修人員決策過程如圖4如示。
4 結(jié)語
本文把 Agent 技術應用于裝備維修人員保障決策模型中,利用了Agent 的自主性、社會性、反應性和主動性特點,優(yōu)化了人員保障模型,使得人員能夠用的及時、恰當、不浪費。
本文創(chuàng)新點:從模型Agent 中確定要使用的模型,再利用裝備實際數(shù)據(jù)、歷史數(shù)據(jù)和相應的信息處理方法,得到?jīng)Q策模型要使用的參數(shù),最后確定所需得維修人員配備的最佳方案。