多智能体系统协调控制一致性问题研究
摘要:本文首先给出了多智能体系统协调控制一致性问题的发展情况,介绍了解决一致性问题的主要原理和适用范围,对一致性协议进行了总结,对一致性问题研究的主要领域进行了简单的概括。文章最后对多智能体系统未来的发展方向进行了探讨和分析,提出几个具有理论和实践意义的研究方向。
关键词:分布式人工智能;多智能体系统;协调控制;一致性问题
1. 引言
多智能体系统在20世纪80年代后期成为分布式人工智能研究中的主要研究对象。研究多智能体系统的主要目的就是期望功能相对简单的智能体之间进行分布式合作协调控制,最终完成复杂任务。多智能体系统由于其健壮、可靠、高效、可扩展等特性,在计算机网络、机器人、电力系统、交通控制、社会仿真、虚拟现实、军事等方面有着广泛应用[1-3]。智能体的分布式协调合作能力是多智能体系统的基础,是发挥多智能体系统优势的关键,也是整个系统智能性的体现。
在多智能体分布式协调合作控制问题中,一致性问题作为智能体之间合作协调控制的基础,主要是研究如何基于多智能体系统中个体之间有限的信息交换,来设计的算法,使得所有的智能体的状态达到某同一状态的问题。一致性协议问题作为智能体之间相互作用、传递信息的规则,它描述了每个智能体和与其相邻的智能体的信息交换过程。
近年来,一致性问题的研究发展迅速,包括生物科学、物理科学、系统与控制科学、计算机科学等各个领域都对一致性问题从不同层面进行了深入分析,一致性问题作为智能体之间合作协调的基础,受到越来越多研究者的关注,成为系统与控制领域的一个重要研究课题。
2. 多智能体系统协调控制中一致性问题阐述
2.1 图论基础知识
图论和矩阵论是一致性问题研究分析中非常重要的工具,很自然的会想到用图论相关知识来表示多智能体相互间传递信息的过程。如果用G?(V,E)来表示一个图,其中V表示非空顶点的集合,E?V2表示节点对组成的边的集合。假设集合V中共有n个节点,切编号为i??1,2,...,n?。如果第i个节点和第j个节点之
间有信息传递,则该节点对有连边。在无向图中,节点对是无序的,即节点对间连边没有方向,?vi,vj??E??vj,vi??E。然而在有向图中,第i个节点有边指向第j个节点并不代表第j个节点有边指向第i个节点,即边是有向的。顶点集V和边集E通常决定了网络拓扑图的序与尺寸。在动态网络系统中,边集E统称为系统的通信复杂度。 2.2 矩阵论基础
为了表示节点与边的关系,通常采用邻接矩阵A???aij??来表示。具体定义如下:
?1 i,j?E ??aij????0 otherwise (1)
?对于无向图G,其邻接矩阵是对称的。
对于每一个智能体,采用的是分布式控制策略,能够通信的范围是有限的,主要通过自身的状态和能够进行通信的邻居状态来进行状态的变化。通常用邻域集N来表示智能体的邻域集。第i个智能的邻域集定义如下:
Ni??j?V;aij?0???j?V;(i,j)?E? (2)
如果智能体j是i的邻居,且aij?0,则表示智能体i可以接收j的信息。如果网络拓扑结构时变,为切换拓扑网络结构,则G?(V,E)为动态图,记为
G(t)?(V,E(t))。其中边集E(t)、邻接矩阵A(t)及每个智能体i的领域集Ni(t)均
时变。在许多应用中,网络拓扑结构经常为切换拓扑,如移动机器人通信网络。 2.3 一致性问题数学描述
对于多智能体系统中的单个智能体i的状态可以表示为zi(t)?ui,若所有智能体的状态最终趋于相等,则表示为
zi(t)?zj(t)?0,?i?j且t?? (3) 3. 多智能体系统协调控制一致性问题理论分析
用zi(t)表示第i个智能体的状态信息。状态信息是用来表示智能体进行协调控制所需要的信息,可以是速度、位置、角度、决策量等信息。
3.1 基于连续时间的一致性协议
Offati-Saber等人[4]提出了一种基于连续时间的分布式一致性协议,协议如下:
zi(t)?j?Ni(t)?aij(zj(t)?zi(t)) (4)
该协议只需通过智能体的邻域信息传递就可达到整个系统趋于一致。该协议也可用矩阵的方式表示:
???LZ (5) ZL为多智能体系统网络图的拉普拉斯矩阵。其中:若系统拓扑结构为无向图,
则系统逐渐收敛到所有智能体初始值的平均值,即a?(1/n)?zi(0)这种协议称为平均一致性协议,该协议在传感器网络信息融合等领域有广泛的应用。 3.2 基于离散时间的一致性协议
基于离散时间的一致性协议如下所示:
zi(k?1)?zi(k?1)??j?Ni(k)? aij(zj(k)?zi(k)) (6)也可用矩阵的方式表示:
Z(k?1)?D(k)Z(k) (7)
其中??0为调整因子,一般取(0,?],0???1;D(k)?I??L(k),I为单位矩阵,D(k)为非负矩阵。
3.3 基于切换拓扑结构的一致性协议
在实际应用当中,多智能体系统的网络拓扑结构时常发生变化,通常将这种时变的拓扑结构称为切换拓扑结构。造成网络拓扑动态变化的原因有很多,比如在车辆编队控制过程中车辆位置发生了变化;在移动机器人进行通讯过程中,由于网络的故障造成信息传递丢失。通常来说,基于切换拓扑结构的一致性协议能够很好地应对拓扑结构动态变化的要求,最后使智能体的状态趋于一致。
网络切换拓扑结构可以用动态图G(s(t))表示,其中s(t)为切换信号,则切换拓扑的一致性协议可表示为:
???L(G(s(t)))Z (8) Z
3.4带时滞一致性协议
智能体之间进行信息传递交换的过程当中,经常会存在信息传递延时所带来的时滞问题。目前,带时滞的一致性协议主要分为三类:a)对称时滞一致性协议,智能体本身接收和发送信息都有固定时滞;b)非对称时滞一致性协议,智能体本身接收信息有固定时滞,发送信息没有时滞;C)时变时滞一致性协议,时滞是随时间动态变化,不是固定的常数。
对称时滞一致性协议为:
?i(t)?zj?Ni(t)?aij(zj(t??)?zi(t??)) (9)
不对称时滞一致性协议为:
zi(t)?j?Ni(t)?aij(zj(t??)?zi(t)) (10)
时变时滞一致性协议为:
?i(t)?zj?Ni(t)?aij(zj(t??ij(t))?zi(t??ij(t))) (11)
其中:?ij(t)为时变时滞,其?ij(t)??ji(t)。
4. 一致性问题的研究应用进展
目前,一致性问题的研究发展迅速,国内外学者研究了一致性问题在具体应用中的性质,取得了一定的成果。在这里简要介绍在蜂涌问题、聚集问题和编队控制中的研究成果。 4.1蜂涌问题
在一个多智能体系统中,所有的智能体最终能够达到速度矢量相等,相互间的距离稳定称为蜂涌问题。蜂涌行为可以认为是群集的一种特殊情况。Reynolds[5]于1987年提出了关于蜂涌运动的基本模型---Boid模型。该模型包含了三条启 发式规则,用于描述单智能体如何依赖群中其他智能体的速度和距离而运动:a)分离性,各成员之间避免碰撞;b)内聚性,各成员朝着一个平均的位置进行聚合;c)排列性,各成员沿着一个平均的方向共同运动,尽量与邻居范围内的群体成员保持速度匹配。
Vicsek等人[6]于1995年从统计力学的角度提出了Vicsek模型,该模型中智
能体的方向是其邻域内智能体方向值的平均值。Jadbabaie等人[7]将Vicsek模型进行了理论证明分析,证明了最近邻法则能够让所有的智能体能最终向相同的方向移动并趋于一致。
Olfati—Saber[8]给出了设计和分析分布式蜂涌协议的理论框架,证明群体的迁移行为可用对等的智能体网络来表示,还给出群的Lyapunov稳定性分析。
Su等人[9]重新研究了在缺少以上两个关键假设情况下多智能体蜂拥的问题。作者对Olfati-Saber的算法进行了改进,实现了对虚拟领航者的渐近跟踪,给出了收敛的速度,所有智能体的中心位置和速度将指数收敛到虚拟领航者的中心位置和速度。 4.2聚集问题
Ando提出了一种用于向单点运动、有限视力的自治移动机器人的聚集的分布式协议。Ando的算法要求所有机器人相互之间能全局通信,这种要求过高,机器人的通信负担也很重。
Lin等[10,11]研究了自治的移动智能体编队时聚集在一点的一致性问题,提出了三种编队协议以及聚集的必要条件,通过分布式控制,使得一群自治的移动智能体获取特定的编队,并聚集到一点。作者还研究了编队过程中碰撞发生、队形进化的问题。
Fang[12]设计了一种新分布式移动协议,使得所有的智能体在局部通信的情况下,在给定的感应范围内聚集。Contem[13]提出了一种新的用于保证聚集的分布式协议充分条件,提出的条件要比之前相关的文献都宽松些,尤其是提出了用于代替连续情况的不连续点的协议所需较为宽松的条件。 4.3编队控制
多平台编队控制是一致性策略应用的典型领域之一,文献[14]设计了编队控制律,用来保持空间飞行器高度一致;文献[15]考虑输入约束情况下,采用了非线性无中心一致性协议研究了无人机编队中高度保持问题。此外,文献[16]采用一致性策略分析了轮式小车追捕问题中的编队稳定性,并且认为该问题可以看作是连续时间系统线性一致性问题的特例。在网络条件下,引入随机通信噪声和信息丢包问题,文献[17]采用一致性策略研究了基于信息交换的多边形编队控制方法。文献[18]给出了分析一致性和编队稳定性的基本框架,并基于此框架解决了
单积分器和广义动力学模型的编队变换问题。
5. 结束语
多智能体系统协调合作控制中的一致性问题研究需要以图论、矩阵论、控制论、人工智能为理论依据,以一致性协议为主要的研究对象,要求一致性协议在满足实时性、鲁棒性的同时又能使系统体现智能性。未来研究的内容可集中在以下几个方面:
(1) 在不对称时变时滞环境下保持收敛和稳定的一致性协议,并能应用到智能群体成员之间共同作用、协调运作的群集运动控制问题中。
(2) 在切换拓扑环境下一致性协议的设计和应用。如在聚集应用中.研究确保智能体系统时时连通的初始网络拓扑结构和对应的一致性协议的设计;以及存在通信异步、通信噪声、障碍物情况下,对应的一致性协议的设计;不对称时变时滞一致性协议的研究;网络存在坏点情况下的一致性协议设计。
(3) 带约束条件和优化目标的多智能体系统一致性理论。目前大部分文献研究的一致性问题都是在无线约束条件下进行的,但是多机器人系统的协调与控制中 ,通常需要考虑如智能体本身的限制条件(如加速度/燃油)和所处环境中的约束条件(如障碍/威胁)等等,并期望多智能体收敛到一个指定/优化的均衡状态,而不是仅仅是达成一致。随着一致性系统理论的进一步成熟,诸如有限时间快速一致算法、满足避碰约束的蜂拥算法等带约束条件和优化目标的多智能体一致性问题将成为研究的热点
参考文献:
[1] SYCRA KP. Multi-agent systems [J].AI Magazine, 1998,19(2):79.92.
[2] JENNINGS N R.SYCARA K, WOOLDRIGE M.A roadmap of agent research and development [J].Autonomous Agents and Multi Agent System, 1998, 1(1):7-38. [3] WOOLDRIDGE M. An introduction to multi agent system [M]. 2nd.[s.1.]:Wiley,2009.
[4] OLFATI-SABER R, MURRAY R M. Consensus problems in net-works of agents with switching topology and time-delays [J].Automatic Control, 2004, 49(2):1520-1532.
[5] REYNOI.DS C. Hocks. Herds and schools: a distributed behavioral model [J].Computer Graphics, 1987, 21(4):25-34.
[6] VICSEK T, CZIROK A, BEN-JACOB E. Novel type of phase transition in a system of self-driven particles [J].Physical Review Letters, 1995, 75(6):1226.1229.
[7] JADBABAIE A, LIN Jie, MORSE A S, Coordination of groups of mobile autonomous agents using nearest neighbor rules [J].Automatic Control,2003.48 (6):988-1001.
[8] OLFATI-SABER R. Flocking for multi-agent dynamic systems algorithms and theory [J].Automatic Control, 2006, 51(3):401-420. [9] SU Hou-sheng, WANG Xiao-fan. LIN Zoug-li.Flocking of multi-agents with a virtual leader[J].Automatic Control,2009,54(2);293-307.
[10] LIN Ji, MORSE AS, ANDERSON B D O. The multi-agent rendezvous problem, part l-the synchronous cage[C].//Proc of the 43rd IEEE Conference on Decision and Contr01. 2004:1926-1931.
[11] LIN Ji, MORSE AS, ANDERSON B DO. The multi-agent rendezvous problem, part 2-the asynchronous case[C]//Proc of the 43rd IEEE Conference on Decision and Contr01.2004:2120.2147.
[12] FANG J, MORSE A S. CAO M. Multi-agent rendezvousing with a finite set of candidate rendezvous points[C]//Proc of American Control Conference.2008:765-770.
[13] CONTE G. The rendezvous problem with discontinuous control policies[J].Automatic Control.2010,55(1);279-283.
[14] Lawton J, Beard R. Synchronized multiple spacecraft rotations[J]. Automatica(S0005-1098), 2002, 38(8):1359-1364.
[15] Bauso D, Giarre L, Pesenti R. Attitude alignment of a team of UAVs under decentralized information structure[C]. // 2003 IEEE Conference on Control Applications. Istanbul, Turkey:IEEE,2003:486-491.
[16] Marshall J, Broucke M, Francis B. A pursuit strategy for wheeled-vehicle formations[C]. // 42nd IEEE Conference on Decision and Control, Maui, USA:IEEE, 2003:2555-2560.
[17] Glavaski S, Chaves M, Day R, Nag P, Williams A, Zhang W. Vehicle networks: Achieving regular formation[C]. // 2003 American Control Conference, Denver,USA:IEEE, 2003:4095-4100.
[18] Gupta V, Hassibi B, Murray R. Stability analysis of stochastically varying formations of dynamic agents[C]. // 42nd IEEE Conference on Decision and Control, Maui, USA:IEEE, 2003:504-509.
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库多智能体系统协调控制一致性问题研究在线全文阅读。
相关推荐: