微波EDA网,见证研发工程师的成长!
首页 > 应用设计 > 汽车电子 > 多Agent在城市交通系统中的应用

多Agent在城市交通系统中的应用

时间:09-25 来源:3721RD 点击:

1 引言

Agent 是运行于动态环境中的具有较高自制能力的实体,具有自主性、分布性、协调性和一定学习、推理能力。多智能体系统通过Agent 间的通讯、合作、协调和控制表达系统功能及行为特性。城市交通系统是自然的、分布的、复杂的、动态的、规模庞大的系统,采用多Agent 技术建模城市交通系统可为交通决策者和使用者提供良好的解决方案。从二十世纪80 年代末,就有学者将多Agent 技术引入到城市交通系统的建模中,利用其协作、存储、智能性和自治性为使用者提供在线决策支持、实时交通控制,或利用其对客观世界的准确描述进行交通系统运行仿真,发现交通系统中的问题、规律或验证新的理论和算法。本文从ITS 框架中的先进的交通管理系统(ATMS)、先进的出行者信息系统(ATIS)、先进的公交系统(APTS)三个方面对Agent 技术在城市交通系统中的应用现状展开论述,最后指出多Agent 技术在城市交通系统的应用中需解决的问题以及发展趋势。

  2 多Agent在ATMS中的应用

在ATMS 中,多Agent 技术主要用于提供实时的决策支持并进行适当的管理控制。根据Agent 慎思型和反应型两种模型结构,建构基于Agent 的城市交通管理系统也有两种思路:分层递阶式和完全分布式。

2.1 分层递阶式结构

分层递阶式结构的每一级都由功能、结构类似的Agent 组成,同级Agent 间可相互协调,上级Agent可作为对应下级Agent 的协调单元,下级Agent 向所属上级Agent 传输局部系统环境和系统控制的反馈信息,为上级Agent 提供决策依据。最早的分层递阶式系统就是KITS 和TRYS.

KITS 产生于在1992-1994 年间,将交通领域知识分解成与路网拓扑结构相匹配的单元集合,提供专门的推理机制进行交通决策和管理。如图1 所示,底层的Agent 通过协作完成交通监控和管理任务,Actor 是直接和问题区域对应的交通评价和管理单元,Supervisor 负责全局路况分析、解释以及合成全局行动方案。KITS 的成功表明:基于知识的模型可以和多Agent 技术相集合来提高城市交通系统的监控和管理能力。
\
图 1 KITS 架构图

  TRYS 是在1991-1994 年间建立的实时自适应的交通管理决策系统。如图2 所示,TRYS 的结构与KITS 相似,通过Agent 访问实时采集的路况数据,并由Agent 内部的知识库和推理引擎对数据进行分析处理,coordinator 负责协调各Agent的工作以形成全局解决方案。与KITS 不同的是,TRYS 中的问题区域由独立的、功能强大的Agent负责监督。
\
图 2 TRYS 架构图。

翟高寿和Choy根据递阶控制结构理论及城市交通系统的结构特征,提出了四层的分层递阶式结构,分别是:决策层(城市交通控制决策系统)、战略控制层(若干区域协调控制系统)、战术控制层(若干路口控制系统)、执行层(检测器、信号控制器和信号灯等)。

该结构的协调控制策略在TRYS 基础上进一步下放到了路口级,建立了路口Agent,每个路口成了一个智能的知识系统,可及时根据路口交通状况进行控制策略的实时部署与调整,更好地适应了交通系统动态性、实时性强的特点,对突发性交通流的变化有很好的适应和调节能力。

2.2 完全分布式结构

在完全分布式结构的系统中,Agent 凭借自身的知识和智能与相邻区域Agent 协调共同完成路口的管制。最初的应用就是西班牙的TRYSA2 系统,如图3 所示。TRYSA2 Agent 有一个控制计划集,每个计划都被赋予了能够减轻交通压力的效用值。系统可通过评估相关Agent 的计划效用值合成系统最优的解决方案。Oliveira 、承向军、杨兆升等学者也先后提出了以路口Agent 为基本控制单元的完全分布式控制结构,系统中的Agent 都具备了一定的存储、匹配和智能计算功能,可依靠良好的协调算法实现多Agent 之间的协调与合作以达到整体优化和控制的目的。
\
图 3 TRYSA2 架构图。

2.3 两种架构的性能比较

分层递阶式充分体现了集中和分散控制的有机结合,考虑到了全局利益,可使协调有目的地进行,但是区域Agent 和主控Agent 的实现稍显复杂。完全分布式具有反应快速、灵活性强等特点,可充分发挥Agent 的自治性、协调性,但由于Agent 自身能力有限、系统的知识又过于分散,解决全局问题的能力略显不足,Agent 间的协调机制会对系统性能产生较大影响。在扩展性上,完全分布式只需把新Agent 注册到其他Agent 中并修改相应的方案和知识库即可将新Agent 扩充到当前的Agent 群体中,而分层递阶式需要整合区域控制中心和主控中心,重新赋予各Agent优先权关系。在协作复杂度上,分层递阶式从每一个Agent 控制方案中选择一个本地最优的方案,完全分布式在所有的Agent 中通过搜索策略来查找最佳方案,因此后者工作量较大。

2.4 多Agent 的协调控制与优化

多Agent 通过协调实现系统的分布式并行运行,提高任务的执行效率。在基于多Agent 的ATMS 中,有三种协调方式:①建立专门的协调Agent;②将协调行为分散至各Agent 中,由Agent 自主地完成;③集中与分布相结合的方法,Agent 自身即可以完成某些协调行为,又可以接受高层Agent 制定的规划。当前常用的协调方法有黑板模型、博弈模型、协调器、交换意见等。

黑板模型信息传输量大,对信息传输的稳定性也有一定的要求,适用于简单的分布式多路口控制。博弈论模型适用于分层递阶结构的上下级Agent 间和完全分布结构的同级Agent 间的协调,但由于重复博弈过程中需要进行复杂的均衡点收敛控制,所以基于交通信息博弈的计算量较大。协调器可基于一定的目标将同级和下级Agent 产生的提案合成全局的提案。协调器降低了系统的通信量和其他Agent 的实现复杂度,但却增加了协调器Agent 自身的设计复杂度和计算量。交换意见法对系统通信的稳定性有很大的要求,当单个Agent 节点出现通信故障时,系统将无法正常工作。

从上述几种方法的分析中可以看到,协调过程需要传输大量数据,因此容易造成传输网络的拥塞。目前,很多学者都采用强化学习的方法来优化本地的交通信息。强化学习方法是以环境提供的加强信号作为性能评价的反馈,完成从状态到行为的映射的学习,特别适合处理不断变化的路网环境。Baher、欧海涛等都基于强化学习研究了实时自适应的交通信号控制,减少路口节点间的大量通讯需求,增强了决策的可靠性。

2.5 相关应用研究

Ronald通过将分离独立的交通设施建模成能互相协作的Agent,研究了动态交通管理设备互相协作的可能性。Filippo实现了一种基于多Agent 架构的交通管理系统CARTESIUS,在分析偶发性阻塞和在线制定集成控制方案过程中展示了良好的协作推理和解决冲突的能力,可为交通管理人员协调多区域间的快车道和地面街道的路网阻塞提供实时决策支持。

Bo Chen等人将移动Agent 技术融入到交通管理系统中,增强了处理不确定事件和环境动态变化的能力,提出了一种基于柔性Agent 的实时交通检测和管理系统。

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top