*庆来 魏 (中国科学院自动化研究所)
摘要: 自适应动态规划(Adaptive Dynamic Programming, ADP)由美国学者P. J. Werbos首次提出,自适应动态规划以最优性原理为基础,融合人工智能的先进方法,是解决大规模复杂非线性系统智能优化控制问题的方法。自适应动态规划基于增强式学习原理,采用非线性函数拟合方法逼近动态规划的性能指标,模拟人通过环境反馈进行学习的思路,有效地解决了动态规划“维数灾”的难题,近年来被认为是一种非常接近人脑智能的学习控制方法。报告主要介绍自适应动态规划的一些研究进展,重点描述基于局部数据迭代自适应动态规划的自学习最优控制方法与求解过程。该报告主要分三个部分进行介绍。在第一部分中,报告主要介绍了自适应动态规划的基本知识与原理。报告首先介绍了自适应动态规划的基本原理,描述了迭代自适应动态规划的基本思想与迭代策略。其次,描述了传统迭代自适应动态规划–值迭代自适应动态规划的基本迭代过程,介绍了自适应动态规划的迭代思想。然后,给出传统值迭代自适应动态规划的仿真结果。在第二部分中,主要介绍了全局迭代自适应动态规划的基本原理。首先,描述了全局迭代自适应动态规划的迭代思想与迭代过程,列举出全局迭代自适应动态规划与传统值迭代自适应动态规划的区别。进一步给出全局迭代自适应动态规划方法的性能分析并列举仿真结果。第三部分是本报告的重点,描述了局部数据条件下的迭代自适应动态规划方法。首先介绍了局部数据条件下迭代自适应动态规划的过程与思想。其次,给出了局部迭代自适应动态规划的性能分析,给出了局部条件下的收敛性与最优性分析方案,证明了在局部数据条件下,迭代自适应动态规划方法仍然可以获得最优的性能指标函数。最后,给出几个例子进行分析和比较,验证了方法的有效性。 报告人简历: 魏庆来,中国科学院自动化研究所研究员。主要从事自学习控制,自适应动态规划,智能控制,最优控制,智能电网及其工业应用研究工作。目前在国内外主流学术期刊和高水平国际会议上发表/录用论文120余篇,SCI论文71篇,出版专著3部,撰写图书章节2章。发表论文被引用3075次 (Google Scholar),H指数31。主持基金课题12项,包括国家自然科学基金3项,省部级基金3项,市级人才计划基金1项,国家重点实验室优秀人才基金1项,横向项目2项。授权专利15项,软件著作权登记17项。获得2017年国家自然科学基金优秀青年基金,2017年中国自动化学会杨嘉墀科技奖,2017年中国自动化学会青年科学家奖,2016年亚太神经网络学会青年学者奖,2015年张嗣瀛优秀青年论文奖,2015年北京市科学技术奖,2015年德国纽伦堡发明展金奖,2014年江苏省双创人才奖,2011年自动化学报优秀论文奖等9项奖励。共担任10本国内外相关领域期刊编委,主要包括IEEE Transactions on Automation Science and Engineering, IEEE Transactions on Consumer Electronics, IEEE Transactions on Cognitive and Developmental Systems, IEEE Transactions on Systems, Man, and Cybernetics: Systems, Information Sciences, Neurocomputing, Optimal Control Applications and Methods,《自动化学报》,《控制工程》等。曾担任IEEE Transactions on Neural Networks and Learning Systems编委。担任2本SCI期刊客座编委,包括Neurocomputing以及Neural Computing & Applications。担任IEEE CIS Beijing Chapter, Secretary。在ISNN2017,ICONIP 2017,WCICA 2016,WCCI2014等13项国际相关领域学术会议上担任重要职务,现任中国科学院大学岗位教授,讲述《最优控制》、《自适应动态规划原理与实践》等课程。
Math formula preview: