*波 安 (南洋理工大学计算机科学与工程学院)
摘要: 2017年德州匹克的人机大战是AlphaGo的围棋大战之后最火爆的话题,人类顶尖棋手集体被卡内基梅隆大学Libratus(中文名冷扑大师)系统碾压。Libratus的成功与近几年来最火的深度学习无关,其成功完全归功于大规模博弈计算技术在最近十年来的进展。Libratus系统基于一些关键的技术,包括博弈抽象及逆映射、基于CFR的均衡求解,以及残局求解。过去几年,博弈论在安全领域的资源分配及调度方面的理论——安全博弈论逐渐建立并且在若干领域得到成功应用,包括机场安保、空中警察调度、海岸警卫队巡逻调度、野生动物保护,产生了很大的反响,如美国国会听证数次提到了相关的研究成果及应用。保护关键公共基础设施和目标是各国安全机构面对的一项极具挑战性的任务。有限的安全资源使得安全机构不可能在任何时候都提供全面的安全保护。此外,安全部门的对手可以通过观察来发现安全机构的保护策略的固定模式和弱点,并据此来选择最优的攻击策略。一种降低对手观察侦查能力的方式是随机调度安全部门的保护行为。安全博弈论及其应用的核心问题是如何找出有限安全资源的最优配置方案,以获取最佳的安全保护效率。安全博弈论的成功也归功于大规模博弈问题求解技术的进展。 大规模博弈问题求解面临的挑战包括:大(包括连续)策略空间、不完全信息、序贯博弈、及鲁棒性。报告将讨论大规模博弈计算所面临的挑战、最近几年的在算法设计方面的主要进展、以及在德州匹克和安全领域的重大成功。报告同时将展望未来大规模博弈研究的热点及潜在应用。 报告人简历: 安波是新加坡南洋理工大学计算机科学与工程学院的副教授,于2011年在美国麻省大学Amherst分校获计算机科学博士学位。主要研究领域包括人工智能、多智能体系统、博弈论、及优化。有70余篇论文发表在人工智能领域的国际顶级会议AAMAS、IJCAI、AAAI、ICAPS、KDD以及著名学术期刊JAAMAS、AIJ、ACM/IEEE Transactions。曾获2010年国际智能体及多智能体系统协会(IFAAMAS)杰出博士论文奖、 2011年美国海岸警卫队的卓越运营奖、 2012年国际智能体及多智能体系统年会(AAMAS)最佳应用论文奖、2016年人工智能创新应用会议(IAAI)创新应用论文奖,以及2012年美国运筹学和管理学研究协会(INFORMS)Daniel H. Wagner杰出运筹学应用奖等荣誉。受邀在2017年国际人工智能联合会议(IJCAI)上做Early Career Spotlight talk。 获得2017年微软合作AI挑战赛的冠军。他是Journal of Artificial Intelligence Research (JAIR)编委会成员以及Journal of Autonomous Agents and Multi-agent Systems (JAAMAS)的副主编。受邀担任IJCAI’18顾问委员会成员。当选为国际智能体及多智能体系统协会理事会成员。
Math formula preview: