学术报告

首页 >> 学术报告 >> 正文

Revised Progressive-Hedging-Algorithm Based Two-layer Solution Scheme for Bayesian Reinforcement Learning

发布日期：2019-09-20 点击：

北航数学论坛

题目: RevisedProgressive-Hedging-Algorithm Based Two-layer Solution Scheme for Bayesian Reinforcement Learning

报告人：李端教授（香港城市大学）

时间： 2019年9月25号 16:30-17:30

地点：北航沙河校区国家实验室二期E405

摘要: Stochastic control with both inherent random system noise and lack of knowledge on system parameter constitutes a fundamental challenge in reinforcement learning , especially under non-episodic setting. We propose a novel two-layer solution scheme to separate reducible system uncertainly from irreducible one at two layer (adopting time-composition based progressive hedging algorithm at the upper layer) and to approximate the optimal policy directly selection will be discussed.

报告人简介: 李端，现为香港城市大学运筹学讲座教授，协理学务副校长（策略筹划）与新成立的数据科学学院的署理院长。李端教授出生于上海，1977年本科毕业于上海复旦大学物理系，1982年获得香港交通大学自动控制硕士学位，1987年获得美国凯斯西储大学系统工程博士学位。1987到1994年在美国弗吉尼亚大学任系统工程学系副教授和工程系统风险管理中心副主任。1994年底加盟香港中文大学，任系统工程与工程管理学系禤永明冠名讲座教授，香港中文大学金融工程中心主任及香港中文大学（深圳）金融工程硕士课程主任。2003年至2012年，担任香港中文大学系统工程与工程管理学系系主任。2017年12 月加盟香港城市大学。

李端教授是国际运筹优化、金融工程领域的知名学者，主持美国自然科学基金、香港研究基金、和中国国家自然科学基金等多项研究课题。他研究兴趣广泛，在最优化理论、最优化控制理论、金融工程及运筹学等领域贡献良多，有不少开创性的工作。特别是他开创了动态均值-风险投资组合的研究框架，引领及贡献了这个领域的发展。李端教授在国际期刊上发表论文超过200篇，其中包括众多国际顶尖期刊。并且，他担任许多国际一流杂志的编委或特刊主编，现担任中国运筹学会杂志副主编。李端教授曾担任中国数学规划协会副理事长，中国系统工程学会金融系统工程专业委员会副理事长，及中国科学院国家数学与交叉科学中心数学与经济金融交叉研究学部学术委员会委员。李端教授是2020年在香港举行的第十一届World Congress of Bachelier Finance Society大会的组委会共同主席。

邀请人：夏勇

上一篇：【北航数学论坛】Reduced order models

下一篇：【学术报告】几种高性能数值方法及其应用研究

首页

学院概况

师资队伍

人才培养

学科建设

科学研究

招生信息

党风廉政

学生园地

下载中心

校友之家

学术报告

Revised Progressive-Hedging-Algorithm Based Two-layer Solution Scheme for Bayesian Reinforcement Learning

快速链接

请升级浏览器版本

Chrome

Firefox

Opera

Edge

学术报告

Revised Progressive-Hedging-Algorithm Based Two-layer Solution Scheme for Bayesian Reinforcement Learning

快速链接