光华讲坛——社会名流与企业家论坛第6832期
主题:随机控制问题的连续策略与价值迭代及其收敛性
主讲人:美国伍斯特理工学院数学科学系 汪谷副教授
主持人:数学学院院长 马敬堂教授
时间:11月26日16:00-17:00
地点:柳林校区通博楼B412
主办单位:数学学院 科研处
主讲人简介:
汪谷,美国伍斯特理工学院数学科学系副教授,研究方向为随机控制及其在金融领域的应用。于2007年在北京大学取得数学与应用数学学士学位,2013年在波士顿大学取得数学博士学位。在2013年至2015年间,担任密歇根大学博士后助理教授。
内容提要:
本讲座将介绍一种连续策略-价值迭代方法,该方法通过朗之万类型的动力学同时更新随机控制问题的价值函数近似值和最优控制策略。该框架适用于无限时间尺度的熵正则化松弛控制问题以及经典控制问题。