讲座信息

讲座信息

您当前的位置: 首页> 讲座信息
20210722: 基于延迟观测的多臂老虎机的个性化治疗分配
时间:2021-07-19

报告时间:2021年7月22日 上午9:00-10:00

报告地点:明德主楼1016(腾讯会议ID:103 814 326

报告嘉宾:杨宇红

报告主题:基于延迟观测的多臂老虎机的个性化治疗分配


报告摘要

在医学或者其他领域的应用中,多种治疗(广义上)通常用于治疗单个患者(或受试者、客户等)。由于患者的异质性,为特定患者在线确定最佳治疗方案的任务非常具有挑战性。带有协变量的多臂老虎机 (Multi-armed bandits with covariates , MABC),也称为上下文老虎机 (contextual bandits),提供一个框架来设计有效的治疗分配规则,将实验中的学习与过程中对患者的利益最大化相结合。

在本次报告中,我们回顾MABC的基础知识,并提出了基于延迟观测的一种随机(或 epsilon-greedy)非参数策略以实现强相合或极小极大的最佳治疗分配。模拟和真实数据示例验证了所提出的 MABC 方法的性能。

该报告是基于Dan Zhu, Wei Qian 和 Sakshi Arya的工作。


个人简介

杨宇红,1996 年在耶鲁大学获得统计学博士学位。随后加入爱荷华州立大学统计系,2004 年前往明尼苏达大学。他的研究兴趣包括模型选择、多臂老虎机问题、预测、高维数据分析和机器学习。他在多个领域的顶级期刊上发表过文章,包括 Annals of Statistics、JASA、JRSSB、Biometrika、IEEE Transaction on Information Theory、Journal of Econometrics、Proceedings of AMS、Journal of Machine Leaning Research 和 International Journal of Forecasting。他是Institute of Mathematical Statistics的会员,并且曾获美国 NSF CAREER 奖。